編者按:在當前這個大數據時代,海量數據噴薄而出,公司不再面臨缺乏數據的窘境,但是如何有效利用這些海量數據,抓住數據背后的商業價值是每個公司應該不斷思考的課題。本文作者法國大數據分析服務初創公司 Dataiku 的 Florian Douetteau 就該問題分享了他的一些見解。
對于當今的企業來說,他們可以從各種各樣的渠道中搜集海量數據,從播客到交易數據,物聯網以及其中的所有渠道,我相信今天這個時代,不會再有哪個公司說他們面臨數據問題。
但是,我認為很多公司,無論他們愿不愿意承認,都有著數據價值的問題,也就是說,他們不太能從搜集的數據或者所有的數據中獲取真正的商業價值。
一開始,以數據發家的科技公司(如四大互聯網巨頭GAFA——Google,Apple,Facebook以及Amazon)本質上通過利用先進的機器學習技術,解決一些重要問題(如何使廣告相關、推薦效應等),從而從數據中創造價值。他們的問題在技術上是相當有挑戰性的,但是解決這些問題的方法相當簡單:雇用50名博士和才華橫溢的工程師,成功不是問題。
相反,傳統企業的成功之路會相對復雜一些,他們得將現有產品和服務一步步轉型優化,其業務問題不僅在技術上難,解決起來也難。因此,這些公司組織需要采用更為系統的方法,以提高生產率,就像工廠提高生產率使用的方法一樣。
1. 確立再利用的方法。這是指建立流程,使得數據和實驗結果能夠在項目和項目之間共享。在一個傳統公司中,80%的數據項目都是從頭開始,試圖控制正在發生的狀況,這是因為數據再利用需要記錄以及規矩。但是,沒為題,你可以做到的。
2. 多方共同研究數據項目。這是當然是指數據科學家,但同樣包括分析人員和商業人士。數據科學(以及影響商業的見解)并非發生在真空中。正如商界人士不太知道如何利用硬核數據,研究硬核數據的科學家同樣不會接觸業務,所以合作是關鍵。
3. 能有方式進行大規模生產。還是之前提到的,數據科學不會發生在真空中。數據團隊要能夠將他們的研究推進到世界中去,而不是閉門造車,無實際用途。能夠快速且無縫做到這一點的公司,必定能將數據背后的價值大規模推廣開來。
毫無疑問,海量數據仍會噴薄而出,而那些意識到數據背后價值的一方終會站到食物鏈的頂端。
編譯組出品。編輯:郝鵬程