《企業網D1Net》4月4日訊
近年來,大數據時代的到來,引起人們廣泛關注,隨著大數據在各行各業應用逐漸深入,人們對大數據的關注也正在升溫,而近階段又有著明顯的過熱跡象。從央視的春運遷徙圖到姚晨看到微博數據的驚呼;從兩會期間的兩會大數據,到《星星》都叫獸的高低領毛衣,“大數據”被人們推到了一個前所未有的高度,同時也從一個高精尖的科研方向變成了一個世人皆知的營銷詞匯。
大數據不是萬能的
大數據顯然不是萬能的。正因為如此,她才真實。大數據在有些領域由于種種原因,所帶來的價值并不如預期的那么高。導致這種現象最主要的問題有兩個,一個是由于數據本身的質量或者數量不夠;另一個是算法不合適。
不要以為是海量數據就一定會有價值,在過往的工作中,我們經常發現來自甲方的數據源有80-90%的數據都是無用的。只有10%-20%的數據才會產生一定的價值。這就又讓我想到一個比喻,“大數據的工作就像在一堆稻草中尋找一根針”。
何況,大多數領域本身業務屬于早期,所擁有的數據非常貧乏。冷啟動、稀疏性是大數據在諸多領域面臨的挑戰。
另一方面,對于不同領域,不同項目,沒有放之四海而皆準的算法,必須要根據具體問題具體分析解決。在實際的工作中發現,不只是不同的領域(如文章推薦與商品推薦),甚至同一領域的不同單元(同屬電商但不同類電商,如母嬰類和服裝類或者奢侈品類)也有所不同。
數據的交叉利用
上面提到的兩個大數據在實際應用中面臨的最大問題,即冷啟動時數據的匱乏和業務早期數據的稀疏性問題,并不是無藥可救。業界一直討論的數據打通,就是解決這兩問題的出路。
對于一些新興領域,缺乏數據是必然的,而另一方面,正由于缺乏數據的支持,所以才更需要有強大決策支持的系統對其業務做指導和支撐,以實現少走彎路,利益最大化的目的。
移動互聯網領域的項目,尤為代表。雖然在過去的兩三年里,移動互聯網得到了高速的發展,但畢竟在各個方面的積累,都無法與互聯網相比。尤其在人們形成穩定的使用習慣之前,數據還不具備更多的價值和意義。
但如果能把互聯網的數據與移動互聯網數據打通,那么我們就掌握了這個人的喜好等多方面信息,從而為移動互聯網業務做出更有效的指導和幫助。
當然,數據的打通絕不僅限于互聯網和移動互聯網。每個數據源的數據往往刻畫了一個人的不同方面。正如巴拉巴西教授在《爆發》一書中描繪的那樣,如果數據充分,人類93%的行為是可以預知的,是有規律的。
也只有將這些不同來源的數據重新組織,才能挖掘出更有意義的信息。
如今,行業內不少人打著“數據統計和分析”的旗號來做大數據,讓很多外行人陷入了誤區:數據統計并非等于大數據。無論數據統計也好,大數據也罷,其實都是為了使我們的工作變得更為有效,讓決策更為理性而準確。重視數據,本身就是一個企業成熟的標志。
移動互聯網的迅速崛起,讓數據變得更為多樣、豐富。它的移動性,它的碎片化,它的私密性和隨時性都剛好彌補了用戶離開桌面電腦之后的數據,從而與原有的互聯網數據一起很好滴勾勒出一個網民一天的生活,日常生活的數據化。
D1Net評論:
隨著大數據應用的深入,人們對大數據了解也更加全面,也逐漸認識到一個真理:大數據并不是萬能的,與此同時,隨著數據的進一步豐富和完善,隨著不同渠道數據的打通和交叉利用,有關大數據的想象一定會更加廣闊,大數據的想象空間更加廣袤無垠。