9月30日編譯
著名博客網站Readwrite今日刊登分析文章稱,雖然大數據現在被炒得火熱,但是大多數投資了該領域的公司還沒有獲得合理的回報,甚至連正回報都還沒有看到。文章內容如下:
隨著投資的進行,大數據目前的表現嚴重低于市場預期。在媒體的煽動下,很多企業在還沒有完全了解到如何從大數據中挖掘價值之前就一頭扎進了這個市場。據最新分析報告顯示,大部分企業從大數據中獲得的價值遠遠低于它們的預期目標,甚至連投資都無法收回。
每投資到大數據上一美元才獲得數美分收益
那么,那些企業獲得的收益到底有多低呢?據Wikibon研究表明,它們獲得的收益不是很低,而是相當地低。
Wikibon研究發現,46%的大數據投資者只能勉強維持著它們的投資項目,甚至有2%的企業完全失敗了,所有投資盡付東流。
然而,這并不是說大數據就是騙人的玩意兒,失敗是注定的。情況并不是這樣。
正如Wikibon指出的那樣,那些企業的大數據項目之所以獲敗,其中一個最大的原因是它們在投資大數據技術比如Hadoop時,缺乏具體且可測量的相關商業應用。它們聽說某個項目與大數據有關,便直接投錢進去,實際上它們根本不知道它們期望的目標是什么。市場研究公司Gartner通過分析也得出了相同的結論。
擁有了Hadoop,卻丟了數據
對于很多企業來說,大數據就等同于Hadoop,IT業界的一位高管稱之為“無監督的數字垃圾堆埋場”。Criteo的工程技術副總裁朱利安西蒙(Julien Simon)說:“那些大數據大則大矣,但卻無數據可言。”
我們將那些數據保存起來,但卻不知道我們為何需要它們,最后搜集到的數據就變成了我們整個數據庫中的一些晦澀難懂的不和諧信號。正如著名的統計學家內特希爾(Nate Silver)所說:
“如果這個世界上的信息量正以每天2.5萬億字節的速度遞增,有用信息的數量肯定達不到這個速度。大多數增加的信息都只是垃圾信息,而且它們的增長速度比有用信息的增長速度還要快。有太多的假設需要驗證,因此很多信息都是無用的,這是一個相對穩定的客觀真理。”
換句話說,增加更多的數據并不能夠解決大數據的問題。通常情況下,它反而是引發問題的原因,而且也是很多企業無法從大數據投資中獲得顯著價值的其中一個很重要的原因。
大數據的成功是什么樣的?
據Wikibon的研究表明,最好的大數據項目通常不是由IT行業發起的,而是由業務線部門主導推動的,比如說營銷部門;而且那些大數據項目關注的大多數小應用而不是戰略性方案。“他們充分利用內部專業知識,很清楚自己能夠利用手中現有的資源干些什么事兒。”
這類項目一開始的時候通常規模都比較小,取得了初步成果之后才會逐步擴大規模。
為了避免盲目投資到大數據項目上,我們建議你們也這么做。由于所有最好的大數據技術都是開源的,因此你在投入真金白銀之前,可以先嘗試一下,然后盡快找到最適合你自己的大數據技術。