許多公司已經在積極使用大數據,只是它們沒有稱之為大數據罷了。雖然“大數據”一詞有諸多爭議,可是這項技術還是變得對公司業務來說必不可少。
據Dresner咨詢服務公司的一項新調查顯示,結果發現,沒有人知道大數據到底是啥東西;大概同樣數量的公司實際上在用大數據處理有意義的任務。
是不是覺得很吃驚?
你應該不會吃驚。畢竟,盡管多年前就有人預言大數據,可是大多數公司仍在努力將小數據充分利用起來。
這倒不是說大數據并不是很重要,也不是說如今許多公司沒有從數據中獲得重大價值。大數據很重要,許多公司也在從數據切實獲得好處。但是,想從大數據獲得價值,許多公司首先要變得務實。
誰需要大數據?
正如Datamation雜志的詹姆斯·馬奎爾(James Maguire)所寫,Dresner咨詢服務公司并沒有看到大數據大范圍采用的現象。
只有17%的公司承認如今在使用大數據,另有47%推遲到未來使用,但何時使用還不確定。如此看來,難怪報告的作者得出結論:“盡管經過了長期的造聲勢和炒作,可是眼下,大數據分析技術的實際部署還是無法廣泛適用于大多數企業組織。”
大數據,啥也不是?
答案是否定的。畢竟,報告的調查對象中59%又聲稱,大數據“至關重要”,盡管明顯沒有用大數據來處理任何任務。顯然這里有某個因素在作祟……
我認為,這“某個因素”完全是確定性的。
你不斷使用那個詞……
早在2012年,NewVantage Partners就顛覆了公眾對于大數據中的“大”的實際含義的認識。盡管媒體大肆報道PB級數據問題,幕后推手基本上是Hadoop及其生態系統的廠商,但事實上,大多數公司并不存在所謂的PB級數據問題。
正如這項調查所發現的那樣,大多數公司面臨的主要問題還是數據的種類和速度。
市場終于開始心領神會,將越來越多的資金投入到可以更輕松地管理不同類型數據的技術(比如MongoDB等NoSQL數據庫和DataStax版本的Cassandra),以及處理流數據的技術(比如Apache Spark)。
與此同時,企業繼續求助于更傳統的數據基礎設施,比如甲骨文數據基礎設施。正如DB-Engines在2015年年底盤點中發現的那樣,就總的人氣而言,甲骨文是去年提升幅度最大的廠商(從發布崗位、技術論壇提及率和谷歌搜索等方面來衡量)。
超過風頭甚勁的NoSQL,超過云優先的亞馬遜,超過其他任何廠商或技術。
當然,甲骨文的這種人氣抬升一方面與大數據毫無關系,而是緣于管理整齊的行列數據。但是從NewVantage Partners的調查數據來看,這種比較“小”的數據仍是大多數大數據分析技術的處理對象。
另外拋開這種結構化數據,我懷疑許多公司仍沒有認為多種多樣、高速度的數據是“大數據”。這可能是很少有公司聲稱在用大數據處理許多任務的一個原因。正如MySQL數據庫工程師賈斯汀·斯旺哈特(Justin Swanhart)所說:“大數據毫無意義。你還不如問別人他們想要什么顏色的數據庫。”
簡而言之,大數據活蹦亂跳,但是許多公司未必認為它是“大數據”。
那又如何?
對于正在想自己是不是被大數據甩在后頭的企業來說,現在別再瞎擔心了。正如Gartner的分析師尼克·霍德克(Nick Heudecker)所說,“大數據”已遷移到更熟悉的類別:
先進分析和數據科學
商業智能和分析
企業信息管理
內存中計算技術
信息基礎設施
大多數企業已經在搞充分利用大數據的項目,它們只是根本沒有稱之為大數據。即使如此,還是有大量工作要做。正如麻省理工學院斯隆學院數字商業中心的研究員邁克爾·施拉格(Michael Schrage)所說:
“預測分析最深遠的影響不是來自從數量上改進預測的質量,而是來自從根本上改變企業組織考慮問題和機會的角度。”
換句話說,許多公司可能已經擁有將大數據充分利用起來的必要技術。它們缺少的是,渴望從根本上改變將那些數據充分利用起來的方式。有一群分析員解讀數據是一回事,利用那些分析結果、促動公司業務的實時變化是另一回事。
這不是你從某家廠商所能買到的那種東西。它一定需要在企業的DNA內部發生變化。既要更準確地了解大數據,又要用大數據切實處理一些任務,企業確實面臨艱巨的任務。
原文標題: Big data's big problem? Most companies don't realize they're already using it