如果說2012年是大數據概念為人所知、引人矚目、小試牛刀的一年,那么2013年大數據將會實現產品部署,早期投資獲得回報,一小部分的產業被顛覆。到了2014年,各種大數據項目和系統很可能成為標準配置,到處可見。
今年,大數據和云計算一起作為科技術語出現。大數據意味著非常多的事情,但是被援引的次數太多了,幾乎失去了其本來的定義。大數據的定義通常和速率(數據移動得快),體積(數據規模龐大),和種類(非結構化和結構化的信息)三點有關。
大數據真的如人們所描述的那樣嗎?是的。對我來說,大數據代表了科技和商業的一致——也就是首席信息官們始終追求的圣杯(Holy Grail)——成為了一件順理成章的事情。大數據項目從本質上來說和營收、風險利潤是相關的。換句話說,信息科技和商業世界情不自禁地聯合了起來。
顯然我們正處在一個追捧大數據的階段,我認為可以和1990年代末的Linux和2000年代初的開源軟件運動相提并論。那時候Linux正要開始改變世界,和微軟等廠商一較高下。從許多方面來說,Linux和開源軟件(比如安卓)的確改變了一切。但是在行業變革的過程中發生了一個有趣的事情——開放軟件成了每一個數據中心的標準配置,如今已經被認為是理所應當了。這場變革發生了,我們僅僅是不再談論它而已。云計算也是一樣。
大數據會遵循同樣的發展路線。當然,會創造數百萬個工作機會,相關人才也會變得有一點搶手。公司們也會用大數據升級各自的行業。隨著Cloudera這樣的創業公司成為新的紅帽子(Red Hats),各家廠商的市場座次也逐漸明朗。
如下是我對大數據未來幾年的展望。
2013年:2012年的試驗項目成品化,每一個行業的垂直領域都會有一個成功的大數據案例。
2014年:在2013年成功經驗和客戶研究案例的基礎上,一些行動快速的市場跟隨者將進入大數據領域。各個行業都將遵循大數據的游戲規則。初期的回報看上去會很不錯。公司的主要關注點在內部數據上,因為有很多東西可以挖掘。外部數據也很有用,但是這段時期不會有什么新進展。
2015年:在制定大數據計劃時,公司們開始將目光投向外部數據。在2015年之前,消費者所面對的公司都在花費大部分時間用于研究外部信息。每一個分析師和數據倉庫都將會有一個Hadoop計算簇和一個大數據層。像Hadoop這樣的技術不再受人關注,因為這些技術始終非常重要,慢慢淡化進入軟件棧。圍繞大數據題材的整合并購開始加速。
2016年:數據驅動的決策代替了直覺和常識。這個時候公司們要開始仔細思考數據的使用,避免出現無意義的數據。公司會因為錯誤解讀了數據而導致重大事故的發生。
2017年:云和大數據、數據倉庫合并起來,成為了一項服務,“分析即服務”和“數據即服務”成為主流。很少有公司真正考慮創建自己的Hadoop計算簇進行整合工作。大數據基礎設施即將實現。注意:2017年是這些大數據即服務為大眾所普及的一個估算時間。大數據即服務的市場競爭在這個時間段正在進行,將會于不久涉及到關鍵的大范圍用戶群。
大數據在IT采購周期上又是怎樣的情況呢?大數據項目需要有更多高級別的管理人員。分析如下:
首席信息官:大數據項目終于能讓首席信息官解決一直以來的“我們一致嗎?”問題。 首席財務官:將大數據分析作為控制成本、最大化利潤的方式。潛在風險是公司有可能因為忽略人的因素而失去好的機會。
首席市場官:2012年,首席市場官成了IT采購的紅人。不過這有點不太合理,因為首席市場官主要依賴外部數據和信號判斷項目。
首席運營官,采購人員:大數據可以讓存貨、供應和制造過程自始至終都可以進行追蹤。效率能夠得到改進。
數據科學家:這部分員工越來越被看作是“首席”管理層的接班人。職場方面,數據高手想去哪家公司都行。
據證券時報網快訊中心綜合媒體報道,在工信部發布的物聯網“十二五”規劃上,把信息處理技術作為4項關鍵技術創新工程之一被提出來,其中包括了海量數據存儲、數據挖掘、圖像視頻智能分析,這都是大數據的重要組成部分。而另外3項信息感知技術、信息傳輸技術、信息安全技術,也與“大數據”密切相關。