佛瑞斯特研究公司(Forrester)的研究人員發現,2016年,近40%的公司正在實施和擴展大數據技術應用,另有30%的公司計劃在未來12個月內采用大數據技術。2016年NewVantage Partners的大數據管理調查發現,62.5%的公司現在至少有一個大數據項目投入生產,只有5.4%的公司沒有大數據應用計劃,或者是沒有正在進行的大數據項目。
研究人員稱,會有越來越多的公司加速采用大數據技術。互聯網數據中心(IDC)預測,到2020年大數據和分析技術市場,將從今年的1301億美元增加至2030億美元。“公司對數據可用性要求的提高,新一代技術的出現與發展,以及數據驅動決策帶來的文化轉變,都繼續刺激著市場對大數據和分析技術服務的需求”, IDC副總裁Dan Vesset表示。 “2015年該市場全球收入為1,220億美元,預計到2016年,這一數字將增長11.3%,并預計在2020年以11.7%的復合年增長率(CAGR)繼續增長。
”編者注:CAGR并不等于現實生活中GR(Growth Rate)的數值。它的目的是描述一個投資回報率轉變成一個較穩定的投資回報所得到的預想值。我們可以認為CAGR平滑了回報曲線,不會為短期回報的劇變而迷失。
雖然大數據市場將會繼續增長這一點毋庸置疑,但企業應該如何應用大數據呢?目前還沒有一個清楚的答案。新的大數據技術正在進入市場,而一些舊技術的使用還在繼續增長。本文涵蓋大數據未來發展的十大趨勢,這些趨勢可能對2017年及以后的大數據市場產生極大影響。
大數據發展趨勢
專家預計,機器學習、預測分析、物聯網和邊緣計算將對2017年及以后的大數據項目產生深遠影響。
1、開放源碼
Apache Hadoop、Spark等開源應用程序已經在大數據領域占據了主導地位。一項調查發現,預計到今年年底,近60%企業的Hadoop集群將投入生產。佛瑞斯特的研究顯示,Hadoop的使用率正以每年32.9%的速度增長。
專家表示,2017年許多企業將繼續擴大他們的Hadoop和NoSQL技術應用,并尋找方法來提高處理大數據的速度。
2、內存技術
很多公司正試圖加速大數據處理過程,它們采用的一項技術就是內存技術。在傳統數據庫中,數據存儲在配備有硬盤驅動器或固態驅動器(SSD)的存儲系統中。而現代內存技術將數據存儲在RAM中,這樣大大提高了數據存儲的速度。佛瑞斯特研究的報告中預測,內存數據架構每年將增長29.2%。
目前,有很多企業提供內存數據庫技術,最著名的有SAP、IBM和Pivotal。
3、機器學習
隨著大數據分析能力的不斷提高,很多企業開始投資機器學習(ML)。機器學習是人工智能的一項分支,允許計算機在沒有明確編碼的情況下學習新事物。換句話說,就是分析大數據以得出結論。
高德納咨詢公司(Gartner)稱,機器學習是2017年十大戰略技術趨勢之一。它指出,當今最先進的機器學習和人工智能系統正在超越傳統的基于規則的算法,創建出能夠理解、學習、預測、適應,甚至可以自主操作的系統。
4、預測分析
預測分析與機器學習密切相關,事實上ML系統通常為預測分析軟件提供動力。在早期大數據分析中,企業通過審查他們的數據來發現過去發生了什么,后來他們開始使用分析工具來調查這些事情發生的原因。預測分析則更進一步,使用大數據分析預測未來會發生什么。 普華永道(PwC)2016年調查顯示,目前僅為29%的公司使用預測分析技術,這個數量并不多。同時,許多供應商最近都推出了預測分析工具。隨著企業越來越意識到預測分析工具的強大功能,這一數字在未來幾年可能會出現激增。
5、智能app
企業使用機器學習和AI技術的另一種方式是創建智能應用程序。這些應用程序采用大數據分析技術來分析用戶過往的行為,為用戶提供個性化的服務。推薦引擎就是一個大家非常熟悉的例子。
在2017年十大戰略技術趨勢列表中,高德納公司把智能應用列在了第二位。高德納公司副總裁大衛·希爾里(David Cearley)說:“未來10年,幾乎每個app,每個應用程序和服務都將一定程度上應用AI。
6、智能安保
許多企業也將大數據分析納入安全戰略。企業的安全日志數據提供了以往未遂的網絡攻擊信息,企業可以利用這些數據來預測并防止未來可能發生的攻擊,以減少攻擊造成的損失。一些公司正將其安全信息和事件管理軟件(SIEM)與大數據平臺(如Hadoop)結合起來。還有一些公司選擇向能夠提供大數據分析能力產品的公司求助。
7、物聯網
物聯網也可能對大數據產生相當大的影響。根據IDC 2016年9月的報告,“31.4%的受訪公司推出了物聯網解決方案,另有43%希望在未來12個月內部署物聯網解決方案。”
隨著這些新設備和應用程序上線,許多公司需要新的技術和系統,才能夠處理和感知來自物聯網的大量數據。
8、邊緣計算
邊緣計算是一種可以幫助公司處理物聯網大數據的新技術。在邊緣計算中,大數據分析非常接近物聯網設備和傳感器,而不是數據中心或云。對于企業來說,這種方式的優點顯而易見。因為在網絡上流動的數據較少,可以提高網絡性能并節省云計算成本。它還允許公司刪除過期的和無價值的物聯網數據,從而降低存儲和基礎架構成本。邊緣計算還可以加快分析過程,使決策者能夠更快地洞察情況并采取行動。
9、高薪職業
對于IT工作者來說,大數據的發展意味著大數據技能人才的高需求。IDC稱,“到2018年,美國將有181,000個深度分析崗位,是數據管理和數據解讀相關技能崗位數量的五倍。”
由于人才缺口過大,羅伯特·哈夫技術公司預測,到2017年數據科學家的平均薪資將增長6.5%,年薪在116,000美元到163,500美元之間(當然這是美國的標準,中國國內目前尚未統計)。同樣,明年大數據工程師的薪資也將增長5.8%,在135,000美元到196,000美元之間。
10、自助服務
由于聘請高級專家的成本過高,許多公司開始轉向數據分析工具。IDC先前預測,“視覺數據發現工具的增長速度將比其他商業智能(BI)市場快2.5倍,到2018年,所有企業都將投資終端用戶自助服務。
一些大數據供應商已經推出了具有“自助服務”能力的大數據分析工具,專家預計這種趨勢將持續到2017年及以后。 數據分析過程中,信息技術的參與將越來越少,大數據分析將越來越多地融入到所有部門工作人員的工作方式之中。