2016年,近40%的公司開始或正在實施和擴展大數(shù)據(jù)技術應用,另有30%的公司計劃在未來12個月內(nèi)采用大數(shù)據(jù)技術。2016年NewVantage Partners的大數(shù)據(jù)管理調(diào)查發(fā)現(xiàn),62.5%的公司現(xiàn)在至少有一個大數(shù)據(jù)項目投入生產(chǎn),只有5.4%的公司沒有大數(shù)據(jù)應用計劃,或者是沒有正在進行的大數(shù)據(jù)項目。
會有越來越多的公司加速采用大數(shù)據(jù)技術。互聯(lián)網(wǎng)數(shù)據(jù)中心(IDC)預測,到2020年大數(shù)據(jù)和分析技術市場,將從今年的1301億美元增加至2030億美元。“公司對數(shù)據(jù)可用性要求的提高,新一代技術的出現(xiàn)與發(fā)展,以及數(shù)據(jù)驅(qū)動決策帶來的文化轉(zhuǎn)變,都繼續(xù)刺激著市場對大數(shù)據(jù)和分析技術服務的需求”, IDC副總裁Dan Vesset表示。 “2015年該市場全球收入為1,220億美元,預計到2016年,這一數(shù)字將增長11.3%,并預計在2020年以11.7%的復合年增長率(CAGR)繼續(xù)增長。”
CAGR并不等于現(xiàn)實生活中GR(Growth Rate)的數(shù)值。它的目的是描述一個投資回報率轉(zhuǎn)變成一個較穩(wěn)定的投資回報所得到的預想值。我們可以認為CAGR平滑了回報曲線,不會為短期回報的劇變而迷失。
雖然大數(shù)據(jù)市場將會繼續(xù)增長這一點毋庸置疑,但企業(yè)應該如何應用大數(shù)據(jù)呢?目前還沒有一個清楚的答案。新的大數(shù)據(jù)技術正在進入市場,而一些舊技術的使用還在繼續(xù)增長。本文涵蓋大數(shù)據(jù)未來發(fā)展的十大趨勢,這些趨勢可能對2017年及以后的大數(shù)據(jù)市場產(chǎn)生極大影響。
大數(shù)據(jù)發(fā)展趨勢
機器學習、預測分析、物聯(lián)網(wǎng)和邊緣計算將以后的大數(shù)據(jù)項目產(chǎn)生深遠影響。
1、開放源碼
Apache 、Hadoop、Spark等開源應用程序已經(jīng)在大數(shù)據(jù)領域占據(jù)了主導地位。 一項調(diào)查發(fā)現(xiàn),預計到今年年底,近60%企業(yè)的Hadoop集群將投入生產(chǎn)。佛瑞斯特的研究顯示,Hadoop的使用率正以每年32.9%的速度增長。專家表示,2017年許多企業(yè)將繼續(xù)擴大他們的Hadoop和NoSQL技術應用,并尋找方法來提高處理大數(shù)據(jù)的速度。
2、內(nèi)存技術
很多公司正試圖加速大數(shù)據(jù)處理過程,它們采用的一項技術就是內(nèi)存技術。在傳統(tǒng)數(shù)據(jù)庫中,數(shù)據(jù)存儲在配備有硬盤驅(qū)動器或固態(tài)驅(qū)動器(SSD)的存儲系統(tǒng)中。而現(xiàn)代內(nèi)存技術將數(shù)據(jù)存儲在RAM中,這樣大大提高了數(shù)據(jù)存儲的速度。佛瑞斯特研究的報告中預測,內(nèi)存數(shù)據(jù)架構(gòu)每年將增長29.2%。目前,有很多企業(yè)提供內(nèi)存數(shù)據(jù)庫技術,最著名的有SAP、IBM和Pivotal。
3、機器學習
隨著大數(shù)據(jù)分析能力的不斷提高,很多企業(yè)開始投資機器學習(ML)。機器學習是人工智能的一項分支,允許計算機在沒有明確編碼的情況下學習新事物。換句話說,就是分析大數(shù)據(jù)以得出結(jié)論。高德納咨詢公司(Gartner)稱,機器學習是2017年十大戰(zhàn)略技術趨勢之一。它指出,當今最先進的機器學習和人工智能系統(tǒng)正在超越傳統(tǒng)的基于規(guī)則的算法,創(chuàng)建出能夠理解、學習、預測、適應,甚至可以自主操作的系統(tǒng)。
4、預測分析
預測分析與機器學習密切相關,事實上ML系統(tǒng)通常為預測分析軟件提供動力。在早期大數(shù)據(jù)分析中,企業(yè)通過審查他們的數(shù)據(jù)來發(fā)現(xiàn)過去發(fā)生了什么,后來他們開始使用分析工具來調(diào)查這些事情發(fā)生的原因。預測分析則更進一步,使用大數(shù)據(jù)分析預測未來會發(fā)生什么。普華永道(PwC)2016年調(diào)查顯示,目前僅為29%的公司使用預測分析技術,這個數(shù)量并不多。同時,許多供應商最近都推出了預測分析工具。隨著企業(yè)越來越意識到預測分析工具的強大功能,這一數(shù)字在未來幾年可能會出現(xiàn)激增。
5、智能app
企業(yè)使用機器學習和AI技術的另一種方式是創(chuàng)建智能應用程序這些應用程序采用大數(shù)據(jù)分析技術來分析用戶過往的行為,為用戶提供個性化的服務。推薦引擎就是一個大家非常熟悉的例子。在2017年十大戰(zhàn)略技術趨勢列表中,高德納公司把智能應用列在了第二位。高德納公司副總裁大衛(wèi)·希爾里(David Cearley)說:“未來10年,幾乎每個app,每個應用程序和服務都將一定程度上應用AI。
6、智能安保
許多企業(yè)也將大數(shù)據(jù)分析納入安全戰(zhàn)略。企業(yè)的安全日志數(shù)據(jù)提供了以往未遂的網(wǎng)絡攻擊信息,企業(yè)可以利用這些數(shù)據(jù)來預測并防止未來可能發(fā)生的攻擊,以減少攻擊造成的損失。一些公司正將其安全信息和事件管理軟件(SIEM)與大數(shù)據(jù)平臺(如Hadoop)結(jié)合起來。還有一些公司選擇向能夠提供大數(shù)據(jù)分析能力產(chǎn)品的公司求助。
7、物聯(lián)網(wǎng)
物聯(lián)網(wǎng)也可能對大數(shù)據(jù)產(chǎn)生相當大的影響。根據(jù)IDC 2016年9月的報告,“31.4%的受訪公司推出了物聯(lián)網(wǎng)解決方案,另有43%希望在未來12個月內(nèi)部署物聯(lián)網(wǎng)解決方案。”隨著這些新設備和應用程序上線,許多公司需要新的技術和系統(tǒng),才能夠處理和感知來自物聯(lián)網(wǎng)的大量數(shù)據(jù)。
8、邊緣計算
邊緣計算是一種可以幫助公司處理物聯(lián)網(wǎng)大數(shù)據(jù)的新技術。 在邊緣計算中,大數(shù)據(jù)分析非常接近物聯(lián)網(wǎng)設備和傳感器,而不是數(shù)據(jù)中心或云。對于企業(yè)來說,這種方式的優(yōu)點顯而易見。因為在網(wǎng)絡上流動的數(shù)據(jù)較少,可以提高網(wǎng)絡性能并節(jié)省云計算成本。它還允許公司刪除過期的和無價值的物聯(lián)網(wǎng)數(shù)據(jù),從而降低存儲和基礎架構(gòu)成本。邊緣計算還可以加快分析過程,使決策者能夠更快地洞察情況并采取行動。
9、高薪職業(yè)
對于IT工作者來說,大數(shù)據(jù)的發(fā)展意味著大數(shù)據(jù)技能人才的高需求。IDC稱,“到2018年,美國將有181,000個深度分析崗位,是數(shù)據(jù)管理和數(shù)據(jù)解讀相關技能崗位數(shù)量的五倍。” 由于人才缺口過大,羅伯特·哈夫技術公司預測,到2017年數(shù)據(jù)科學家的平均薪資將增長6.5%,年薪在116,000美元到163,500美元之間(當然這是美國的標準,中國國內(nèi)目前尚未統(tǒng)計)。同樣,明年大數(shù)據(jù)工程師的薪資也將增長5.8%,在135,000美元到196,000美元之間。
10、自助服務
由于聘請高級專家的成本過高,許多公司開始轉(zhuǎn)向數(shù)據(jù)分析工具。 IDC先前預測,“視覺數(shù)據(jù)發(fā)現(xiàn)工具的增長速度將比其他商業(yè)智能(BI)市場快2.5倍,到2018年,所有企業(yè)都將投資終端用戶自助服務。
一些大數(shù)據(jù)供應商已經(jīng)推出了具有“自助服務”能力的大數(shù)據(jù)分析工具,專家預計這種趨勢將持續(xù)到2017年及以后。數(shù)據(jù)分析過程中,信息技術的參與將越來越少,大數(shù)據(jù)分析將越來越多地融入到所有部門工作人員的工作方式之中。