雖然相當(dāng)一部分企業(yè)還沒有找到更好的Hadoop使用方式,但這并不能阻止其不斷在這一領(lǐng)域加大投入。根據(jù)Gartner的初步估計,2016年Hadoop發(fā)行版支出達到8億美元,較2015年增長40%。遺憾的是,仍然只有14%的企業(yè)實際報告了Hadoop部署情況,僅稍高于上一年的10%。
一大亮點:Hadoop部署開始逐步轉(zhuǎn)移至云端,并在這里找到更大的成功機遇。
人人都愛Hadoop
也許有些人認為Hadoop已經(jīng)被Spark或者其它大數(shù)據(jù)基礎(chǔ)設(shè)施所取代——實際上這一結(jié)論并不確切。
根據(jù)Gartner的定義,Hadoop概念涵蓋了全部“商業(yè)化打包及支持的開源Hadoop相關(guān)項目版本”。換言之,除了傳統(tǒng)的HDFS與MapReduce之外,Gartner還在其中融入了YARN、Pig、Hive、HBase、ZooKeeper、Avro、Flume、Kafka、Oozie、Parquet、Solr、Spark及Sqoop等項目。
事實上,正如Gartner分析師Merv Adrian所言,“這項調(diào)查主要面向各類大數(shù)據(jù)項目”。不過主流媒體給出的,各類大數(shù)據(jù)Hadoop項目都已經(jīng)得到廣泛接納的觀點則并不屬實。
正如Gartner所指出,企業(yè)似乎一直在對Hadoop進行相關(guān)實驗,但卻多數(shù)未能將其納入生產(chǎn)階段:
除了2016年年內(nèi)Hadoop部署量增長緩慢外,部署通道本身也呈現(xiàn)出下滑趨勢。即使從更為狹義的Hadoop概念角度進行分析,大數(shù)據(jù)的實踐比例也仍然相當(dāng)有限:
總體而言,大數(shù)據(jù)技術(shù)確實引發(fā)了廣泛關(guān)注,但還沒能獲得全面成功。
走向云環(huán)境
當(dāng)然,大數(shù)據(jù)領(lǐng)域也不乏優(yōu)勝者。Hortonworks就迎來了強勁的季度表現(xiàn),其營收同比增長39%。2016年,該公司的營收總額近2億美元,其中1.26億來自其Hadoop平臺的訂閱收益。
不過其之所以能夠獲得成功,很大程度上要得益于對云計算的積極接納。正如該公司在財報會議上所言,近25%的Hortonworks客戶正立足公有云運行其軟件,而兩年前這一比例還僅為0%。
雖然這種云轉(zhuǎn)型趨勢可能夫給Amazon Web Services或者微軟Azure帶來更多收益,但作為一股強大的發(fā)展趨勢,這將給大數(shù)據(jù)行業(yè)中的每家從業(yè)廠商帶來推動作用。
將Hadoop部署方案遷移至云端的主要驅(qū)動因素之一,在于Hadoop自身的工作復(fù)雜性。考慮到用于補充及加速Hadoop創(chuàng)新的相關(guān)項目不斷涌現(xiàn),主流企業(yè)根本不可能跟上這樣的節(jié)奏。因此除了谷歌這樣資產(chǎn)雄厚的企業(yè)之外,Gartner表示其它企業(yè)“經(jīng)常需要使用不成熟或者原本不受支持的軟件”方可實現(xiàn)最新最強大的數(shù)據(jù)流分析能力。
作為回應(yīng),Gartner還表示,“基于云的交付模式允許企業(yè)更好地接納Hadoop生態(tài)系統(tǒng)中的各類組件(通常為Apache項目),將始終存在的Hadoop組件升級工作留給云供應(yīng)商處理,這將使得存儲與計算的分離與管理工作更為輕松。”
坦率地講,云正是大數(shù)據(jù)項目的理想歸宿。正如AWS產(chǎn)品戰(zhàn)略負責(zé)人Matt Wood所提到,“那些樂于購買昂貴基礎(chǔ)設(shè)施的客戶已經(jīng)發(fā)現(xiàn)問題的影響范圍與出現(xiàn)領(lǐng)域存在極快的變化速度。在他們還在努力為原本的問題尋找答案時,新的業(yè)務(wù)問題已經(jīng)出現(xiàn)了。”換言之,云不僅能夠為大數(shù)據(jù)技術(shù)提供可管理性,更能夠幫助其真正實現(xiàn)生產(chǎn)能力。
不過如前文所述,這一波遷移浪潮可能并不會給傳統(tǒng)Hadoop供應(yīng)商帶來收益增值。考慮到越來越多的數(shù)據(jù)開始駐留在Amazon、微軟與谷歌提供的云平臺上,也許未來企業(yè)將更傾向于直接使用這些平臺提供的原生Hadoop服務(wù)。