所有大數據和Hadoop生態系統相關的企業都非常興奮,因為這其中很少有企業會被淘汰出局,但企業似乎并沒有找到Hadoop的正確打開方式,不過這也不影響他們不斷地砸錢。如果試試將整個生態系統搬到云端,就會發現一切都不一樣了。
根據Gartner的初步估計,2016年Hadoop的分配支出達到8億美元,比2015年增長了40%。不幸的是,所有這些支出中只有14%的企業實際用于Hadoop部署,與2015年的10%相差無幾。
一大亮點是:Hadoop部署越來越多地遷移到云,在那里可能有更多的機會成功。
在你對“Hadoop”這個詞不以為意,認為它已經被Apache Spark或者其他大數據基礎設施所取代的時候,你就錯了。
Gartner在其對“Hadoop”的調查中包括所有“商業打包和支持的開源Apache相關項目”。換句話說,老式HDFS和MapReduce包含在Gartner的定義中,YARN,Pig,Hive,HBase,ZooKeeper,Avro,Flume,Kafka,Oozie,Parquet,Solr,Spark和Sqoop也包含在其中,整個調查結果是非常全面客觀和可信的。
事實上,正如Gartner分析師Merv Adrian解釋的,“調查是與所有大數據項目相關的。”當然,盲目信任也是不可取的,考慮到大數據已經成為主流,大數據Hadoop項目也成為主流選擇的觀點是錯誤的。
正如Gartner所說,企業似乎陷入了不斷進行Hadoop實驗的狀態,卻遲遲不能投入實踐:
▲ Gartner
不僅2016年的Hadoop部署只有小幅增長,部署的渠道也全面下降。我們需要深入研究一下大數據定義,歷史數據可能并不總是好的:
▲Gartner
總之,大數據已經進行了足夠的炒作,但還沒有得到應有的成功。
搬到云端!
Hortonworks最近一個季度,收入同比增長了39%。在2016年,該公司的收入接近2億美元,其中1.26億美元來自Hadoop平臺。
對于Hortonworks而言,這一成功最可能歸結于其對云不斷增長的擁抱。目前有大約25%的Hortonworks客戶在其公有云中運行其軟件,要知道在兩年前這個數字大約是0%。云端才是開發人員想要的軟件運行地,而Hortonworks則抓住了這一趨勢。雖然亞馬遜和微軟Azure,可能遠遠超過Hortonworks,Cloudera或MapR,成為Hadoop轉向云端的直接受益者,但這是一個企業必須承認的潮流。
Hadoop部署遷移到云的主要驅動力之一是用Hadoop工作的復雜性。幾乎每天都有一個新的Apache項目補充進來加速Hadoop創新,這是除Google之外的主流企業不可能跟上的步伐。例如,想要獲得最新最好的流媒體分析數據,其他企業通常使用的是不成熟并且缺乏支持的軟件,Gartner指出。
Gartner表示,基于云的交付模型允許企業更好地吸收Hadoop生態系統中的組件(通常是Apache項目)的不斷變化。將升級Hadoop組件的繁重工作留給云提供商,這也使得更容易管理、分離存儲和計算。
坦率地說,這也是大數據項目的特征使然。正如AWS產品戰略負責人馬特·伍德(Matt Wood)說的那樣,那些出去購買昂貴基礎設施的企業會發現問題范圍和域名的轉移真的很快,當他們準備好解決原來的問題時,業務早已經開始變化了。換句話說,云不僅使大數據可管理,而且也使其更具生產力和競爭力。
將Hadoop生態系統遷移到云端這件事,傳統的Hadoop供應商是不會做的,考慮到越來越多的數據將存在于亞馬遜、微軟和谷歌的公有云上,數據的力量很可能推動企業將Hadoop搬上云端。