Hadoop是目前大數據分析領域中應用最廣泛的一種分布式架構,而經過相當長時間的發展,Hadoop在功能上也越來越成熟。尤其在過去三年里,它得到前所未有的發展,并被很多公司大規模采用。然而時代在變化,Hadoop在多云的未來該何去何從?
根據市場調研公司Forrester估計,2017年用戶將在Hadoop軟件和相關服務上花費8億美元。這并不奇怪,因為在過去這段時間里,Hadoop供應商們充分利用Cloudera、 Hortonworks、和MapR等產品使Hadoop家喻戶曉。但是,時代在變化,Hadoop與其它技術一樣也受到云計算的影響。
用戶們希望借助公有云來處理更多的大數據,所以盡管Hadoop不是專為云而生,Hadoop供應商們還是在努力將Hadoop與云聯系起來。就像一位Hadoop供應商的內部人士所言:“如果我們真正理解云,就不會用原來的方式去設計Hadoop。“事實上,所有Hadoop供應商都在通過自家策略使Hadoop與云相結合,尤其是在對象存儲和調度策略上。
但是,云供應商似乎并未向Hadoop供應商們敞開懷抱。云供應商正在通過自己的數據解決方案代替Hadoop,這為Hadoop在多云的未來發展蒙上了陰影。
在大數據相關業務上,云供應商們采用了隱藏或替換Hadoop的方式滿足用戶需求。比如AWS 的Athena,你可以對大數據執行SQL查詢,但不用關心底層的服務器。這使“無服務器”產品成為趨勢,比如Google云端功能就是一個例子;DataBricks則直接針對S3(亞馬遜云服務)使用Spark。看到這個模式了嗎?
隨著越來越多的公司厭倦了Hadoop的內部復雜性,這些公司正尋求把Hadoop堆棧轉移到公有云,這意味著Hadoop供應商的市場和營收將被云廠商蠶食。
公有云中的Serverless架構(無服務架構),以及其它能夠替代Hadoop的解決方案,都將削弱Hadoop收入;所以除非Hadoop社區能夠給行業一個令人信服的理由,才能說服用戶繼續使用Hadoop,從而保住Hadoop的市場。
就Hadoop目前的生態而言,各供應商之間系出同源但又各自為戰。大數據組件、安全性、元數據及管理等產品及服務都能單獨作為不同供應商之間的獨特競爭力,這讓Hadoop的服務無法形成閉環。而服務閉環卻是用戶選擇將Hadoop作為他們的大數據戰略核心最關鍵的因素。因此,在面對亞馬遜、谷歌、IBM和其他公司提供了Hadoop替代方案的多云未來,Hadoop供應商們無法團結起來一起保護Hadoop的地位。
所以我們有理由相信,在未來兩三年內,Hadoop將只會提供一個品牌而非一條產業鏈或具體的產品。可以看到的是,當下的Hortonworks、Cloudera、MapR和Pivotal都紛紛脫離了Hadoop供應商標簽,他們也正是看到了這種趨勢。
如果再考慮到深度學習和人工智能對Hadoop的影響,那就更加混亂了。就像Hadoop不是為云而生一樣,它同樣不是為深層學習所需的矩陣數學而設計的。云團隊正在忙于創建合適人工智能發展的友好環境,這意味著Hadoop供應商要做更多努力以保持他們軟件的兼容性。未來Hadoop供應商們會讓Hadoop成為AI的平臺嗎?大概不會。
所以Hadoop在未來還會保持兩到三年的強勁增長,但最終它可能只會留在數據庫與大型機身邊。數字時代的變化速度太快,沒有任何一種技術可以長盛不衰!