由雅虎為工程師和數據科學家打造的Apache Hadoop曾因巨大的潛力而備受稱贊,但如今它卻受到了更快的產品的影響,而這些產品往往來自于它本身的生態系統——Spark就是其中之一。今年早些,H20.ai的創始人Sri Ambati對Datanami 曾說:“Spark將會使Hadoop處于絕地”。
但在過去的幾年中,Hadoop似乎并沒有出現過任何衰退的跡象。在2015年Atscale的調查報告中顯示:“在未來3個月內,已經有超過 76%的人使用Hadoop來做更多的工作。”這些受訪者中大約有一半聲稱他們利用Hadoop工作中獲得了一定的價值。Hadoop作為一個十多年的老品牌,在產品的采用方面并沒有減緩下降的趨勢,Spark也并沒有做到真正取代Hadoop。空口無憑,下面我們從以下幾個方面來分析一下Spark在未來的幾年之內到底能不能真正的取代Hadoop。
按行業劃分的市場滲透率
毫無疑問,為專家設計的產品一般都會停留在原來的軌道上,在其他方面不會有所涉及。但Spark在各個行業都存在一些有意義的分布,這可能要歸功于各種市場上的大數據的泛濫。所以,雖然Spark可能有更廣泛的應用,但Hadoop仍然支配著原本預期的用戶群。
主要地理市場
在全球范圍內,我們可以看到Informatica處于中心位置——在歐洲和美洲整體市場份額占比達32%。在兩年半的時間里,我們跟蹤了Informatica在云市場和工業領域的增長,結果顯示達到了50%的增長,而且在高等教育領域也處于領先地位。上周, Informatica被Gartner評為主數據管理解決方案2017年魔力象限的領導者。而Hadoop仍然停留于過去成功的地理市場中。
公司規模的采用趨勢
在企業客戶中Spark也沒有大范圍的涉及。我們注意到世界上大多數公司規模較小,一般都為1-50名員工,所以Spark似乎并不是任何規模公司的唯一選擇。對于那些已經使用Hadoop的人來說,這個產品也對企業和公司起到了一定的作用,而且 Hadoop并不僅限于一種用戶。而Hadoop無論在何種規模的公司中,使用率相對于Spark還是非常高的。
寫在最后
此外,在調查的過程中,傳統的科技公司像eBay、Verizon、惠普和亞馬遜等主流廠商已經開始使用Spark,但是Hadoop還沒有被大規模的拋棄。相反,用戶使用Spark作為系統的介紹,利用這個程序來突破Hadoop的障礙,兩者的結合,使得工作更高效的完成。