盡管很多IT部門希望托管應用,在云端處理極大量的數據,最流行的“大數據”平臺需要專注于硬件,因為其可能導致可靠性問題。
這個問題可能會隨著VMware的Apache軟件基金會(ASF)的開源項目Serengeti而改變。這個項目將允許企業在云端和虛擬環境中,在vSphere 5.0上部署和管理Apache Hadoop.
虛擬基礎架構云上的Hadoop消除了可靠性問題;通過vSphere,Hadoop應用如果節點失敗能夠自動重啟。
此外,虛擬化巨鱷也正致力于同Hadoop社區成員合作,包括Cloudera Inc.、Greenplum、Hortonworks、IBM,繼續致力于ASF的可擴展性,這也是Hadoop“虛擬化感知”的要害所在。
VMware的Hadoop戰略:精明還是錯誤?
一些人表示VMware在vSphere上適應Hadoop是明智的,而且會成為大數據領域的競爭者。
“隨著大數據每天都在變得更大,很明顯對于大數據消化的工作負載就存在明顯的虛擬化機遇,”Al Hilwa表示,他是IDC應用開發軟件項目總監。
大數據平臺像Hadoop和其他的分布式數據庫在VMware的vFabric應用軟件中是缺失的現代應用堆棧部分,Jeffrey Reed說道,他是Logicalis Group的應用開發經理,該公司是一家英國的云提供商。
“如果VMware不提供起自己的Hadoop或者類似Hadoop的解決方案,其圍繞Hadoop的戰略就十分關鍵,這是分布式廠商的生態環境,”Reed表示。
然而,并不是所有人都同意分析師的觀點。
“VMware對于高度可用的Hadoop的戰略是一種誤導,”Orchestratus的CEO Shlomo Swidler表示,“它通過基礎設施層級支持提供高可用性,然而,軟件層級的HA是現代應用的基準,”Swidler補充道。
“最重要的是讓Hadoop成為優秀的企業公民,”Tony Baer表示,他是研究公司Ovum的首席分析師,“Hadoop容錯不好,虛擬化是協助實現那個的技術之一,”Baer補充道。
Serengeti可以通過Apache 2.0許可證免費下載,允許管理員在一分鐘內用單擊完成Hadoop群集部署。
此外,VMware正致力于同Hadoop合作伙伴共同改變Hadoop分布式文件系統和Hadoop MapReduce開發。上月,VMware也宣布支持在OpenStack支持其Cloud Foundry.