全球虛擬化和云基礎架構領導廠商VMware公司公布了最新開源項目——Serengeti,支持企業能夠在虛擬和云環境中快速部署、管理和擴展Apache Hadoop。此外,VMware與Apache Hadoop社區共同合作研發擴展功能,讓主要組件可以“感知虛擬化”以支持靈活擴展,并進一步提高Hadoop在虛擬化環境中的性能。
VMware公司云應用服務副總裁陳志璋表示:“通過支持企業充分利用超大型數據而獲取競爭優勢,Apache Hadoop具有帶來業務變革的潛力。它代表了應用正在發生根本性變化的一個方面,而企業也在尋求把這些新技術融入其產品家族的方式。VMware與Apache Hadoop社區合作,支持企業IT部門能夠在虛擬和云環境中輕松部署和管理Hadoop。”
Apache Hadoop事實上正在成為大數據處理的標準,但部署和運營的復雜性、特定的硬件需求、安全上的顧慮和服務水平保障讓很多企業無法充分發揮Hadoop的威力。通過把Apache Hadoop節點從底層物理基礎架構剝離,VMware可以將云基礎架構的優勢帶給Hadoop,包括快速部署、高可用性、最佳資源利用率、靈活和安全多租戶。
擁有Apache 2.0許可證的用戶可以免費下載Serengeti,它是一鍵式部署工具包,支持企業能夠利用VMware vSphere®平臺在幾分鐘內部署高度可用的Apache Hadoop集群,包括Apache Pig和Apache Hive等常見的Hadoop組件。通過使用Serengeti在VMware vSphere上運行Hadoop,企業可以輕松享受到值得信賴、廣泛部署的全球虛擬化平臺的高可用性、容錯性和現場遷移能力,從而實現Hadoop集群的可用性和可管理性。
OVUM首席分析師Tony Baer表示:“要想成為企業IT基礎架構中的佼佼者,Hadoop必須符合企業IT部門的技術和實踐需求。大數據集群的資源密集性使得Hadoop必須支持虛擬化。VMware參與Apache Hadoop項目和VMware最新Serengeti Apache項目都是非常重要的舉措,為企業提供了在Hadoop原型開發和部署時所需的靈活性。”
VMware與Cloudera、Greenplum、Hortonworks、IBM和MapR等領先的Apache Hadoop分銷商合作,從而進行廣泛分銷。
虛擬化擴展、Spring更新幫助企業構建和運營大數據應用
為了簡化并加速企業使用Apache Hadoop,VMware與Apache Hadoop社區合作更新Hadoop分布式文件系統(HDFS)和Hadoop MapReduce項目,使其能夠感知虛擬化,從而支持數據和計算工作在虛擬基礎架構中可以進行最佳分布。這些改變支持企業能夠實現更靈活、更安全且高度可用的Hadoop集群。
VMware還發布了Spring for Apache Hadoop(2012年2月首次發布的開源項目)的更新,讓企業開發者能夠輕松利用Apache Hadoop開發分布式處理解決方案。上述更新支持Spring開發者能夠輕松開發可以與HBase數據庫、Cascading庫和Hadoop相集成的企業應用。Spring for Apache Hadoop可以免費下載,目前可以通過開源Apache 2.0許可證獲取。
上述項目和新功能旨在加速Hadoop使用,并支持企業充分利用Cetas等大數據分析應用從海量數據中獲得實時的智能洞察力。VMware在2012年4月收購了Cetas,Cetas分析服務目前可以在www.cetas.net網站獲得。