EMC公司在EMC World 2012上宣布,1000節點集群Greenplum數據分析工作臺(Greenplum Analytics Workbench)已經上線,該工作臺將作為一種實驗室環境使用,以加速大數據創新的步伐。Greenplum數據分析工作臺的主要用途之一是,作為一種驗證環境,驗證Apache Hadoop代碼庫的可擴展性。EMC Greenplum事業部與Apache軟件基金會展開了積極合作,以確保運用該數據分析工作臺得到的數據分析結果能提供給開源社區,進而利用該工作臺的資源進一步加速Hadoop的發展,使其成為革命性的大數據技術。來自全球數家領先軟件及硬件公司的技術為Greenplum數據分析工作臺提供了基礎架構。
▲
Greenplum數據分析工作臺將用來測試橫向擴展基礎架構技術的限制,并用來探索大數據分析的各種應用方式。無論是與富有遠見的學術機構就數據密集型研究項目展開合作,還是與大數據應用開發商合作,Greenplum事業部都準備讓該數據分析平臺為數據領域最具創新精神的思想家服務。
該1000節點集群也將供Greenplum的Hadoop培訓及認證級成員使用。Greenplum將提供一套全面的Hadoop培訓課程,向學員提供運用Hadoop所需的知識和編程技能,首批公開提供的課程將于今年夏天推出。Greenplum Hadoop培訓課程的獨特之處是,任何成功完成該課程的個人都將獲準使用該1000節點集群,并將其作為一種沙箱環境使用。
Greenplum數據分析工作臺是數家硬件和軟件工作合作的結果,這些公司旨在共同促進Apache Hadoop的發展,使其成為大數據分析的重要工具。這些公司包括:
EMC 英特爾 Mellanox Technologies 美光 希捷 超微 Switch VMware
除了1000多個硬件節點(或通過增加虛擬機達到10000個節點),該試驗臺集群還包括24PB的物理存儲系統。如果將有記載以來人類全部書面作品轉變成電子數據保存,那么24PB接近這些作品數據量的一半。
客戶及合作伙伴引言:
美國加州大學圣地亞哥分校圣地亞哥超級計算機中心大規模數據系統研究中心(CLDS)主任Chaitan Baru
“加州大學圣地亞哥分校大規模數據系統研究中心(CLDS)于5月8日至9日在美國圣何塞舉辦了大數據基準研討會(Workshop on Big Data Benchmarking),在為大數據應用開發業界標準基準方面,該研討會激起了極大的熱情。大數據基準社區已開始自發形成,以在大數據基準領域取得進展。就幫助該社區在這一重要領域取得進步而言,Greenplum的1000節點集群將起到極其重要的作用,并將對企業界和科學應用領域產生重要影響。”
Mellanox Technologies公司業務拓展副總裁Amir Prescher
“我們的系統已成為有史以來最大的Hadoop試驗臺集群的一部分,而且我們為實現這一領先的Hadoop非結構化數據分析解決方案提供了關鍵組件,這些都令我們倍感振奮。新的Greenplum數據分析工作臺采用了我們的解決方案,將Hadoop作業的運行時間縮短到了原來的1/2,從而優化了大數據應用的效率。Greenplum數據分析工作臺采用了我們的10/40GbE和FDR 56Gbps InfiniBand互連解決方案,其中包括我們的非結構化數據加速器(UDA)軟件,該軟件增強了我們解決方案的互連能力,使互連具有低延遲、高吞吐量、低CPU開銷和遠程直接存儲器存取(RDMA)的特色。”
超微計算機公司國際銷售副總裁Wally Liaw
“EMC Greenplum數據分析工作臺的背后,是1000個數據節點的基礎架構和整合性資源,我們為該基礎架構和整合資源做出了自己的貢獻,以期在Hadoop開發人員社區中加速技術創新和新應用開發。我們的企業級服務器平臺具有最高的性能,采用了開放標準和經濟實惠的架構,適用于海量結構化和非結構化數據分析。在大數據科學不斷發展的今天,能為全球Hadoop社區提供日益增強的支持,令我們倍感振奮。”
EMC高管引言:
EMC公司Greenplum事業部高級產品副總裁兼共同創始人Scott Yara
“我們非常高興地宣布,Greenplum數據分析工作臺上線了。隨著越來越多的公司開始進行大數據分析,基于Hadoop的海量數據批處理,加上連續測試,已經變得至關重要了,這樣的數據處理和測試能促進更好、更快的數據分析。”
關于EMC公司Greenplum事業部
Greenplum是EMC公司的一個事業部,以構建大數據分析的未來為己任。Greenplum的數據科學團隊憑借出色的技能開發出了眾多突破性的產品,以加速大數據分析的進步,并幫助全球企業實現機構敏捷性,成為以數據為主導的、有預見性的企業。Greenplum事業部提供的產品包括:Greenplum統一數據分析平臺(Greenplum Unified Analytics Platform)、Greenplum數據計算設備(Greenplum Data Computing Appliance)、Greenplum數據庫(Greenplum Database)、Greenplum數據分析實驗室(Greenplum Analytics Lab)、Greenplum HD和Greenplum Chorus 。這些產品體現了開放系統、云計算、虛擬化和社交協作的威力,能幫助全球企業利用數據獲得更深入的洞察力并從數據中獲得更大的價值。