思科將和EMC合作在其UCS服務(wù)器上新增支持Greenplum Hadoop。思科的服務(wù)器訪問(wèn)及虛擬技術(shù)群組架構(gòu)師Raghunath Nambiar在博文中表示,這兩個(gè)虛擬計(jì)算環(huán)境公司采取迂回的方式,提供預(yù)配置Hadoop堆棧,結(jié)合思科的C系列機(jī)架服務(wù)器和Greenplum同名的Greenplum MR Hadoop 分布。
Greenplum不喜歡談?wù)撍臄?shù)據(jù)庫(kù)和Hadoop集群硬件的運(yùn)行情況,主要是因?yàn)镋MC,作為獨(dú)立的硬盤陣列制造商和服務(wù)器虛擬化領(lǐng)頭羊Vmware的擁有者,EMC的態(tài)度很中立。早在2010年EMC收購(gòu)Greenplum的消息未公布前,Greenplum已經(jīng)運(yùn)行高度定制的PostgreSQL數(shù)據(jù)庫(kù),從Sun Fire x86的服務(wù)器上并行數(shù)據(jù)倉(cāng)庫(kù)集群。Sun能夠在其皓龍和至強(qiáng)服務(wù)器中提高硬盤容量,確實(shí)是個(gè)好的選擇,但是長(zhǎng)遠(yuǎn)來(lái)說(shuō)并不是很好,因?yàn)閿?shù)據(jù)庫(kù)競(jìng)爭(zhēng)對(duì)手Oracle收購(gòu)了Sun。在Sun被收購(gòu)之后,Greenplum將其代碼運(yùn)行在DELL,HP,和華為x86服務(wù)器上,這些公司也互為OEM,生產(chǎn)的產(chǎn)品都取決于客戶的需求。
有趣的是,EMC卻不是這樣的,支持Greenplum模塊數(shù)據(jù)計(jì)算設(shè)備數(shù)據(jù)倉(cāng)庫(kù)或者它的Hadoop設(shè)備,在Vblock服務(wù)器存儲(chǔ)集群上,EMC與思科一起致力于服務(wù)器虛擬化和數(shù)據(jù)中心的私有云以及現(xiàn)在的虛擬桌面。雖然UCS家族的B系列刀片服務(wù)器不適用于Greenplum工作量,人們認(rèn)為C系列機(jī)架服務(wù)器能夠被EMC和思科配置在Vblock中,運(yùn)行Greenplum代碼,但是實(shí)際不是這樣的。
問(wèn)題的一部分是因?yàn)镠adoop不使用外部存儲(chǔ),所以在Vblock中沒有EMC。很有可能是EMC和思科都在等待思科在服務(wù)器業(yè)中獲得更大發(fā)展,(至今,思科的服務(wù)器業(yè)務(wù)已經(jīng)有超過(guò)1萬(wàn)客戶和10億的年?duì)I收運(yùn)轉(zhuǎn)率,到明年很可能達(dá)到兩倍)在Greenplum建設(shè)UCS平臺(tái)之前。
根據(jù)Nambiar表示,完全集成的思科-EMC堆棧采用思科的UCS C系列機(jī)架服務(wù)器和其UCS 6200融合的服務(wù)器-存儲(chǔ) 10GE的交換機(jī)和陣列連接器,并在機(jī)箱上配置了Greenplum MR Hadoop 發(fā)行版。(Hadoop發(fā)行版就是MapR的 M5 Hadoop 分布。)該設(shè)置開始于單機(jī)架,并且可以擴(kuò)展到覆蓋多個(gè)機(jī)架。UCS 6200 交換機(jī)連接到 UCS 2200 陣列擴(kuò)展器,UCS C210 M2 服務(wù)器被Cisco和EMC選擇運(yùn)行Hadoop。2010年3月推出的C210 M2服務(wù)器,使用英特爾六核至強(qiáng)5600處理器的雙槽機(jī)箱,現(xiàn)在將被新的機(jī)器代替,使用英特爾“Sandy Bridge-EP”至強(qiáng)E5芯片。C210 M2可支持最多192 GB DDR3 主內(nèi)存,有16個(gè)2.5英寸硬盤的空間和1個(gè)或2個(gè)RAID磁盤控制器。
在單機(jī)架的設(shè)置中,Greenplum MR-UCS堆棧有兩個(gè)48端口的UCS 6248UP的陣列連接器和兩個(gè)2232PP 10GE的陣列擴(kuò)展器。連接16個(gè)C210 M2 服務(wù)器,其中有96GB的主內(nèi)存和16個(gè)1TB的硬盤,1個(gè)LSI MegaRAID 9261-8i 磁盤控制器,和1個(gè)思科UCS P81F 虛擬接口卡,這些提供2個(gè)10GE的端口用于陣列擴(kuò)展器。思科的六核至強(qiáng)X5670處理器快速發(fā)展,以2.93 GHz運(yùn)行。每個(gè)機(jī)架有192個(gè)內(nèi)核,256TB的原始存儲(chǔ)容量,高達(dá)350TB的可用Hadoop容量,通過(guò)節(jié)點(diǎn)和數(shù)據(jù)壓縮打開的三路數(shù)據(jù)復(fù)制實(shí)現(xiàn)。這些節(jié)點(diǎn)按照Red Hat Enterprise Linux標(biāo)準(zhǔn)配置。