惠普“奧德賽”計劃簡要回顧
2011年11月22日,惠普發布了代號為Odyssey(奧德賽)的,有關其關鍵業務系統(BCS,Business Critical System)的未來演變計劃。這一計劃的主旨在于將傳統UNIX和x86關鍵業務服務器進行有機的融合,共同發展,以滿足越來越多的用戶想兼顧UNIX與x86(Linux、Windows)關鍵業務的需求。
在奧德賽計劃發布后的第二天,我就寫了一篇對其深度分析的文章《惠普BCS服務器的奧德修斯之路》,之所以稱之為奧德修斯之路,是在于奧德賽是一部古希臘著名的神話史詩,其主要描寫的是主人公奧德修斯,遠征特洛伊,在得勝之后,經過千辛萬苦,前后花費15年終于回到家人身邊的故事。顯然,惠普用這部史詩的名字來命名其BCS復興的計劃,是另有深意的,而在我看來,這就是一條惠普BCS服務器的“奧德修斯之路”。
奧德賽計劃的第一個正式產物在2014年6月2日發布,即“CS900 HANA系統”,CS是惠普融合系統(Converged System)的簡稱。不過由于CS900是一套HANA應用平臺,并非單純的通用服務器系統,所以從嚴格的意義上講,“奧德修斯之路”并沒有真正開啟。
真正值得紀念的日子是2014年12月2日,惠普在西班牙巴塞羅舉行的“HP DISCOVER 2014”大會上正式發布了Intergrity Superdome X與Intergrity NonStop X新一代關鍵業務系統(加以Intergrity的前綴,清楚的表明了兩者的高端身份,與工業標準服務器ProLiant家族有著明確的區分,在下文中,則會省略這一前綴)。其中,Superdome X即是在2011年11月奧德賽計劃發布時所透露的“DragonHawk”(中文譯名:龍鷹)。
2015年1月26日,Superdome X在中國被正式命名為“龍躍”,與最初的代號“龍鷹”遙相呼應。至此,在我看來,惠普BCS服務器的奧德修斯之路已經正式開啟。
Superdome X的使命
奧德賽計劃的制定,以及后續的演變,再到最終的Superdome X的發布,可以認為是惠普對于企業級IT未來發展認知的最終實踐。事實上,除了奧德賽計劃之外,惠普在這幾年還推進了多個服務器演進計劃,比如面向高密度集群應用的Moonshot、針對高度集成化的商業HPC領域的Apollo,以及與富士康聯手推出的Cloudline等。由此可以看出,奧德賽計劃其實是在一個更大的服務器應用全局規劃下的產物,而它所代表的則就是惠普對于未來關鍵業務服務器的判斷。
惠普的服務器全局規劃,所強調的其實就是針對不同的計算環境與應用負載的需求,所出“對的選擇”
在惠普看來,傳統的,相對封閉的關鍵業務系統必將受到新興IT環境的猛烈沖擊。對于這一點,歷史悠久的IT巨頭們都是有共識的,但具體的應對措施則各不相同。有的進一步完善自身的垂直化整合,希望借助整體的應用平臺優勢來保證硬件系統的生命(比如Oracle),有的則將自身的平臺全面開放,希望可以借助開源軟件的力量重回巔峰(比如IBM),而惠普的選擇則要直接得多,那就是與生態環境最為成熟、完善的技術平臺對接,并融入自身在BCS領域的豐富經驗,以在通用的、標準化的標準上打造出獨一無二的關鍵業務系統。惠普所看中的這個技術平臺就是x86,而最終打造出來的關鍵業務系統就是Superdome X(以及CS900這樣的融合應用系統)與NonStop X,鑒于后者應用領域的特殊性,本文將重點放在了Superdome X之上。
當然,奧德賽計劃并不僅僅是指將惠普高端BCS平臺向x86擴展,惠普傳統的,基于安騰的BCS系統仍然繼續發展,從而讓惠普具備了一種獨特的優勢——對于高端的關鍵業務而言,無論是UNIX還是Linux、Windows平臺,惠普均能提供所對應的強力產品。我認為,這才是奧德賽計劃的真正用意,也正是Superdome X的核心使命。
將傳統BCS的能力,平滑過渡到新一代的x86平臺之上,引領新的變革,是奧德賽的計劃的重要部分,另一個重要組成就是原有BCS平臺的持續創新,在明年我們將迎來新一代安騰平臺——Kittson,它將帶動Superdome 2與NonStop的后續升級。而從奧德賽計劃的總體來看,它將讓惠普在橫跨UNIX與Linux、Windows環境的關鍵業務平臺方面具備獨有的優勢
不過,可能很多人會說,現在都是Scale-Out的天下,還需要“高大上”的關鍵業務服務器嗎?我認為,這類問題可能更多的出自于互聯網或是被“互聯網IT理念”所洗腦的人士,對于長期身處于企業級市場的人來說,不值一駁。尤其是在大規模互聯即將到來、云計算即將大規模普及、數據量將大規模迅速提升之際,面對海量信息整合與邏輯處理的集中化需求,大系統的價值很有可能“輪回”,因為在那樣的整合化時代,核心信息的處理速度、系統平臺的可靠性、可用性、傳輸延遲以及數據中心機架空間利用率等問題,可能都將越來越成為使用者所關注的對象。而且,如果Scale-Out能解決一切問題,那么已經統治Scale-Out平臺的英特爾,為什么仍在積極研發高端的E7平臺呢?也正是基于同樣的判斷,惠普最終推出了Superdome X。
Superdome X的架構設計
奧德賽計劃宣布之初就談到了基于Superdome 2架構的x86版本,而正式發布的Superdome X(現在你應該知道“X”的含義了吧)也基本保持了Superdome 2的樣貌。
Superdome X系統的整體構成與設計,一個Superdome X機箱可最多裝8片BL920s Gen8刀片服務器,安裝數量為1、2、4、8片,即可實現2插槽、4插槽、8插槽與16插槽的四種配置,每個服務器配兩顆E7v2處理器和48個DIMM插槽,最高可配1.5TB內存(8個BL920滿配,共12TB)
Superdome 2的Cell刀片服務器(采用的是安騰處理器)
Superdome X服務器由18U高的Superdome X機箱+BL920s Gen8刀片服務器組成,從總體布局上與Superdome 2機箱/刀片很相似。不過,由于采用的是至強E7處理器,所以在內部的架構上,可能更接近于已經停產的DL980 G7。8插槽的Superdome X其實就相當于DL980 G7的接班人(刀片服務器型號的后綴是Gen8)。
Superdome
X服務器的關鍵配置與特性,最高16插槽/12TB內存容量,無疑是當今配置最高的至強E7v2服務器
在Superdome X的配置說明中,我們會看到這樣的一個信息,它采用了惠普自己開發的XNC2的節點控制器。耳熟嗎?沒錯,在DL980 G7上用的就是第一代XNC(eXternal Node Controller,外部節點控制器),而在Superdome X則用的是第二代XNC。
XNC節點控制器是DL980 G7中久負盛名的PREMA架構的核心,它不同于英特爾的官方給出的8插槽E7平臺的拓撲架構,而是通過兩組XNC實現CPU之間更高效的互聯(所有CPU之間均是點對點的連接,無需二次跳轉),尤其適用于8路及以上的高端系統。
英特爾官方的8路E7的互聯架構,由于不提供額外的節點控制器,限于E7的QPI接口數量(最多3個),可接訪問的只有相鄰的CPU。比如上圖中,藍色的CPU就是黑色CPU0所無法直接訪問的,這意味著CPU0如果想訪問藍色CPU所控制的內存數據,就必須要經過其他CPU,反過來藍色CPU所控制的內存數據傳回CPU0也同樣如此,顯然也會影響途中經過的CPU自己的處理效率
在英特爾的官方版本(即公版)E7平臺設計中,8路是英特爾所給出的最終設計,在理論上也是可以實現16路、32路甚至更高路數設計的(CPU可以無限的級聯下去),但由于沒有節點控制器的有效中繼與整合,實際和性能將不可用。這也就意味著,要做到16路的Superdome X必須要有自己的節點控制器,而此前的DL980 G7無疑已經打下了良好基礎。
DL980
G7中的PREMA架構,通過XNC節點控制器的中繼,CPU之間無需經過其他CPU就可以直接互聯,進行內存數據的“非一致性”訪問(NUMA),而且XNC還會帶來額外的好處——無需使用昂貴的E7-8800系列的8路專用型號,用性價比更好的雙路E7-2800系列就可以做出8路的產品。DL980 G7即是如此,在其CPU的支持列表中,甚至沒有E7-8800系列
在PREMA架構下,CPU之間的NUMA效率會有明顯的提升
Superdome X所采用的XNC2芯片無疑是源于DL980 G7,所以在總體的互聯架構上也有眾多的相似之處,比如在CPU的支持方面,可以采用雙路的E7v2,借助XNC2的級聯中繼實現16插槽的擴展能力。不過,惠普目前還沒有給出明確的圖解說明,所以在這里,筆者只能大膽推測了。
BL920s
Gen8服務器實拍,左下角巨大的芯片(覆有散熱器),就是XNC2芯片,在Superdome 2的安騰刀片上,這個位置是兩顆芯片,惠普稱之為Agent芯片,其作用就相當于節點控制器。不過,基于XNC的設計,可以借助跨刀片的交叉訪問來實現系統的冗余
筆者所推測的Superdome X處理器互聯架構圖,在此感謝我的同事盤大師一起討論修正,可以看出與DL980 G7的PREMA架構很像,即使是16路CPU,任意CPU之間的通信也都不會占用其他CPU的通道。在此推測圖中,XNC2芯片雖然每刀片只有一顆,但應該是跨刀片的互聯架構,這樣就算刀片上的XNC2芯片失效,也能保證訪問的冗余性。另一方面,惠普的硬分區(nPars)設計,則是隔插槽的刀片組合,比如兩個刀片的nPas,就是1/3、5/7、2/4、6/8刀片的組合,如果是4個刀片的分區,則是即1、3、5、7刀片是一組,2、4、6、8刀片為一組,就此推測,XNC2之間的冗余也是奇偶編組刀片連接的(請注意上圖中的刀片編號)。而中間的4組XFM則實現了交叉全互聯,任何一個XFM失效,也不會影響CPU之間的通信
相對于DL980 G7來說,Superdome X一個巨大的改進就是所謂的CROSSBAR的交叉互聯的架構,當然也是源于Superdome 2,它是頂級高可用服務器的一個重要標志。Superdome X上配備了4個XFM(Crossbar Fabric Modules,交叉互聯網模塊),可以保證每個刀片、CPU都有冗余的鏈路進行連接,從而確保了硬件上的可靠性,這也將是整體系統的高可用性的重要基礎。
Superdome X的RAS能力
可靠性與可用性,是高端關鍵業務服務器的RAS特性(Reliability、Availability、Serviceability)中重要的組成,而這也是x86平臺當前讓高端用戶所擔心的地方,也是傳統UNIX廠商最愛宣傳的。
不過,對于一家歷史悠久的UNIX廠商來說,這恰恰能體現出惠普自身的優勢——借助其在UNIX關鍵業務平臺上幾十年的經驗與相關的技術、支撐產品,可以做到從平臺級,而不僅僅是硬件系統級別,來保證Superdome X的RAS能力,這顯然不是任何一家x86服務器廠商都能做到的。
雖然是通用的x86處理器平臺,但在具體的系統與平臺級的設計上,則完全可以體現出廠商自身的實力與經驗,而對于已經在UNIX領域耕耘數十年的惠普來說,在高端x86系統的設計上有著先天的優勢
首先在硬件平臺層面,要想做好8路、16路或以上級別的高端系統,沒有自身強大的研發實力是不可能的。比如XNC2節點控制器與交叉互聯架構就是一例,對于很多x86廠商來說都沒有這個實力,但對于傳統的UNIX小型機廠商來說,這則是必備的能力。而即使對于通用的x86平臺本身,是否可以挖掘出最大的潛力也在于廠商的功底。在早前的采訪中,惠普亞太及日本地區關鍵業務服務器產品部產品總監陳武勝,就明確表示,Superdome X對于E7v2的硬件RAS功能,是百分百支持的,而現在還沒有其他廠商可以做到這一點。他們強調“我們在整體的硬件架構、固件設計以及相應的軟件配套上,都發揮了所有E7v2的硬件RAS能力。”
其次,在系統平臺層面,惠普在Superdome X上引入了其在UNIX系統上引以為榮的nPars(Partitions)硬分區能力。這種基于電氣物理隔離的分區技術,比常見的邏輯虛擬分區有著更高的可靠性,據惠普的測試表明,物理分區的可靠性是邏輯虛擬分區的20倍。
Superdome
X的8個刀片,可以有4種nPars組合(或者說是規模),分別是1個刀片(8個硬分區)、2個刀片(4個硬分區)、4個刀片(2個硬分區)以及8個刀片(整個Superdome X就是一個硬分區),在nPar上還可以再部署虛擬化平臺,比如Linux-KVM,即nPars將一臺Superdome X分割為多臺物理服務器,每個nPar又可以通過虛擬化生成多個虛擬機
而在相應的系統與應用維護層面,早在2012年,即奧德賽計劃宣布一年之后,惠普即向x86-Linux平臺提供原本只服務于HP-UX環境的Serviceguard高可用性維護方案。
Serviceguard
的x86-Linux版本已經率先用于DL980 G7服務器,從而也為Superdome X的到來做好了準備
作為運轉了20余年的關鍵業務集群高可用性維護方案,Serviceguard可謂久經考驗,它可以最大限度的保證關鍵業務服務器集群的正常生產。其基本原理在于Serviceguard將應用與服務和它們的相關資源打包,并監視集群中每個節點服務器的健康情況,包括處理器、內存、LAN網絡及適配器、磁盤與操作環境等運行要素,一旦發現問題即將應用/服務包轉移,從而實現高可用性。它還附帶了主流應用相關的工具包,如Oracle數據庫、Apache、MySQL、NFS、PostgreSQL、Samba、Tomcat、Sendmail等等。
除了Serviceguard,惠普在不同系統層面上的高可用性方案也將向x86平臺移植,以確保Superdome X平臺一開始就具備足夠的綜合實力
而除了Serviceguard之外,惠普還明確強調了其他源自于傳統UNIX關鍵業務服務器的高可用性功能,也將移植到x86平臺,包括更為細致與深入的系統級監測,以及面向關鍵業務的高級服務等等,以保證Superdome X具備傳統UNIX平臺的高RAS能力——惠普宣布,Superdome X系統可用性可達到5個9(99.999%)的水平。
從以上幾點就可以看出,要想真正做好高端關鍵業務x86服務器的復雜性并不是隨便哪個廠商就能克服的,而這也是我上文提到的傳統UNIX服務器廠商在開展高端x86系統設計的優勢所在,它們的加入無疑會讓x86高端系統的實力得到迅速增強。
Superdome X的戰力幾何?
介紹了這么多,Superdome X的真正實力到底怎么樣,可能是人們更關心的話題,下面我們就來大概了解一下。
以下所介紹的測試數據,來源于惠普的官方介紹以及SPEC基準測試組織的官方成績,為了便于更好的了解Superdome X的性能,我們將上一代8路服務器的王者DL980 G7、當前E7v2的8路平臺、POWER7/POWER7+平臺、新一代POWER8平臺加入了對比。均采集相關平臺的最好成績,采集最終截止日期是2015年1月28日。
整數性能測試
在整數測試成績中,目前8路E7v2的最好機型是富士通的PRIMEQUEST 2800E,相較采用第一代E7的DL980 G7有了明顯的進步,但是Superdome X的8插槽版本表現更在2800E之上,體現出了其架構設計方面的優勢。這一點,與當初DL980 G7在測試中的優秀表現(在第一代E7的8路平臺中,DL980 G7是綜合性能最好的服務器之一)如出一轍。
而16路的Superdome X的整數性能,更是上一代王者DL980 G7的4.4倍。相較8路Superdome X的整數性能,則提高了98.9%,即性能線性擴展系數幾乎達到了2倍,這表明Superdome X的硬件架構設計是很出色的。
與其他平臺相比,8路E7v2已經超過了16路的POWER7+,并以微弱的差距落后于8路的POWER8平臺。但16路的Superdome X則是明顯超越,由于我們沒有16路POWER8平臺的性能數據,所以還無法得知雙方的差距。
浮點性能測試
在浮點性能方面,Superdome X仍然帶來了最好的E7v2成績,16路Superdome X的性能線性擴展系數達到了1.98,其性能是DL980 G7的4.8倍。
相對于POWER平臺,8路的POWER7不已不是對手,16路的POWER7+以微弱的優勢領先于8路的Superdome X,而8路的POWER8的優勢相對更明顯,但顯然不敵16路Superdome X。
在企業應用Java環境的測試中(SPECjbb2013-MutiJVM),Superdome X也體現出良好的線性擴展性,從4路至8路時,擴展系統為1.92倍,從8路到16路則是1.86倍
SPECjbb2013-MutiJVM測試的多平臺對比
在SPECjbb2013-MutiJVM測試中,我們沒有找到8路E7v2的測試數據,就用表現最好的4路E7v2服務器(思科UCS C460M4)來做一個參考。可以看出8路Superdome X的峰值性能已經超過了UCS C460M4的兩倍。而8路POWER8服務器(E870),雖然在峰值性能上超過了16路的Superdome X,但在更有說服力的Critical jOPS性能方面,落后于8路的Superdome X。
2014
年11月惠普公布的Superdome X與IBM E870的3年TCO的比較結果,3年下來,Superdome X(8路)的TCO只有E870(8路)的68%
在Superdome X的發布會上,惠普還專門在TCO(總體擁有成本)層面,將其與IBM的PowerSystem進行了對比,惠普的用意也十分明顯,也體現出了惠普對于Superdome X的期望。
這個為期三年的TCO的比較設定為:Superdome X為8路,兩個硬分區(2x4路),操作系統為SUSE Linux Enterprise Server(SLES),E870也是8路,兩個分區(2x4路),操作系統為AIX,運行Oracle RAC集群雙活系統。在硬件價格方面,Superdome X只有E870的30%,軟件成本為后者的74%,支持成本是后者的78%。
Superdome X的業界支持現狀與未來
作為奧德賽計劃真正落地的產品,Superdome X肩負著惠普BCS服務器未來發展的理想,但對于一款幾乎是全新的服務器來說,Superdome X從發布之始就進入了不斷完善的階段,當然,這個完善主要是更為強大的硬件能力與生態建設。上文的介紹已經可以看出,Superdome X的“硬件骨架”已經非常優秀可靠了。從理論上分析,未來如果交叉互聯的架構進一步擴充,實現32插槽的設計是完全沒問題的。
Superdome X近期的路線圖,不斷完善相關的硬件能力與軟件生態環境
目前Superdome X只支持SLES與RHEL(RedHat Enterprise Linux),原來所說的Windows Server 2012R2并沒有在首發名單里,惠普目前正在加緊與微軟合作,計劃在2015年年內實現對Windows Server 2012R2、SQL Server 2014以及微軟內存數據庫Hekaton的支持。
值得一提的是,針對中國政府在自主可控的IT需求,惠普與中國的Linux系統供應商中標軟件有限公司合作,推出支持Superdome X的中標麒麟Linux操作系統,并由此打開了面向中國本土ISV合作的更大空間。
在虛擬化方面,Superdome X目前只支持Linux-KVM,惠普表示,正在與VMware進行緊密協同,未來肯定會可以在Superdome X上部署vSphere,但具體的時間點并沒有透露。不過,就在不久前,VMware正式發布了vSphere 6.0,其中一項規格的提升就是單物理主機內存容量最高可支持12TB,我想這也許就是為Superdome X準備的吧。
在管理方面,目前Superdome X還不支持HP OneView,用戶可以通過Superdome Onboard Administrator(SOA)來進行管理。在每個BL920s刀片上都有HP iLO 監管芯片,通過它可以實現一系列高級管理功能,比如指定的刀片或Superdome X全局視圖、系統升級、7x24小時的遠程監控,并可通過Insight Remote軟件,做系統健康預警分析。相信在不久的將來,Superdome X應該會納入HP OneView的管理框架。
在存儲方面,Superdome X支持光纖通道存儲連接與啟動,但目前僅限于惠普自家的存儲系統,包括:HP 3PAR StoreServ 7000/7450/10000、HP MSA 2040、HP XP7、HP XP P9500、HP EVA P6000、HP EVAx400。
結語展望:新的型態與對的選擇
綜合而論,Superdome X(龍躍)毫無疑問是當今性能最強大的E7v2服務器,也是最有底氣向傳統UNIX市場發起沖擊的x86服務器,為惠普關鍵業務服務器的“奧德修斯之路”開了一個好頭!
筆者比較認可惠普所提出的“Superdome X開創關鍵業務計算環境新型態”的說法。正如前文所說,不同的廠商在面對未來關鍵業務平臺的發展策略是不一樣的,這往往與廠商自身的技術特點與“處世原則”有很大的關系。但無論最終將會怎樣,均不可否認的是,傳統的關鍵業務平臺的確將有重大的變化。
Superdome
X為x86關鍵業務平臺樹立了一個標桿,代表當今x86-Linux(未來會有Windows)關鍵業務服務器所能達到的最高水平
就惠普來講,我們可以清晰的看出它的風格——不斷嘗試并為用戶提供更多的選擇。比如,它是目前仍然在堅定支持AMD皓龍處理器的服務器廠商,是第一個大力推廣英特爾凌動(Atom)平臺的主流服務器廠商,也是第一個將ARM平臺引入服務器領域的主流大廠。在處理器平臺的選擇上,惠普似乎并沒有強烈的“專一感”,而是更多的從市場和用戶的需求出發。這樣的策略也最終在產品層面體現,從服務器的產品種類和相關的創新能力來說,惠普顯然處于領導地位。
當然,人們可能會說,誰都是在為市場和用戶需求服務,只是方法不一樣,因此對于“對的選擇”的理解,也各不同。的確如此,但很多廠商可能考慮的是如何將現有的技術平臺進行改造,以適合新的趨勢,并在此基礎上積極主動的引導用戶“適應”他們的改變。而惠普往往會直接選擇,在其眼中可能更符合潮流或需求的新平臺,來擴充自己的解決方案(注意,不是替代)。“奧德修斯之路”即是因此而展開的——惠普選擇了x86平臺作為未來關鍵業務服務器的一個重點方向,所看重的就是x86不斷發展、壯大所伴隨而來的廣闊的生態空間,其背后往往也就預示著更龐大的需求與生命力。與此同時,原有的方案繼續發展,從而以更豐富的方案來迎接用戶的選擇。
反過來,“對的選擇”在用戶群體中,也有不同的解讀,這也與用戶自身的習慣、需求密切相關,所以“對的選擇”無論是從廠商還是用戶角度來說都是相對的。惠普所堅持的,只是選擇可能會更快見效的方案,以看似“被動”的方式來增加被用戶選擇的機率。
相較而言,我認為惠普這個做法是更為科學的,或者說對于惠普自身來講可能是更有效率的做法。Superdome X的推出,在很大程度上將對其他傳統UNIX廠商的領地帶來巨大的沖擊,這其中也自然包括惠普自己的Superdome2,這在整體的變革中是不可避免的,但至少它能最大限度保證Superdome2流失向x86的用戶仍是惠普的用戶,而其他廠商的UNIX平臺如果想向x86遷移,那么惠普的勝算也將大大增加。縱觀業界,能做到這一點的UNIX廠商又有幾個呢?
而對于用戶來說,如果想用UNIX系統,從2路到32路,惠普有Integrity BL860c/870c/890c i4、Superdome2可選,如果想用Linux或Windows高端系統,從2路到16路,惠普有DL580 Gen8、Superdome X可選。我想這就是惠普所宣稱的“新型態”的一種價值體現,那么剩下的就是用戶自己做出“對的選擇”了。