服務器可以說是數據中心里最核心的IT基礎設施,網絡、存儲從根本上講是為圍繞服務器來部署的,因為數據中心本身最重要的作用是在于對數據的執行上,而這個執行的基礎就在于對信息的處理與數據的生成,否則網絡上沒有數據需要傳輸,存儲上也沒有數據需要存取。因此,從另一角度上講,服務器是離企業應用承載最近的IT設備,它效率的高低直接影響著企業應用的表現,進而關乎企業的競爭實力與發展的未來。
當軟件定義之風盛起時,最先波及到時的也是服務器,同時也因為其與應用的緊密關系,從而讓軟件定義在與服務器結合之初,就與應用結下了不解之緣,我們可以總結為“為應用而定制”,這一原則也在指引著服務器發展的未來。
軟件定義服務器的典型案例:服務器虛擬化
由于服務器虛擬化主要由虛擬化管理器(VMM)來實現,所以傳統的服務器虛擬化就是典型的“軟件定義”,從它自身的發展過程中,就能很好的體現出“軟件定義”的由來、優勢和其與硬件之間的關系。
與所有流行的技術一樣,虛擬化技術的誕生,是與用戶需求密不可分的,這也從側面印證了軟件定義本身也是需求引發的產物。
在很早以前,人們就已經發現服務器內部的計算資源(CPU+內存)并不是長期處于滿負載的工作狀態下,很多時候CPU占用率只在10%甚至更低的水平,有的服務器長期處于5%以下的CPU利用狀態。而當IT對于企業越來越重要之后,IT的投資也在逐年增長,漸漸的,對于這筆投資的回報率,也走進了企業高管的視野——我投了這么多錢買服務器,實際只用了這么點資源?但是當時的應用架構,在兼容性與可靠性方面,也決定了服務器使用方式,一個應用一個服務器,這在確保應用之間互不影響的同時,也劃定了服務器的應用模式。然而,對于成本的考量,以及對資源物盡其用的要求,使得人們開始研究如何“復用”一臺服務器的技術,這就是當前已成主流的虛擬化。借助于VMM,它讓一臺服務器上可以運行多個虛擬機,每個虛擬機再承載不同的應用,在邏輯空間上實現隔離,既保證了應用間的獨立,也讓服務器的資源獲得最大化的利用,CPU占用率長期保持在50-70%左右,相較于原來的水平,相當一臺服務器頂原來的5至10臺來用,效益可觀。
當前,我們已經很熟悉服務器虛擬化所帶來的好處,雖然它與云計算并沒有直接的聯系,但誰都不否認它是實現云計算的一大捷徑,尤其是云計算所強調的自動化資源配置,沒有服務器虛擬化的幫助,很難想像會如此動態而靈活的計算資源調度——借助軟件層對硬件抽象層的全局管理,計算資源打破了物理機箱的限制,而在數據中心級別實現匯總與融合,進而為新一代的應用誕生提供了必要的土壤與未來進一步發展的核心理念。
但是,對于當今占據數據中心主流的x86平臺來說,在很長一段時間里,因為硬件性能的限制,x86服務器虛擬化都單純依靠軟件來實現,從而造成了虛擬化后的性能較物理機性能有較大幅度的下降,平均達30%左右,這足以抵消CPU換代升級所獲得性能提升,也因此長期制約了服務器虛擬化的普及,直到CPU虛擬化技術的出現將虛擬機的性能損耗降低至5%以下,才打開了服務器虛擬化在x86市場興盛的大門,并進一步促成了x86服務器在數據中心里的領導地位。
從這一點來說,就明顯能看出最早的軟件定義在服務器上的體現,以及其與服務器硬件平臺發展的關系,而這種“相輔相成”的互動,也在日后的發展中隨處體現,而軟件定義也不再僅僅局限于服務器虛擬化,它更強調了針對不同應用場景的底層支撐軟件的適配,與硬件一起,更好的為應用服務。
為不同的應用場景而誕生的服務器
在IT最早誕生之初,應用的類型是非常單一的,甚至有些公司認為全球只需要幾臺大型主機就夠了(IBM),也有一些IT名人在當時認為計算機的內存有640KB就足夠了(比爾-蓋茨),但顯然隨著人類文明的進步與IT技術自身的發展,IT越來越多滲透至更多的應用領域,也讓其自身的形態發生了根本性變化。這就如同汽車最早發明時,只是轎車,但后來隨著汽車技術的成熟,逐漸出現卡車、大客車以及特種車輛(最典型的就是軍用、消防等車型)一樣,不同的應用場景也帶來了不同應用的需求,而這也就意味著服務器也必須發生改變,同時再借助相應的軟件定義技術,為相關應用提供了更好的承載平臺。
時至今日,不同的應用對于服務器不同負載指標均有不同的需求
在這一發展過程中,以英特爾至強為主要CPU平臺的x86服務器借助于開放、標準化的平臺設計,獲得了廣泛的生態支持,成為了可以覆蓋最多場景的應用平臺,而相關的服務器廠商在這其中的摸索則不斷充實著服務器為應用而定制優化的發展之路。
作為完全采用x86作為其服務器平臺的世界頂級IT供應商,戴爾(DELL)公司在x86服務器平臺的研發上有著積極的創新。這其中,在2010年專門為云計算應用而推出的PowerEdge C服務器的推出就是一個典型的例子(今天已經為至強E5v3而全面更新),戴爾亞太區解決方案副總裁Phil Davis表示,“現在很多大型的數據中心,尤其是巨型網站的數據中心,所采用的服務器都是定制的,它們有很明確的定向需求,一般都是結構很簡單,但能效比很高的設計。然而這種設計在一定程度上也極大限制了硬件擴展與搭配的靈活性,適用面很窄,而云計算時代則讓很多企業的數據中心也向這樣的模式靠攏,但需求又沒有如此的苛刻,所以在某種程度上又將形成一個通用的市場,這就是PowerEdge C的機會所在。”從Phil Davis的介紹中,我們可以看出服務器的定制化設計早已成為大型客戶的服務范疇,但云計算本身的漸行通用化,則讓這一大規模Scale-Out應用場景得以普及,并帶動了相關通用服務器形態的變革。
PowerEdge C推出之后獲得很大的成功,在當時迅速成為了模塊化服務器設計的領導者,也意味相應的應用場景正在大規模普及,如今,類似于PowerEdge C6100的2U4節點結構,已經成為互聯網與大規模云計算基礎設施的典型設計
另一個在x86服務器領域長期占據全球市場第一名的惠普公司,則在其他領域為我們呈現了為應用而優化的設計思路。
第一個就是數據分析領域,隨著互聯網的普及,它以越來越快的速度在吸收著各種各樣的數據,在這些數據中則蘊含著豐富的商業機會,為此新的數據分析應用場景誕生了,而當今最為響亮的聲音莫過于Hadoop與SAP HANA。早在2012年,惠普就在世界頂級服務器廠商中,率先提供了Hadoop集群解決方案——AppSystem For Hadoop。
AppSystem for Hadoop是惠普面向大數據分析領域的最新解決方案,其基于現有的VERTICA實時分析應用系統(已升級至6.0版本),在原有的關系型數據分析能力基礎上,借助Hadoop集群與Autonomy IDOL 10分析引擎的集成,極大增強了其面對非關系型數據的處理能力。惠普公司企業集團融合應用系統產品管理總監Manoj Suvarna強調,HP AppSystem for Hadoop是業界第一個企業級Hadoop解決方案,率先為用戶提供了基于Hadoop架構的大數據分析平臺。
AppSystem For Hadoop采用Cloudera的解決方案(CDH,Cloudera's Distribution including Apache Hadoop,如今已經和英特爾結盟,為英特爾平臺全面優化),它可以說是類似于服務器虛擬化的一層軟件定義平臺,只是針對數據分析應用需求,就相當于虛擬化針對資源復用需求一樣。在硬件上,全部采用的是英特爾至強E5處理器,至于原因則很簡單,惠普公司企業集團系統及解決方案副總裁Martin Whittaker表示,“數據分析是一種對計算能力需求非常強烈的應用,所以在做系統架構時,突出的需求就是要快、更快,可以說對速度的追求是無止境的,這一點很像高性能計算。因此,英特爾至強平臺是顯而易見的選擇。”
HP AppSystem For Hadoop全面采用了英特爾的至強E5硬件平臺與CDH軟件平臺
在SAP HANA方面,HP最典型的設計莫過于不久前剛剛發布的CS900系統,其基于至強E7v2平臺,提供了迄今為止最為強大的x86內存計算的能力——16插槽、12TB內存,未來還有機會擴展至32插槽與24TB內存,以應對不斷擴大的內存數據庫應用需求。這種配置規模,別說在x86領域,即使是傳統高端RISC領域,也非常罕見,而內存計算首先在x86平臺上開花結果,也證明了x86在數據中心里的地位。
x86 Odyssey的第一款產品——CS900 HANA系統,16插槽E7v2,擁有12TB內存容量,這可以說是當今內存容量最大的SAP HAHA集成系統,從技術層面講,完全可以推出32插槽、24TB內存的HANA系統,關鍵在于市場的需求
作為HP Odyssey計劃的階段性成果,CS900領先于通用裸機而推向市場,從另一方面也體現出惠普在服務器發展理念上的新特點。“我們認為高端的關鍵業務,一定是跟應用場景相掛鉤的”,中國惠普副總裁、企業集團關鍵業務服務器系統事業部總經理樊瀛表示,“因此,在Odyssey的發展過程中也非常關注這一點”。其實說到CS900 HANA系統的起源,主推者除了惠普,另一個很明顯就是SAP,否則單憑惠普自己而沒有應用層面的配合,CS900 HANA也不可能誕生。樊瀛就此強調,隨著x86高端平臺的日益成熟,傳統企業級關鍵應用提供商也在密切關注這一平臺的發展,SAP的態度表明了市場對于這種大HANA系統的需求,Odyssey計劃正好與其相呼應,從而成為當今業界最大的單系統HANA平臺,別無他選。
而為了CS900更好的支持超大規模SAP HANA平臺的穩定運行,自Odyssey設計之始,惠普就明確了通過軟件來盡量挖掘英特爾至強平臺潛能的戰略,。“E7v2的硬件RAS功能,我們是百分百支持的,現在還沒有其他廠商可以做到這一點”,惠普亞太及日本地區關鍵業務服務器產品部產品總監陳武勝,在接受采訪時表示,“借助于惠普自身在關鍵業務領域里長達幾十年的積累,我們在整體的硬件架構、固件設計以及相應的軟件配套上,都發揮了所有E7v2的硬件RAS能力。”事實上,關鍵業務服務器并非在縱向上把配置簡單堆疊提高就可以了,對于整體業務應用平臺的可靠、可用與可維護性均有非同一般的要求,這也是為什么x86平臺一直要努力的地方,并且不僅僅是硬件一方,基礎軟件、應用軟件與整體的解決方案都要符合用戶對于關鍵業務應用的期望才可以,這其中有性能方面的,但更重要的則是可用性方面的。而正是借助于惠普自身層面上的“軟件定義”,率先實現了基于至強E7v2平臺的真正高可用,這又可以看作是軟件定義與硬件之間相輔相成的范例。
除此之外,在高性能計算與高密度模塊服務器領域,惠普的創新也讓我們看到了服務器發展更多的可能性,并為“軟件定義”提供了更多的可發揮空間。
Apollo 6000系統和其主要的組成,它的主要功能組件都是專門研發的,包括專用的服務器機箱、高密度服務器與池化電源模塊,并最終以一個方案級的系統統一交付給用戶,而非是采用現有的ProLiant服務器堆加而成。Apollo 6000的服務器機箱為5U設計,第個機箱滿配10臺ProLiant XL220a服務器,每臺服務器內含兩個單路處理節點(至強E3,未來有雙路型號),每單路節點配32GB內存,整個機柜滿載8個機箱,80個ProLiant XL220a服務器,160個單路計算節點
與Apollo 6000一樣,采用液態制冷的Apollo 8000系統重點功能組件也是重新設計的,ProLiant XL730f服務器內置兩個雙路計算節點(采用至強E5-2600 v3處理器,每個節點256GB內存并配有一塊SFF SSD),在1U的全寬機架內包含兩臺ProLiant XL730f服務器,一個f8000機柜中最多可裝載72臺ProLiant XL730f服務器(另外8個槽位留給InfiniBand交換機模塊),共144個雙路計算節點,目前采用NVIDIA Tesla與英特爾Xeon Phi的加速處理模塊也已經推出
惠普全球服務器高性能計算業務開發部部門經理Ed Turkel,在談到高性能計算的發展時表示,“我們談到高性能計算的發展,實際上是研究了不同的工作任務得出來的。當人們想到HPC的時候,他們通常理解的是針對政府和學術界的高性能計算。但實際上HPC可以被應用到不同的行業,比如電子設計、金融服務、汽車,甚至有一些電影行業的3D設計都在使用HPC技術。當我們研究了HPC不同的細節應用以后,發現所有的應用都集中需要更好的性能。隨著計算擴展的范圍越來越大,我們可以看到更多的客戶對單位面積的效率和能耗有了更高的需求。同時,我們發現HPC領域需要更廣泛的兼容性和可訪問性,因為更多客戶要求更簡潔的系統以便更好的管理,他們同時希望一些新的業務需求和想法也都可以快速地實現。為此,惠普鄭重推出了Apollo系列高性能計算產品。”
Apollo 6000系統的第一個客戶就是至強E3處理器的提供者——英特爾公司,其CIO Kim Stevenson對Apollo有著如此的評價:在電子設計自動化應用程序工作負載上,我們看到35%的性能提升。我們已經部署了5000多臺這樣的服務器,實現了更好的機架密度和功率效率,同時為英特爾硅片設計工程師提供更高的應用程序性能。對此,Ed Turkel進一步補充到,“原來英特爾EDA部門的服務器基本上用的是刀片服務器40000多個,我們通過用15000臺的Apollo 6000服務器替換過來,使客戶實現了更好的機架密度、功率密度,同時在使用中提供了更簡單的方法,幫助英特爾EDA部門更好地設計微型處理器。”
而液態制冷的Apollo 8000系統的第一個用戶——美國國家再生能源局下屬的國家再生能源實驗室(NREL,National Renewable Energy Lab),則把Apollo 8000部署在了自己的辦公大樓里。Ed Turkel表示,前面所講到的那個成本優勢就是來自于美國國家再生能源局局長的表述,Apollo 8000系統可以幫助他們每年節省100萬美元的能源支出。這些能源支出由兩部分組成,一部分是我們幫助他們節省了制冷的成本,另外系統產生出來的熱水我們還能幫助他們再次利用,從而節省了供熱能源的開支——“這套Apollo 8000的PUE可以在5年內持續穩定在1.06,并不會因為時間的推移而升高(目前主流的風冷方案會隨時間的累積而使PUE逐漸提升),還可將185000平方英尺的辦公室供熱系統作為其冗余的散熱循環。”
惠普Moonshot服務器的在高密度模塊化服務器領域的創新范例
在高密度模塊化服務器領域,惠普的Moonshot也可謂是典型的創新代表,其所提出的核心理念就在于讓應用選擇服務器。為此,與上述的CS900 HANA系統相類似,惠普完成了自己的硬件平臺創新+軟件定義,為不同的高密度應用提供不同的解決方案。其中最為典型的就是基于英特爾Atom處理器提供了4.3U/180節點的高密度計算能力,非常適合于大型互聯網應用,而隨著不同的微卡服務器誕生(包括英特爾至強E3這樣的高性能處理器,以及GPU、FPGA、ASIC專用芯片等),Moonshot服務器的目標行業領域包括了高性能計算、游戲、通信、金融、基因研究等,若從工作負載類型來分,則包括了內容緩存、Web主機、Web前端加速、大數據分析、VDI(虛擬桌面基礎架構)、面部識別、視頻處理等等,而每種負載也將有最適合、最優化的服務器模組與之對應。
結語:軟件定義服務器 為應用的定制優化而服務
現在我們應該可以理解,在本文前半部分所強調的——軟件定義也不再僅僅局限于服務器虛擬化,它更強調了針對不同應用場景的底層支撐軟件的適配,與硬件一起,更好的為應用服務。而這些支撐軟件的適配除了虛擬化,還包括了數據分析、高性能計算以及關鍵業務等多個領域,因此服務器本身的進化也可以說是軟件定義發展的歷程。
回到本文的重點,我也必須要從服務器的核心本質來展望它的未來,即為應用服務。而軟件定義的意義在于,為了實現這種為應用制定優化的目的,軟件定義提供了硬件無法達成了靈活性與功能實現的能力,它與相關優化設計的硬件相組合,為最終的應用場景提供了理想的平臺,我想這也是軟件定義在服務領域發展的根本目的——而離開了硬件平臺的支持,它也將一事無成。
而在上文的例子中,我們也基本看到全都是英特爾的身影,從至強E7、E5、E3再到Atom,覆蓋了多個典型的應用場景,畢竟英特爾平臺是當前數據中心的絕對主流,這從側面也體現出了硬件平臺自己生態環境的重要性——因為你更為普及,所以才會有更多的,針對應用而優化的方案在你身上體現,反過來又會進一步提供你的占有率。這可以說也是與應用走得最近的,服務器發展的必然規律。而要想在這一領域長期站穩腳跟,我堅信原則只有一個——基于開放、標準平臺的生態環境,為應用提供更出色的定制與優化!