馬云說過:“簡單的事重復做,你就是專家。重復的事用心做,你就是贏家。” 應承了古語“熟能生巧”和“專心致志”。但實際上很多復雜的事情是由簡單的事組成的——比如從IT系統誕生之初就面對的“關鍵業務”,企業數據庫從簡單的庫存管理,零售信息,擴展成如今復雜的ERP系統,實時同步的供銷存信息,復雜度數以百計的增加。IBM作為最早針對企業核心業務推出小型機解決方案的廠商,一直以來都在“重復”的,不斷的幫助用戶解決IT挑戰,在“關鍵業務”領域是當之無愧的專家。
在最新的Power 7+平臺的Power 770+/780+服務器上,IBM再一次“用心”的為客戶提供了一個近乎神器的解決方案——企業資源池(Enterprise Pool)。該解決方案只能用喬布斯生前的一句話來形容:“重新發明了資源池的運作方式,徹底改變了游戲規則。”
用戶究竟需要什么?
我們先從用戶需求出發,看看在數據中心里采用Power 770+/780+的用戶究竟有什么需求,面臨什么樣的挑戰。事實上,任何選用Power平臺的用戶都非常在意自身業務的穩定性,連續性以及效率。這也是Power平臺一直以來的優勢——超高可靠性,高可用,高效率。
但是另一方面,用戶將自身核心應用,如數據庫,ERP,核心在線交易系統等放在Power平臺上時,也會期望能減低硬件、軟件、能耗、甚至管理成本。這些附加需求理所當然,尤其是當關鍵業務應用上規模以后,不再是一兩臺Power系統,而是一個小型Power集群,成本問題就是用戶最關心的。
往未來看,當用戶的業務規模擴大,關鍵業務也需要按需增長,那么如何能不影響業務的同時擴容自身的Power平臺也是另一個問題——以往采取的方式是初期部署時多買一些硬件未來啟用,這顯然不可取。之后是希望用虛擬化的手段實現——但是對于關鍵業務來說,這種方式顯然在可靠性和效率上欠佳。
Power平臺的獨特設計
Power從誕生之初就是為了解決用戶關鍵業務難題和挑戰的,因而從設計上就擁有極高的效率和可靠性。Power 7+平臺作為Power 7的升級,不僅僅是處理器主頻有了25% - 30%的增幅,其三級緩存也從32MB擴容至80MB的海量,極大的增強了Power平臺的性能。而在特性方面則做了更多的提升——每個核心可以支持創建20個微分區(此前只能最多支持10個),AME內存壓縮技術可以極大的環節內存敏感型應用的壓力,LPM動態分區遷移則能夠提升并發遷移的分區數。
對于用戶來說,以上這些特性可以在數據中心內靈活的協調好Power服務器節點間的業務調度,在保證高可用的同時提升效率。
對于動態調節IT資源(如CPU資源,內存資源)的能力,Power平臺早就有CoD技術來實現節點內的CPU調節。這個技術要和IBM Power平臺的銷售策略有關——用戶買回去的Power 770+最多可以有64個CPU,但是用戶不一定要使用這么多,因此可以在最初購買時,只購買10個CPU的授權,進而先把暫時用不到的CPU與內存資源封存(不購買激活授權),等有需要時再進行激活,這樣可以節省大量的采購費用。
而未來當用戶需要使用更多系統資源(更多CPU或內存)時,則可以通過購買新的授權來激活更多的CPU。所有的激活和授權是通過HMC硬件管理控制臺來實現的。這項技術實際上是控制一臺Power服務器的實際可用資源,用戶可以動態的選擇要使用多少系統資源,并為此付費。由此可見,CoD技術有兩點優勢:1、在系統負載不高的時候,可以少買一些授權,未來隨著應用負荷的上升再激活剩余的CPU、內存的權限。2、對于License授權的專業應用軟件來說,授權是通過正在使用的CPU核心數來確定的,而根據業務需求,早先暫時關閉的CPU核心可以免去費用,降低授權成本。
需要強調的是,很多人會認為這是一個類似虛擬化的技術,需要操作系統支持。其實IBM Power平臺的CoD技術完全基于硬件設計實現,與上層操作系統沒有任何關系。因此采用了這種授權的服務器可以運行多種操作系統,包括AIX,Linux等等。
更進一步:硬件級的企業資源池
前面說的CoD技術擁有的硬件級的資源分配和調度,是Power獨特的設計所在,也是很多用戶購買Power的原因(初期成本可以根據自身需求來確定)。那么試想把這個應用模式擴大到整個數據中心,就是我們如今所說的企業資源池(EP)。
企業級資源池的初衷和云計算的初衷一樣,希望能幫助用戶打造一個靈活的,按需使用的,自適應的IT資源池。如前文所述,Power平臺面對的用戶最核心的需求是高效率的系統,高可靠性和高業務連續性,在此之上實現靈活調度才是錦上添花。而如果用云計算這樣的方式,在軟件層面實現靈活調度,而放棄了可靠性和性能,那就成了畫蛇添足了。
所以企業級資源池必須與傳統虛擬化的實現方式區別開來,在硬件層面實現資源的自由調度。在Power 770+/780+的授權中加入了一個新的技術,使其在形成集群時,各個節點上的CPU和內存是可以動態的激活授權來使用和調度的。這樣可以讓用戶可以在數據中心內(多節點間)獲得更為動態的資源調配能力,可用于更多的應用場景(如主備熱援),并節省了大量授權成本。
舉例來說,用戶可以購買兩臺Power 770+,每臺購買4個靜態的CPU和30個動態的CPU。那么當這兩臺Power 770+組成企業池集群后,則兩臺服務器的共60個動態的CPU是可以靈活調配的——不論其物理位置位于哪臺Power 770+機器內。當某臺服務器需要超過4個CPU做運算時,用戶可以將這60個動態CPU按需指派給該服務器。這非常像云計算的概念,這60個動態授權的CPU就是池化的計算資源,可以隨意調配,而后臺的通信,內存調度和任務響應則是硬件層面完成的。
這種方式擁有傳統軟件虛擬化的所有好處,還附加了高效率和穩定性。首先,這種方式對資源的利用達到了最大——例如,數據庫運算總有計算的峰谷,每個月可能只有月末的那幾天會有大量的數據庫訪問,而之后數據庫服務器長時間處于相對空閑階段,同時其他的一些應用可能滿負荷運轉,這時就可以將數據庫服務器里的動態CPU再動態調配給這些應用所在的服務器。
另一方面,由于企業資源池是在硬件層面實現的,因此其高可靠性是軟件所無可比擬的——Power系統長久以來的可靠性名聲也是用戶選擇它作為“關鍵業務”首選的原因。 與軟件方式實現的云計算環境形成的資源池相比,由于節省了虛擬化軟件和調度軟件的開銷,因此系統效率要大大提高——集群規模越大越明顯。
這種解決方案的靈活性,不管是傳統服務器集群,還是云計算集群都無法實現??梢哉f在關鍵應用領域,這樣的硬件資源靈活調配將改變游戲規則。
Power用心成就客戶
IT技術發展這么多年到現在,層出不窮的解決方案圍繞的核心命題就是兩個:更高效率,更低成本。也只有在”關鍵業務“領域還會出現“更高可靠性”的命題。企業資源池(EP)就是IBM在“重復”做了這么多年Power平臺之后得出的專家型解決方案。無論是硬件級的資源調度,還是解決方案本身的靈活性,都是數據中心內前所未有的。
與傳統的x86集群目前普遍使用的云計算虛擬化方式來池化資源相比,Power平臺無疑在效率、可靠性方面更勝一籌。而Power 770+/780+則是IBM 用心交出的答卷——相信今年發布的全新Power 8平臺會給客戶帶來更多的驚喜,尤其在企業資源池方面更加靈活。