不少IT運維人員一直都充當著企業“救火隊”的角色,業務一旦宕機,不管何時,也不管身在何地,都必須投入到搶修的陣營中去。畢竟企業的業務運轉就是企業的命脈,對企業來說永遠是第一位的,尤其在金融、電信等行業的關鍵性業務中,這一點表現得更為顯著。可以毫不夸張地講,宕機不僅是企業的“噩夢”,更是運維人員的“噩夢”。
無法預知的自然災害隨時可能發生;系統人員誤操作造成數據丟失;手段頻多的黑客、病毒攻擊系統漏洞……可以說企業業務正在一個充滿風險和威脅的世界里運行,因此,建立業務的恢復計劃,最大限度地消除計劃外停機,確保業務的連續性是每個企業所追求的,而選擇一款高可靠性的服務器絕對是構建業務連續性系統的首要前提。
在企業關鍵性業務中,IBM Power平臺一直是主力軍,在很多7x24運行環境中都能見到它們的身影,有數據顯示,2010年IBM Power平臺占有中國Unix服務器市場56%的份額,遠遠領先于其他廠商。2011年3月,IBM正式推出了全新的Power基礎架構云解決方案—— Power Cloud Box,Power Cloud-Box將充分發揮Power Systems企業級應用平臺創新性能,并結合IBM強大的系統軟件及云實施服務“PowerCare計劃”,幫助用戶快速、輕松、切實地構建云基礎架構平臺,保障企業在云計算時代的業務發展。
IBM從三個技術層面實現Power服務器的高可用,來構建一個近乎不停頓的業務環境:
-按照大型機可用性理念設計的具有高RAS特性的系統硬件,以及最大限度減少計劃內停機影響的動態分區遷移功能。
-被業界廣泛證明的具有極高可靠性的AIX系統,以及之上最大限度減少計劃內應用停頓的動態應用程序遷移功能。
-PowerHA 高可用性軟件實現本地高可用集群以及遠程容災功能。
Power系統結構
下面我們看看Power系統硬件、操作系統和Power系統軟件這三個技術層面是如何打造Power服務器的高可用性的。
Power系統硬件給力高可用性
Power服務器硬件所具備的RAS特性及PowerVM動態分區遷移功能可以實現下列兩項功能:
RAS(Reliability, Availability, Serviceability 高可靠性、高可用性、高可服務性)是最早用于IBM大型機的技術,IBM 致力于使每一個新系列的系統比前一代更加可靠。這就使得今天Power系統性能提升,以至于幾乎沒聽說過有任何因為硬件問題導致的系統災難。
應用程序在物理服務器之間的遷移
PowerVM LPM (Live Partition Mobility 動態分區遷移)功能實現了將一臺POWER6服務器上的分區實時地遷移到另外一臺POWER6服務器上。它允許將正在運行的AIX和Linux分區,以及它們所承載的應用程序從一個物理服務器遷移到另一個物理服務器,而不會對基礎服務產生任何影響這項遷移操作只需要花費幾秒鐘的時間即可完成,可以維護整個系統事務的完整性。
操作系統給力高可用性
AIX提供的一種全新的軟件虛擬技術WPAR(工作負載分區),用于隔離用戶和應用程序。WPAR是由軟件創建的、AIX 映像中的虛擬化的操作系統環境。對于所承載的應用程序來說,每個工作負載分區都是一個安全的、隔離的環境。WPAR中的應用程序認為,它正執行于自己的、專門的AIX 實例中。
動態應用程序遷移是AIX 6.1的一項獨特創新,是其WPAR策略的組成部分,它允移動工作負載,而不是整個分區。實際的目標WPAR可以是不同的服務器,但并不一定必須是不的服務器。它比較靈活,也可以在一些具備混合物理體系結構(Power5 和 Power6)的境中使用。它可以將應用程序從需要計劃停機以便進行維護的系統中移動到別處。通過將工作負載從不堪重負的服務器移動到負載較輕的服務器,它還可以用于提高性能。而且,通過采用這種方式移動工作負載以允許物理服務器在非高峰期間進入睡眠狀態,它還可以幫助節約電能。
Power系統軟件給力高可用性
利用IBM PowerHA和Power HA/XD這兩項系統軟件,可以實現本地高可用集群以及遠程容災功:
IBM PowerHA for AIX是用于Power系列服務器上的高可靠集群軟件,通過冗余配置,消除單點故障,保證整個系統連可用性和安全可靠性。HACMP是利用網絡來偵測主機及網卡的狀況,搭配AIX所提供的硬鏡像等功能,在主機、網卡、硬盤控制卡、硬盤或網絡發生故障時,自動切換到另一套備用件上重新工作;若是主機故障則切換至備份機上繼續應用系統的運行。PowerHA for AIX 解決方案提供可靠的監控、故障檢測和業務應用環境向備份資源的自動恢復,為核心數據業彈性奠定基礎。
通過PowerHA/XD可以實施容災解決方案。PowerHA/XD(Extended Distance)是PowerHA or AIX的一個可選特性,可以提供GLVM(Geographic Logical Volume Manager)異步模式,并支持SVC Global Mirror。這兩種選項都可以將應用切換到遠程站點的備份資源,而不會影響生產應用環境中的性能。PowerHA/XD使用自身同步模式LVM AIX鏡像技術, 通過與對于Enterprise Storage Server (ESS)、IBM System Storage DS6000和DS8000和SAN Volume Controller(SVC)Metro-Mirror對等機的園區級故障切換和對于IP連接對等機故障切換的透明集成,從而能夠提供支持。當 PowerHA for AIX檢測到一個故障時,可以在一個遠程冗余系統上將其重新啟動,從而能夠快速、自動地采取措施,恢復該應用。