在IT技術快速發展的今天,虛擬化技術日趨成熟,由于其在資金節省和IT效率提高上的優勢日益明顯,越來越多的企業也開始部署虛擬化平臺。鑒于IBM Power平臺杰出的穩定性和運算性能,所以越來越多的重要應用已經遷移到Power平臺上運行,為用戶提供可靠的服務。為了提高業務的連續性,防止由于物理Power停機維護,硬件更換帶來的停機窗口,本文將針對IBM PowerVM環境中的Lpar進行動態遷移進行講解,實現服務的連續性和避免停機窗口對業務的影響。本文介紹如何配置動態分區遷移(LPM)并對其進行故障診斷。還簡要解釋了一些 LPM 基礎概念。主要有以下幾個主要內容。
·簡介
· LPM的規劃
· LPM環境的部署
· LPM的配置
· LPM的測試
一、簡介
1、背景介紹
由于虛擬化在資金節省和IT效率提高上的優勢日益明顯,越來越多的企業也開始部署虛擬化平臺,并將大部分業務遷移到虛擬化的平臺。通過虛擬化技術提供的各種高級特性,如動態遷移、快速部署、資源動態遷移等功能保證業務的連續性和穩定性。針對這樣的發展趨勢,項目采用IBM領先的虛擬化技術PowerVM實現服務器虛擬化,并運用最新的PowerVM特性之一--Live Partition Mobility,在機器硬件需要升級和維護的時候,來實現業務的連續性運行,保持較高的SLA (Service Level Agreement)。
2、LPM介紹
LPM是 IBM 基于 POWER6 技術提供的新特性,它特指將運行 AIX 或 Linux 操作系統的邏輯分區從一臺物理系統遷移到另外一臺完全不同的物理系統的過程。在這個過程中,操作系統和應用程序不受任何破壞,對外提供的服務也不受任何影響。
動態分區遷移(Live Partition Mobility,以下簡稱 LPM)給予管理員更加靈活的控制職能,當邏輯分區所在的系統需要進行硬件升級或者維護的時候,又不想因為維護而將服務停止,就可以利用LPM功能將它先遷移到另一臺物理系統上,待升級或維護完成后,再將邏輯分區遷移回來。隨著業務的發展,邏輯分區上的工作量可能會越來越大,這時可以利用 LPM功能將邏輯分區遷移到資源更多的物理系統上,以提供更優質的服務,達到一個負載均衡的目的。
3、LPM的術語和原理
要應用和配置LPM特性就必須先了解一下LPM中所涉及的常用術語和遷移原理。
▲圖1-1 LPM 工作原理
理解LPM的工作原理對于成功的規劃和部署Lpar遷移至關重要。其工作原理如圖1-1所示:
1、分區配置文件(此時處于活動狀態)從源復制到目標 FSP。
2、配置目標上的存儲器。
3、移動程序服務分區(Mover Service Partition,MSP)被激活。
4、分區遷移開始。
A 大部分內存頁面被移動。
B .所有線程轉為閑置狀態。
5、激活過程在目標上恢復。
A 最后的內存頁面被移動。
B 清理存儲器和網絡流量。
6、取消源上的存儲器資源配置。
7、從源 FSP(Flexible Service Processor)移除分區配置文件。
完成上述步驟之后,原來的主機資源將被順利移動到目標主機繼續提供服務。
4、名詞解釋
活動分區(Mobile Partition):被遷移的邏輯分區。
源系統(Source System):活動分區原來所在的系統。
目標系統(Target System):活動分區將要被遷移到的系統。
VIOS(Virtual I/O Server):即虛擬 I/O 服務器。是一個安裝了特殊定制的 AIX 操作系統的邏輯分區。它可以將各種物理資源轉化為虛擬資源,從而使得各個邏輯分區通過 VIOS 來共享這些物理資源。
HMC(Hardware Management Console):即硬件管理平臺。用來管理一臺或多臺系統的平臺,它有自己獨立的硬件。用戶可以通過 HMC 的可視化界面或命令行對邏輯分區和系統等進行一系列的管理工作。
FSP(Flexible Service Processor):Power 服務器中用來管理主機硬件的板卡,系統插電后 FSP 即開始工作。該板上有插口用于將系統連接到 HMC 網絡。可以通過 ASMI(Advanced System Management Interface)控制 FSP 進而執行電源重啟、查看系統信息等操作。
MSP(Mover Service Partition):即移動服務分區。VIOS 的一個系統設置,由它控制是否允許遷移邏輯分區的狀態。
RMC(Resource Monitor and Control):RMC 是一個分布式的框架和體系結構,它允許 HMC 和被管理的邏輯分區進行通訊
5、LPM的分類
標準的 LPM 過程是由驗證操作和遷移操作兩部分組成的。即:
驗證操作(Validation):驗證是進行 LPM 之前可選的一步操作,它可以幫助用戶檢查環境是否已經準備就緒。驗證操作提供的錯誤信息和警告信息可以幫助用戶及時修正錯誤,以保證遷移過程的順利進行。
遷移操作(Migration):由 HMC 或 IVM 提供的功能。使用遷移操作,可以完成活動分區從源系統到目標系統的動態分區遷移。
LPM 按照邏輯分區的情況分為下面兩種類型的遷移:
非活動遷移(Inactive Migration):被遷移的邏輯分區是斷電的。在參考資料中稱為非活動遷移
活動遷移(Active Migration):被遷移的邏輯分區是不斷電的,且一直對外提供服務。在遷移過程中邏輯分區能繼續提供服務,不會影響用戶行為。在參考資源中稱為活動遷移
LPM 按照系統的管理方式分為下面兩種類型的遷移:
HMC 之間的動態分區遷移:邏輯分區使用 HMC 管理的 LPM。
IVM 之間的動態分區遷移:邏輯分區使用 IVM 管理的 LPM。
二、LPM的規劃
在文章所描述的架構設計中,兩個Power主機分別規劃出兩個分區,一個用于VIOS,一個用于數據庫安裝。兩個VIOS共享一個存儲區域,并將共享區域劃分給相關的Lpar使用。通過HMC操作實現Lpar的動態遷移。
所有硬件均采用IBM Power 740+服務器、V7000存儲設備和HMC。
1、硬件列表
2、部署架構圖
三、LPM環境的部署
1、LPM的先決條件
主要準備過程包括以下若干方面:
○ 源系統和目標系統的 FSP 的設置。具體包括:
(1)Power VM 企業版代碼已被激活
(2)邏輯內存塊的大小相同
○ 管理源系統和目標系統的 HMC 或 IVM 滿足如下要求:
(1)HMC的硬件支持LPM功能
(2)HMC和IVM 的操作系統版本支持LPM功能
(3)遠程的HMC和IVM 之間已建立密鑰認證(如果主機位于不通的HMC或者IVM中)
○ 源系統和目標系統的設置。具體包括:
(1)源系統和目標系統使用Power 6或者更高版本的硬件
(2)源系統和目標系統的管理方式相同,即都使用HMC或都使用IVM進行管理
(3)源系統和目標系統的Firmware版本支持LPM功能
(4)目標系統上有足夠閑置的內存和處理器用來支持LPM功能
○ 源VIOS和目標VIOS滿足如下要求:
(1)VIOS的版本支持 LPM 功能
(2)啟用 MSP 功能(冷遷移無此要求)
(3)時鐘同步(冷遷移無此要求)
○ 活動分區滿足如下要求:
(1)運行的操作系統支持LPM功能
(2)RMC連接已建立(冷遷移無此要求)
(3)關閉冗余錯誤路徑報告功能
(4)虛擬串行適配器(Virtual Serial Adapter)不得多于 2 個,即只能通過 HMC 或 IVM 取得對活動分區的虛擬終端連接
(5)不能使用大頁內存(Huge Page)
(6)不能使用物理或專屬的 I/O 設備(冷遷移無此要求)
○ 外部存儲滿足如下條件:
(1)源系統和目標系統連接相同的 SAN 存儲
(2)將整塊的 SAN 存儲以虛擬磁盤的形式分配給活動分區
(3)SAN 邏輯單元的 reserve_policy 屬性置為 no_reserve
(4)目標系統上有足夠的虛擬插槽(Virtual Slot)
○ 網絡配置滿足 :
(1)源 VIOS 和目標 VIOS 配置共享以太網適配器
(2)活動分區使用虛擬網卡
2、劃分Lpar
所有的服務都是通過Lpar的方式提供。這樣可以充分利用Power VM虛擬化的優勢和特有功能來按需分配和提供所需的性能和計算能力。CPU和內存方面不用過多的設置,按照0.8和8G的標準。通過HMC按照下表標準,創建一個Lpar。
Lpar的具體創建方法可以參考IBM 紅皮書(www.redbooks.ibm.com)。
▲表4:LPAR配置表
3、劃分存儲
由于LPM要求所有的盤必須從共享的存儲上供給才能實現遷移。所以本次試驗,將啟動盤和數據盤均放在共享存儲上。通過V7000提供的控制界面,劃分兩個LUN作為啟動盤和數據盤分別映射給兩個不同的VIO。
▲圖3-1 劃分共享存儲
四、LPM的配置
1、配置VIOS
通過VIOS發現之前劃分的存儲,可以通過oem_setup_env下的cfgmgr來發現。此命令分別在不同的VIOS上執行。
▲圖4-1發現存儲
從上圖可以看出,hdisk5和hdisk6就是我們之前所劃分的兩塊存儲。其中hdisk5為啟動盤,hdisk6為數據盤。為了可以在多個VIOS中共享存儲,需要提前改變hdisk的屬性為reserve_policy=no_reserve。
▲圖4-2 變更磁盤屬性
為了實現遷移,我們需要將各個VIOS的 MSP(Mover Service Partition)功能啟用。當然如果是冷遷移的話,是可以不啟用的。
▲圖4-3 激活MSP功能
如果想讓Lpar識別到之前劃分的存儲,需要在VIO中做相關mapping。進入其中一個VIO服務器,進入到配置模式(oem_setup_env)。通過如下命令,將hdisk5和hdisk6分別映射到vhost0和vhost15,作為lpar的系統盤和數據盤。
▲圖4-4 映射磁盤
2、配置Lpar
選擇上述VIO所對應的lpar,添加兩個Client SCSI適配器如圖4-5所示。通過這兩個vscsi來連接VIO中剛分配的兩塊磁盤,分別作為啟動盤和數據盤使用。通過HMC勾選預添加的Lpar ,選擇manage profiles,點擊virtual adapters,添加client scsi31和51。
▲圖4-5 添加虛擬適配器
對于目標VIO只需要在Lpar和VIO中劃分相關的vSCSI,用于連接兩塊磁盤,此處添加為client scsi 43和63。至于mapping關系將由遷移動作完成。
▲圖4-6 添加虛擬適配器
部署操作系統和應用到VIO1的兩塊硬盤,詳細步驟可以參考IBM的官方文檔。(地址詳見參考資料)。
五、LPM的測試
1、驗證遷移過程
進行 LPM 之前,需要驗證源和目標兩端的資源可用性。如果驗證由于某種錯誤而失敗,則
需要修復錯誤才能繼續下一步,否則可能會影響后面的遷移過程。
▲圖5-1 驗證遷移
驗證屏幕(如圖 5-1 所示)顯示,依次執行勾選Lpar,選擇Operations---Mobility---Validate以便從一個主機遷移到另一個物理主機 。
在如下的遷移窗口需要確認源主機和目標主機,如果是跨HMC的,需要額外指定HMC信息。
▲圖5-2 填寫目標主機
此時系統將進行遷移前的驗證工作,如果沒有錯誤發生,就可以執行實際的遷移工作。
2、遷移
在HMC中選擇預遷移的lpar,依次選擇Operations---Mobility--Migrate,如下圖所示
▲圖5-3 執行遷移
如無錯誤,將顯示5-4的遷移過程,此時需要做的就是默默的等待。在此過程中,業務連續性不會被破壞,不會終止用戶的訪問,如圖5-4所示。
▲圖5-4 Ping操作
▲圖5-5 遷移過程
六、總結
本文介紹了如何通過IBM Power VM中提供的高級功能LPM實現活動分區的動態遷移的方法和原理。
通過LPM的建立和實施,可以降低硬件維護成本,實現業務的無縫遷移。特別指出一點,LPM 并不是一個高可用性或災難恢復解決方案。其主要設計目標是在預定的維護活動期間保持應用程序狀態良好且正常運行。