在IT技術(shù)快速發(fā)展的今天,虛擬化技術(shù)日趨成熟,由于其在資金節(jié)省和IT效率提高上的優(yōu)勢(shì)日益明顯,越來(lái)越多的企業(yè)也開(kāi)始部署虛擬化平臺(tái)。鑒于IBM Power平臺(tái)杰出的穩(wěn)定性和運(yùn)算性能,所以越來(lái)越多的重要應(yīng)用已經(jīng)遷移到Power平臺(tái)上運(yùn)行,為用戶提供可靠的服務(wù)。為了提高業(yè)務(wù)的連續(xù)性,防止由于物理Power停機(jī)維護(hù),硬件更換帶來(lái)的停機(jī)窗口,本文將針對(duì)IBM PowerVM環(huán)境中的Lpar進(jìn)行動(dòng)態(tài)遷移進(jìn)行講解,實(shí)現(xiàn)服務(wù)的連續(xù)性和避免停機(jī)窗口對(duì)業(yè)務(wù)的影響。本文介紹如何配置動(dòng)態(tài)分區(qū)遷移(LPM)并對(duì)其進(jìn)行故障診斷。還簡(jiǎn)要解釋了一些 LPM 基礎(chǔ)概念。主要有以下幾個(gè)主要內(nèi)容。
·簡(jiǎn)介
· LPM的規(guī)劃
· LPM環(huán)境的部署
· LPM的配置
· LPM的測(cè)試
一、簡(jiǎn)介
1、背景介紹
由于虛擬化在資金節(jié)省和IT效率提高上的優(yōu)勢(shì)日益明顯,越來(lái)越多的企業(yè)也開(kāi)始部署虛擬化平臺(tái),并將大部分業(yè)務(wù)遷移到虛擬化的平臺(tái)。通過(guò)虛擬化技術(shù)提供的各種高級(jí)特性,如動(dòng)態(tài)遷移、快速部署、資源動(dòng)態(tài)遷移等功能保證業(yè)務(wù)的連續(xù)性和穩(wěn)定性。針對(duì)這樣的發(fā)展趨勢(shì),項(xiàng)目采用IBM領(lǐng)先的虛擬化技術(shù)PowerVM實(shí)現(xiàn)服務(wù)器虛擬化,并運(yùn)用最新的PowerVM特性之一--Live Partition Mobility,在機(jī)器硬件需要升級(jí)和維護(hù)的時(shí)候,來(lái)實(shí)現(xiàn)業(yè)務(wù)的連續(xù)性運(yùn)行,保持較高的SLA (Service Level Agreement)。
2、LPM介紹
LPM是 IBM 基于 POWER6 技術(shù)提供的新特性,它特指將運(yùn)行 AIX 或 Linux 操作系統(tǒng)的邏輯分區(qū)從一臺(tái)物理系統(tǒng)遷移到另外一臺(tái)完全不同的物理系統(tǒng)的過(guò)程。在這個(gè)過(guò)程中,操作系統(tǒng)和應(yīng)用程序不受任何破壞,對(duì)外提供的服務(wù)也不受任何影響。
動(dòng)態(tài)分區(qū)遷移(Live Partition Mobility,以下簡(jiǎn)稱 LPM)給予管理員更加靈活的控制職能,當(dāng)邏輯分區(qū)所在的系統(tǒng)需要進(jìn)行硬件升級(jí)或者維護(hù)的時(shí)候,又不想因?yàn)榫S護(hù)而將服務(wù)停止,就可以利用LPM功能將它先遷移到另一臺(tái)物理系統(tǒng)上,待升級(jí)或維護(hù)完成后,再將邏輯分區(qū)遷移回來(lái)。隨著業(yè)務(wù)的發(fā)展,邏輯分區(qū)上的工作量可能會(huì)越來(lái)越大,這時(shí)可以利用 LPM功能將邏輯分區(qū)遷移到資源更多的物理系統(tǒng)上,以提供更優(yōu)質(zhì)的服務(wù),達(dá)到一個(gè)負(fù)載均衡的目的。
3、LPM的術(shù)語(yǔ)和原理
要應(yīng)用和配置LPM特性就必須先了解一下LPM中所涉及的常用術(shù)語(yǔ)和遷移原理。
▲圖1-1 LPM 工作原理
理解LPM的工作原理對(duì)于成功的規(guī)劃和部署Lpar遷移至關(guān)重要。其工作原理如圖1-1所示:
1、分區(qū)配置文件(此時(shí)處于活動(dòng)狀態(tài))從源復(fù)制到目標(biāo) FSP。
2、配置目標(biāo)上的存儲(chǔ)器。
3、移動(dòng)程序服務(wù)分區(qū)(Mover Service Partition,MSP)被激活。
4、分區(qū)遷移開(kāi)始。
A 大部分內(nèi)存頁(yè)面被移動(dòng)。
B .所有線程轉(zhuǎn)為閑置狀態(tài)。
5、激活過(guò)程在目標(biāo)上恢復(fù)。
A 最后的內(nèi)存頁(yè)面被移動(dòng)。
B 清理存儲(chǔ)器和網(wǎng)絡(luò)流量。
6、取消源上的存儲(chǔ)器資源配置。
7、從源 FSP(Flexible Service Processor)移除分區(qū)配置文件。
完成上述步驟之后,原來(lái)的主機(jī)資源將被順利移動(dòng)到目標(biāo)主機(jī)繼續(xù)提供服務(wù)。
4、名詞解釋
活動(dòng)分區(qū)(Mobile Partition):被遷移的邏輯分區(qū)。
源系統(tǒng)(Source System):活動(dòng)分區(qū)原來(lái)所在的系統(tǒng)。
目標(biāo)系統(tǒng)(Target System):活動(dòng)分區(qū)將要被遷移到的系統(tǒng)。
VIOS(Virtual I/O Server):即虛擬 I/O 服務(wù)器。是一個(gè)安裝了特殊定制的 AIX 操作系統(tǒng)的邏輯分區(qū)。它可以將各種物理資源轉(zhuǎn)化為虛擬資源,從而使得各個(gè)邏輯分區(qū)通過(guò) VIOS 來(lái)共享這些物理資源。
HMC(Hardware Management Console):即硬件管理平臺(tái)。用來(lái)管理一臺(tái)或多臺(tái)系統(tǒng)的平臺(tái),它有自己獨(dú)立的硬件。用戶可以通過(guò) HMC 的可視化界面或命令行對(duì)邏輯分區(qū)和系統(tǒng)等進(jìn)行一系列的管理工作。
FSP(Flexible Service Processor):Power 服務(wù)器中用來(lái)管理主機(jī)硬件的板卡,系統(tǒng)插電后 FSP 即開(kāi)始工作。該板上有插口用于將系統(tǒng)連接到 HMC 網(wǎng)絡(luò)。可以通過(guò) ASMI(Advanced System Management Interface)控制 FSP 進(jìn)而執(zhí)行電源重啟、查看系統(tǒng)信息等操作。
MSP(Mover Service Partition):即移動(dòng)服務(wù)分區(qū)。VIOS 的一個(gè)系統(tǒng)設(shè)置,由它控制是否允許遷移邏輯分區(qū)的狀態(tài)。
RMC(Resource Monitor and Control):RMC 是一個(gè)分布式的框架和體系結(jié)構(gòu),它允許 HMC 和被管理的邏輯分區(qū)進(jìn)行通訊
5、LPM的分類
標(biāo)準(zhǔn)的 LPM 過(guò)程是由驗(yàn)證操作和遷移操作兩部分組成的。即:
驗(yàn)證操作(Validation):驗(yàn)證是進(jìn)行 LPM 之前可選的一步操作,它可以幫助用戶檢查環(huán)境是否已經(jīng)準(zhǔn)備就緒。驗(yàn)證操作提供的錯(cuò)誤信息和警告信息可以幫助用戶及時(shí)修正錯(cuò)誤,以保證遷移過(guò)程的順利進(jìn)行。
遷移操作(Migration):由 HMC 或 IVM 提供的功能。使用遷移操作,可以完成活動(dòng)分區(qū)從源系統(tǒng)到目標(biāo)系統(tǒng)的動(dòng)態(tài)分區(qū)遷移。
LPM 按照邏輯分區(qū)的情況分為下面兩種類型的遷移:
非活動(dòng)遷移(Inactive Migration):被遷移的邏輯分區(qū)是斷電的。在參考資料中稱為非活動(dòng)遷移
活動(dòng)遷移(Active Migration):被遷移的邏輯分區(qū)是不斷電的,且一直對(duì)外提供服務(wù)。在遷移過(guò)程中邏輯分區(qū)能繼續(xù)提供服務(wù),不會(huì)影響用戶行為。在參考資源中稱為活動(dòng)遷移
LPM 按照系統(tǒng)的管理方式分為下面兩種類型的遷移:
HMC 之間的動(dòng)態(tài)分區(qū)遷移:邏輯分區(qū)使用 HMC 管理的 LPM。
IVM 之間的動(dòng)態(tài)分區(qū)遷移:邏輯分區(qū)使用 IVM 管理的 LPM。
二、LPM的規(guī)劃
在文章所描述的架構(gòu)設(shè)計(jì)中,兩個(gè)Power主機(jī)分別規(guī)劃出兩個(gè)分區(qū),一個(gè)用于VIOS,一個(gè)用于數(shù)據(jù)庫(kù)安裝。兩個(gè)VIOS共享一個(gè)存儲(chǔ)區(qū)域,并將共享區(qū)域劃分給相關(guān)的Lpar使用。通過(guò)HMC操作實(shí)現(xiàn)Lpar的動(dòng)態(tài)遷移。
所有硬件均采用IBM Power 740+服務(wù)器、V7000存儲(chǔ)設(shè)備和HMC。
1、硬件列表
2、部署架構(gòu)圖
[page]
三、LPM環(huán)境的部署
1、LPM的先決條件
主要準(zhǔn)備過(guò)程包括以下若干方面:
○ 源系統(tǒng)和目標(biāo)系統(tǒng)的 FSP 的設(shè)置。具體包括:
(1)Power VM 企業(yè)版代碼已被激活
(2)邏輯內(nèi)存塊的大小相同
○ 管理源系統(tǒng)和目標(biāo)系統(tǒng)的 HMC 或 IVM 滿足如下要求:
(1)HMC的硬件支持LPM功能
(2)HMC和IVM 的操作系統(tǒng)版本支持LPM功能
(3)遠(yuǎn)程的HMC和IVM 之間已建立密鑰認(rèn)證(如果主機(jī)位于不通的HMC或者IVM中)
○ 源系統(tǒng)和目標(biāo)系統(tǒng)的設(shè)置。具體包括:
(1)源系統(tǒng)和目標(biāo)系統(tǒng)使用Power 6或者更高版本的硬件
(2)源系統(tǒng)和目標(biāo)系統(tǒng)的管理方式相同,即都使用HMC或都使用IVM進(jìn)行管理
(3)源系統(tǒng)和目標(biāo)系統(tǒng)的Firmware版本支持LPM功能
(4)目標(biāo)系統(tǒng)上有足夠閑置的內(nèi)存和處理器用來(lái)支持LPM功能
○ 源VIOS和目標(biāo)VIOS滿足如下要求:
(1)VIOS的版本支持 LPM 功能
(2)啟用 MSP 功能(冷遷移無(wú)此要求)
(3)時(shí)鐘同步(冷遷移無(wú)此要求)
○ 活動(dòng)分區(qū)滿足如下要求:
(1)運(yùn)行的操作系統(tǒng)支持LPM功能
(2)RMC連接已建立(冷遷移無(wú)此要求)
(3)關(guān)閉冗余錯(cuò)誤路徑報(bào)告功能
(4)虛擬串行適配器(Virtual Serial Adapter)不得多于 2 個(gè),即只能通過(guò) HMC 或 IVM 取得對(duì)活動(dòng)分區(qū)的虛擬終端連接
(5)不能使用大頁(yè)內(nèi)存(Huge Page)
(6)不能使用物理或?qū)俚?I/O 設(shè)備(冷遷移無(wú)此要求)
○ 外部存儲(chǔ)滿足如下條件:
(1)源系統(tǒng)和目標(biāo)系統(tǒng)連接相同的 SAN 存儲(chǔ)
(2)將整塊的 SAN 存儲(chǔ)以虛擬磁盤的形式分配給活動(dòng)分區(qū)
(3)SAN 邏輯單元的 reserve_policy 屬性置為 no_reserve
(4)目標(biāo)系統(tǒng)上有足夠的虛擬插槽(Virtual Slot)
○ 網(wǎng)絡(luò)配置滿足 :
(1)源 VIOS 和目標(biāo) VIOS 配置共享以太網(wǎng)適配器
(2)活動(dòng)分區(qū)使用虛擬網(wǎng)卡
2、劃分Lpar
所有的服務(wù)都是通過(guò)Lpar的方式提供。這樣可以充分利用Power VM虛擬化的優(yōu)勢(shì)和特有功能來(lái)按需分配和提供所需的性能和計(jì)算能力。CPU和內(nèi)存方面不用過(guò)多的設(shè)置,按照0.8和8G的標(biāo)準(zhǔn)。通過(guò)HMC按照下表標(biāo)準(zhǔn),創(chuàng)建一個(gè)Lpar。
Lpar的具體創(chuàng)建方法可以參考IBM 紅皮書(www.redbooks.ibm.com)。
▲表4:LPAR配置表
3、劃分存儲(chǔ)
由于LPM要求所有的盤必須從共享的存儲(chǔ)上供給才能實(shí)現(xiàn)遷移。所以本次試驗(yàn),將啟動(dòng)盤和數(shù)據(jù)盤均放在共享存儲(chǔ)上。通過(guò)V7000提供的控制界面,劃分兩個(gè)LUN作為啟動(dòng)盤和數(shù)據(jù)盤分別映射給兩個(gè)不同的VIO。
▲圖3-1 劃分共享存儲(chǔ)
四、LPM的配置
1、配置VIOS
通過(guò)VIOS發(fā)現(xiàn)之前劃分的存儲(chǔ),可以通過(guò)oem_setup_env下的cfgmgr來(lái)發(fā)現(xiàn)。此命令分別在不同的VIOS上執(zhí)行。
▲圖4-1發(fā)現(xiàn)存儲(chǔ)
從上圖可以看出,hdisk5和hdisk6就是我們之前所劃分的兩塊存儲(chǔ)。其中hdisk5為啟動(dòng)盤,hdisk6為數(shù)據(jù)盤。為了可以在多個(gè)VIOS中共享存儲(chǔ),需要提前改變hdisk的屬性為reserve_policy=no_reserve。
▲圖4-2 變更磁盤屬性
為了實(shí)現(xiàn)遷移,我們需要將各個(gè)VIOS的 MSP(Mover Service Partition)功能啟用。當(dāng)然如果是冷遷移的話,是可以不啟用的。
▲圖4-3 激活MSP功能
如果想讓Lpar識(shí)別到之前劃分的存儲(chǔ),需要在VIO中做相關(guān)mapping。進(jìn)入其中一個(gè)VIO服務(wù)器,進(jìn)入到配置模式(oem_setup_env)。通過(guò)如下命令,將hdisk5和hdisk6分別映射到vhost0和vhost15,作為lpar的系統(tǒng)盤和數(shù)據(jù)盤。
▲圖4-4 映射磁盤
2、配置Lpar
選擇上述VIO所對(duì)應(yīng)的lpar,添加兩個(gè)Client SCSI適配器如圖4-5所示。通過(guò)這兩個(gè)vscsi來(lái)連接VIO中剛分配的兩塊磁盤,分別作為啟動(dòng)盤和數(shù)據(jù)盤使用。通過(guò)HMC勾選預(yù)添加的Lpar ,選擇manage profiles,點(diǎn)擊virtual adapters,添加client scsi31和51。
▲圖4-5 添加虛擬適配器
對(duì)于目標(biāo)VIO只需要在Lpar和VIO中劃分相關(guān)的vSCSI,用于連接兩塊磁盤,此處添加為client scsi 43和63。至于mapping關(guān)系將由遷移動(dòng)作完成。
▲圖4-6 添加虛擬適配器
部署操作系統(tǒng)和應(yīng)用到VIO1的兩塊硬盤,詳細(xì)步驟可以參考IBM的官方文檔。(地址詳見(jiàn)參考資料)。
[page]
五、LPM的測(cè)試
1、驗(yàn)證遷移過(guò)程
進(jìn)行 LPM 之前,需要驗(yàn)證源和目標(biāo)兩端的資源可用性。如果驗(yàn)證由于某種錯(cuò)誤而失敗,則
需要修復(fù)錯(cuò)誤才能繼續(xù)下一步,否則可能會(huì)影響后面的遷移過(guò)程。
▲圖5-1 驗(yàn)證遷移
驗(yàn)證屏幕(如圖 5-1 所示)顯示,依次執(zhí)行勾選Lpar,選擇Operations---Mobility---Validate以便從一個(gè)主機(jī)遷移到另一個(gè)物理主機(jī) 。
在如下的遷移窗口需要確認(rèn)源主機(jī)和目標(biāo)主機(jī),如果是跨HMC的,需要額外指定HMC信息。
▲圖5-2 填寫目標(biāo)主機(jī)
此時(shí)系統(tǒng)將進(jìn)行遷移前的驗(yàn)證工作,如果沒(méi)有錯(cuò)誤發(fā)生,就可以執(zhí)行實(shí)際的遷移工作。
2、遷移
在HMC中選擇預(yù)遷移的lpar,依次選擇Operations---Mobility--Migrate,如下圖所示
▲圖5-3 執(zhí)行遷移
如無(wú)錯(cuò)誤,將顯示5-4的遷移過(guò)程,此時(shí)需要做的就是默默的等待。在此過(guò)程中,業(yè)務(wù)連續(xù)性不會(huì)被破壞,不會(huì)終止用戶的訪問(wèn),如圖5-4所示。
▲圖5-4 Ping操作
▲圖5-5 遷移過(guò)程
六、總結(jié)
本文介紹了如何通過(guò)IBM Power VM中提供的高級(jí)功能LPM實(shí)現(xiàn)活動(dòng)分區(qū)的動(dòng)態(tài)遷移的方法和原理。
通過(guò)LPM的建立和實(shí)施,可以降低硬件維護(hù)成本,實(shí)現(xiàn)業(yè)務(wù)的無(wú)縫遷移。特別指出一點(diǎn),LPM 并不是一個(gè)高可用性或?yàn)?zāi)難恢復(fù)解決方案。其主要設(shè)計(jì)目標(biāo)是在預(yù)定的維護(hù)活動(dòng)期間保持應(yīng)用程序狀態(tài)良好且正常運(yùn)行。