虛擬化技術(shù)的使用,極大的提高了運營商數(shù)據(jù)中心的計算效率,提高了業(yè)務(wù)系統(tǒng)的可用性、業(yè)務(wù)彈性及可管理性。黑龍江移動業(yè)務(wù)支撐系統(tǒng)核心業(yè)務(wù)均運行于IBM Power服務(wù)器上,近年來,實現(xiàn)了Power服務(wù)器從物理機至PowerVM虛擬化的過渡,讓業(yè)務(wù)支撐系統(tǒng)受益良多。
虛擬化優(yōu)點顯著
虛擬化的優(yōu)點眾多,我們以PowerVM為例,僅從資源利用率、可用性2個方面進行分析。
1.資源利用率
在傳統(tǒng)的Power服務(wù)器分區(qū)上,分配給分區(qū)的計算及IO資源,只能獨享,即使用利用率很低,也無法將資源共享給其他分區(qū)。
比如,為保證系統(tǒng)的計算能力,CPU一般按忙時峰值來配置,而每個分區(qū)的峰值時間可能會不同,但分區(qū)間無法共享。每個分區(qū)至少需要配置2個FC卡、2個網(wǎng)卡分別連接至SAN、LAN網(wǎng)絡(luò),以實現(xiàn)存儲網(wǎng)絡(luò)、IP網(wǎng)絡(luò)的鏈路冗余,而在性能監(jiān)控報表上顯示,有些FC卡、網(wǎng)卡的利用率不及帶寬的10%。
在實施PowerVM后,分區(qū)之間可以共享CPU資源,在同一物理服務(wù)器上,在不升級服務(wù)器配置的情況下,可容納更多的分區(qū),提高了系統(tǒng)的整合比。
由于分區(qū)間共享了網(wǎng)卡、FC卡資源,減少PCI插槽的數(shù)量:如多個分區(qū)可共享同一個8G FC實現(xiàn)LAN Free備份;多個分區(qū)間共享VIOS的共享網(wǎng)卡,提高了利用率。服務(wù)器PCI插槽數(shù)量減少了,同時減了對Power服務(wù)器擴展柜數(shù)量的需求、服務(wù)器至LAN/SAN網(wǎng)絡(luò)之間的鏈路、LAN/SAN端口數(shù)量需求,也間接地減少了機房空間、電源的要求與壓力。
2.可用性
由于虛擬化分區(qū)使用的設(shè)備均為虛擬化設(shè)備,無需在開機時候進行設(shè)備的硬件啟動及檢測,縮短了開機時間,標(biāo)準(zhǔn)的虛擬化分區(qū)啟動一般在1分鐘以內(nèi),但傳統(tǒng)的分區(qū)開機一般至少5分鐘以上。
PowerVM由Power服務(wù)器管理程序及VIOS(虛擬IO服務(wù)器)分區(qū)實現(xiàn),在PowerVM平臺,提供了IT基礎(chǔ)架構(gòu)資源的內(nèi)置的高可用性:共享網(wǎng)卡可提供負載均衡和失效轉(zhuǎn)移,把高可用設(shè)計從操作系統(tǒng)移至虛擬化層,減化了分區(qū)操作系統(tǒng)的配置與部署成本;可向操作系統(tǒng)層提供外置存儲磁盤的vscsi、npiv(N_PortID虛擬化技術(shù))的多路徑訪問。
同時,PowerVM進一步增強了計算資源的動態(tài)調(diào)整能力,分區(qū)在運行期間,可以根據(jù)對CPU、內(nèi)存資源的使用量需求,動態(tài)從CPU、內(nèi)存池中獲取,無需人工干預(yù)。
P2V遷移
Power服務(wù)器虛擬化有很多優(yōu)點,所以Power服務(wù)器虛擬化是一件非常有意義的事情,也需要企業(yè)IT架構(gòu)師要慎重考慮與精細化規(guī)劃。我們將介紹從傳統(tǒng)分區(qū)遷移至虛擬化分區(qū)的方法,闡述PowerVM 虛擬化遷移過程中所需考慮的問題及方法、工具、措施。
為便于討論,虛擬化遷移簡稱為P2V(Physical to Virtual)。
1.P2V遷移評估
系統(tǒng)調(diào)研 在此階段,需要組織業(yè)務(wù)部門、應(yīng)用開發(fā)部門、IT基礎(chǔ)架構(gòu)管理部門開一個項目啟動會,針對虛擬化的優(yōu)點進行宣講,調(diào)研應(yīng)用系統(tǒng)針對虛擬化部署及遷移方面的需求,如計算資源的余量需求,業(yè)務(wù)系統(tǒng)遷移過程的時間窗口等等。尤其重要的是,在此階段需要與應(yīng)用部門及項目涉眾確定實施PowerVM P2V的分區(qū)范圍。
業(yè)務(wù)部門、應(yīng)用開發(fā)部門可能會對虛擬化之后性能問題有一些疑問,此時,需要根據(jù)前期虛擬化測試數(shù)據(jù)進行講解,排除疑慮。
性能采集 完成系統(tǒng)調(diào)研之后,要對即將進行虛擬化的應(yīng)用進行性能數(shù)據(jù)采集,nmon是一個很好的開源工具,不僅支持在線的性能監(jiān)控,同時,可支持將性能數(shù)據(jù)采集至文本文件,通過脫機方式進行后續(xù)的分析處理。
由于運營商的業(yè)務(wù)支撐系統(tǒng)具有一定的周期性,如每月需要出帳,月底、年底需要出月報、年報,月初會出現(xiàn)交費高峰等。因此,月底、月初的性能數(shù)據(jù)至關(guān)重要,需要對每月的業(yè)務(wù)忙時做連續(xù)性能監(jiān)控,采樣周期可為5分鐘至15分鐘。由于時間關(guān)系,連續(xù)監(jiān)控一個月的性能數(shù)據(jù),耗時耗力,在其他非業(yè)務(wù)忙時時段,建議連續(xù)采集性能數(shù)據(jù)一周,采樣周期可為30分鐘或1小時。
應(yīng)用分區(qū)分組 在完成數(shù)據(jù)采集之后,需要對分區(qū)進行分組,評估如何將不同分區(qū)整合至物理服務(wù)器。主要考量因素為安全等保級別與互補性原則,在實際的操作過程中,可據(jù)業(yè)務(wù)及應(yīng)用系統(tǒng)的實際情況,增加其他的考量因素。
一方面是安全等保級別。首先考慮行業(yè)管理規(guī)范安全等級保護級別的規(guī)定,不同的等級保護級別的服務(wù)器不應(yīng)劃分在同一組。如生產(chǎn)系統(tǒng)不能與測試開發(fā)系統(tǒng)分至一組,核心生產(chǎn)系統(tǒng)不能與互聯(lián)網(wǎng)接入系統(tǒng)劃分至一組。
另一方面是互補性原則。分區(qū)分組使用互補性原則,如營業(yè)系統(tǒng)、CRM系統(tǒng)一般在工作時間段運行,而經(jīng)分系統(tǒng)一般在非工作時間段運行,則這2類服務(wù)器適合分在一組,營業(yè)系統(tǒng)、CRM系統(tǒng)屬于A類,經(jīng)分系統(tǒng)屬于B類。再如計費系統(tǒng)需要實時傳輸文件,對網(wǎng)絡(luò)帶寬需求較高,而部門內(nèi)部的報表系統(tǒng)只要求穩(wěn)定性,不需要大量的網(wǎng)絡(luò)帶寬,可將上述系統(tǒng)劃分至一組,計費系統(tǒng)為C類,報表系統(tǒng)為D類。
分區(qū)整合分析 對為同分組分區(qū)的性能數(shù)據(jù)進行整合處理,通過nmon consolidator可實現(xiàn)CPU、內(nèi)存、網(wǎng)絡(luò)、磁盤等數(shù)據(jù)的整合分析處理,圖為4個測試系統(tǒng)分區(qū)CPU整合圖,原測試系統(tǒng)每個系統(tǒng)分配了1個CPU,經(jīng)過分析發(fā)現(xiàn),這個4個測試系統(tǒng),完全可以整合至1個CPU,計算能力還有很大的余量。
通過對計算及IO資源的整合分析,可以計算出每組服務(wù)器對計算及IO資源需求量。根據(jù)分區(qū)整合分析結(jié)果,重新定義分區(qū)計算及IO資源的需求數(shù)量,生成分區(qū)規(guī)劃配置表,以此作為虛擬化分區(qū)的部署依據(jù)。
2.PowerVM部署規(guī)劃
PowerVM服務(wù)器選擇 由于PowerVM是需要IBM原廠許可,因此,并不是所有Power服務(wù)器都適合做PowerVM虛擬化轉(zhuǎn)化。具有PowerVM許可的Power服務(wù)器,可以首選虛擬化方案。
另外,實施虛擬化的服務(wù)器建議一般是計算資源與IO資源比較多,資源調(diào)整空間比較大的中高端Power服務(wù)器。高端Power服務(wù)器如果沒有PowerVM許可,建議權(quán)衡采購成本及其虛擬化計算及IO能力整合所來來的效益,是否采購PowerVM許可。低端Power服務(wù)器,即使實施虛擬化,也不建議用于生產(chǎn),適合用于開發(fā)及功能性測試。
經(jīng)過上述權(quán)衡,得出PowerVM P2V服務(wù)器列表。
分區(qū)部署規(guī)劃 計算出可實現(xiàn)PowerVM服務(wù)器的總體計算與IO能力,并根據(jù)分區(qū)配置需求,進行分區(qū)部署規(guī)劃,將分區(qū)模擬部署至現(xiàn)有Power服務(wù)器。注意此規(guī)劃過程中,需要為Power服務(wù)器預(yù)留適當(dāng)?shù)挠嬎闩cIO能力。
服務(wù)器配置及數(shù)量擴容 如果現(xiàn)有Power服務(wù)器計算或IO能力不足,則需要調(diào)整服務(wù)器配置,如Power服務(wù)器標(biāo)配為CPU/內(nèi)存比為1:8,現(xiàn)階段CPU計算能力比較富余,但根據(jù)分區(qū)規(guī)劃內(nèi)存明顯不足,此時應(yīng)對內(nèi)存進行擴容。如果現(xiàn)有Power服務(wù)器資源數(shù)量不足,則需要規(guī)劃新的Power服務(wù)器數(shù)量及配置,進行購置。
[page]3.P2V實施計劃
完成PowerVM部署規(guī)劃之后,需要制定PowerVM P2V實施計劃,定義P2V過程的不同批次,每個P2V批次詳細遷移計劃,如LAN網(wǎng)絡(luò)IP、端口準(zhǔn)備,SAN網(wǎng)絡(luò)劃Zone準(zhǔn)備,存儲磁盤的映射準(zhǔn)備等。
4.滾動式P2V策略
由于在當(dāng)前的Power服務(wù)器上,仍運行著各類業(yè)務(wù)系統(tǒng),建議采用滾動式遷移策略,逐步完成PowerVM P2V遷移。首先,利用新購署的Power服務(wù)器,或計算與IO資源比較空閑的服務(wù)器,搭建PowerVM平臺,將傳統(tǒng)的分區(qū)遷移至PowerVM平臺;再在完成遷移的Power服務(wù)器上搭建PowerVM平臺,遷移其他傳統(tǒng)分區(qū)至此PowerVM環(huán)境,以次類推,最終完成整體的PowerVM P2V遷移。
5.P2V遷移準(zhǔn)備
LAN網(wǎng)絡(luò) 為PowerVM環(huán)境準(zhǔn)備LAN網(wǎng)絡(luò)交換機端口與布線,在規(guī)劃實施過程中,可充分利用原有的LAN網(wǎng)絡(luò)端口及布線。更應(yīng)利用Etherchannel技術(shù)提高網(wǎng)絡(luò)帶寬,提供負載均;使用Trunk技術(shù)減少對交換機端口及布線資源的使用。
SAN網(wǎng)絡(luò) 為PowerVM環(huán)境準(zhǔn)備SAN網(wǎng)絡(luò)交換機端口與布線,在規(guī)劃實施過程中,可充分利用原有的SAN網(wǎng)絡(luò)端口及布線。
在PowerVM實施之前或過程中,建議對SAN網(wǎng)絡(luò)進行整合,將PowerVM所使用的SAN網(wǎng)絡(luò)整合至統(tǒng)一的Fabric網(wǎng)絡(luò),以提高Power服務(wù)器對SAN使用的利用率,減少PowerVM環(huán)境FC卡、SAN交換機端口及布線的使用。
VIOS選擇及搭建 PowerVM Hypervisor向虛擬化分區(qū)提供計算資源的虛擬化,VIOS服務(wù)器向虛擬化分區(qū)提供網(wǎng)絡(luò)及磁盤IO的虛擬化,VIOS有2種架構(gòu):單VIOS服務(wù)器與雙VIOS服務(wù)器。
如果Power服務(wù)器計算資源較少,在4C/32G以下,建議采用單VIOS,以節(jié)省資源;如果Power服務(wù)器計算資源較多,且承載的虛所論分區(qū)重要程度較高,建議采用雙VIOS架構(gòu),以提高系統(tǒng)的可用性。
6.系統(tǒng)P2V過程
系統(tǒng)備份 在PowerVM P2V過程中,涉及到操作系統(tǒng)及業(yè)務(wù)數(shù)據(jù)的遷移,建議在實施PowerVM P2V之前,進行數(shù)據(jù)備份。應(yīng)用業(yè)務(wù)數(shù)據(jù)使用磁帶庫進行備份,操作系統(tǒng)可使用磁帶或NIM服務(wù)器做mksysb備份。在PowerVM P2V過程中,多數(shù)情況涉及到異機遷移,需要將操作系統(tǒng)恢復(fù)至其他服務(wù)器的分區(qū)上,因此,建議使用NIM做備份,以便于新虛擬化分區(qū)操作系統(tǒng)的重新部署。
分區(qū)創(chuàng)建或Profile修改 根據(jù)分區(qū)規(guī)劃配置表,在Power服務(wù)器上劃分新的分區(qū);如果分區(qū)仍部署于原來的服務(wù)器上,則需要修改分區(qū)的Profile配置,調(diào)整計算及IO資源的定義。
恢復(fù)操作系統(tǒng) 如果涉及異機遷移,則首先要恢復(fù)分區(qū)的操作系統(tǒng)。恢復(fù)操作系統(tǒng)可采用重新安裝AIX,重新部署、配置應(yīng)用的方式進行;也可以采用直接使用mksysb備份進行恢復(fù),優(yōu)點是實施速度快,與原有系統(tǒng)保持高度一致。
網(wǎng)絡(luò)配置遷移 網(wǎng)絡(luò)遷移過程中,需要將原有的物理網(wǎng)卡IP地址等配置遷移至虛擬網(wǎng)卡,由于改變了網(wǎng)絡(luò)配置,一般需要停止業(yè)務(wù)。
存儲設(shè)備遷移 首先是在線遷移。如果分區(qū)在遷移過程中,仍部署在原有的物理服務(wù)器上,可實現(xiàn)存儲的在線遷移,優(yōu)點是可以減少停機時間,缺點是需要現(xiàn)有磁盤相同數(shù)量的存儲空間。具體操作步驟為:首先由VIOS以vSCSI或NPVI方式將磁盤映射至分區(qū);然后在分區(qū)操作系統(tǒng)層面做VG的磁盤鏡像;最后在分區(qū)操作系統(tǒng)層面做VG中拆除原關(guān)磁盤鏡像,并從VG中刪除。
其次是停業(yè)務(wù)遷移。停機遷移的優(yōu)點是不需要額外的磁盤空間,缺點是在重新映射磁盤過程中,需要刪除原有磁盤,因此需要停止應(yīng)用運行。具體操作步驟為:首先停止應(yīng)用系統(tǒng),在操作系統(tǒng)上刪除原磁盤定義;然后由VIOS以vSCSI或NPVI方式磁盤映射至分區(qū);最后在分區(qū)上重新認盤,恢復(fù)業(yè)務(wù)運行。
系統(tǒng)重啟 在分區(qū)完成遷移之后,建議停止分區(qū),并重新啟動操作系統(tǒng),以驗證虛所擬化分區(qū) Profile配置已生效,同時,驗證啟動過程是否正常。
結(jié)語
PowerVM是一個高效的虛擬化平臺,經(jīng)過系統(tǒng)P2V遷移過程,可以將傳統(tǒng)分區(qū)遷移至PowerVM環(huán)境,從而提高應(yīng)用系統(tǒng)的可用性,提高Power服務(wù)器的整體運算效能。