在現(xiàn)代IT中,虛擬化是行業(yè)標(biāo)準(zhǔn)。IT管理員應(yīng)關(guān)注虛擬化挑戰(zhàn),例如無響應(yīng)虛擬機(jī)、虛擬機(jī)網(wǎng)絡(luò)延遲、巨型虛擬機(jī)、資源爭用和僵尸虛擬機(jī),以確保其虛擬系統(tǒng)成功運(yùn)行。否則,這些系統(tǒng)可能面臨性能低下的風(fēng)險,這可能會導(dǎo)致嚴(yán)重問題。
虛擬化為管理員提供了很多好處,例如專用服務(wù)器、快速部署和重新部署、更低的成本、更快的備份和更高的生產(chǎn)率。但有時候,上述挑戰(zhàn)可能會抵消這些好處。管理員必須謹(jǐn)慎地監(jiān)視其系統(tǒng),以避免系統(tǒng)過載,并且,應(yīng)采取特定策略(例如VM標(biāo)簽)來幫助緩解問題。
VM內(nèi)資源爭用
主要虛擬化挑戰(zhàn)之一是存儲陣列內(nèi)缺乏資源,這也是VM內(nèi)大多數(shù)性能問題的原因。通常,虛擬化主機(jī)具有有限的硬件資源池。因此,給定系統(tǒng)內(nèi)的每個VM必須共享這些資源。如果虛擬機(jī)生成大量IOPS請求,則這些虛擬機(jī)可能會淹沒存儲陣列。
為了解決這個問題,管理員可以將VM移動到擁有足夠資源的存儲陣列以處理其VM。此外,管理員還可通過特定的性能監(jiān)視工具,查看VM所需的IOPS數(shù)量。這些工具還可以對比管理員的工作負(fù)載與其存儲硬件的功能。
通過監(jiān)視他們的系統(tǒng),管理員可以在出現(xiàn)性能問題之前轉(zhuǎn)移VM,并避免資源爭用。
無響應(yīng)VM
鎖定或無響應(yīng)VM任務(wù)會導(dǎo)致凍結(jié)VM。在某些情況下,來賓OS也可能拒絕響應(yīng),這可能導(dǎo)致管理員難以停止、重新啟動或關(guān)閉和開啟無響應(yīng)VM。VM無響應(yīng)可能是出于多種原因,例如主機(jī)服務(wù)器上的存儲、網(wǎng)絡(luò)和可用資源問題。當(dāng)VM凍結(jié)時,某些管理員可能會選擇通過管理程序界面終止VM進(jìn)程,但這應(yīng)該是最后的選擇。
在采取行動前,管理員應(yīng)首先確定存在一個還是多個無響應(yīng)的VM。如果在單臺主機(jī)服務(wù)器多個VM無響應(yīng),則問題很可能是由主機(jī)服務(wù)本身引起的。如果虛擬機(jī)可通過特定接口做出響應(yīng),則管理員可以在管理程序控制臺上通過檢查日志或錯誤消息來定位問題。
當(dāng)管理員縮小問題范圍后,他們就可以發(fā)現(xiàn)導(dǎo)致虛擬機(jī)無響應(yīng)的根本原因。如果管理員無法定位問題,則應(yīng)考慮特定任務(wù)是否導(dǎo)致主機(jī)內(nèi)的VM凍結(jié)。然后,管理員可以檢查VM及其主機(jī)系統(tǒng)的配置,以確保有足夠的資源可用。最后,管理員應(yīng)檢查其網(wǎng)絡(luò)和共享存儲是否支持所有VM。
虛擬機(jī)網(wǎng)絡(luò)延遲
虛擬機(jī)需要網(wǎng)絡(luò)訪問才能運(yùn)行,而延長ping響應(yīng)時間等問題可能會導(dǎo)致性能問題,進(jìn)而影響管理員系統(tǒng)的運(yùn)作。為了解決虛擬機(jī)網(wǎng)絡(luò)延遲,管理員必須首先排除其系統(tǒng)中的所有LAN問題。
網(wǎng)絡(luò)擁塞(例如繁忙的反惡意軟件)通常會導(dǎo)致網(wǎng)絡(luò)延遲。管理員可能還會發(fā)現(xiàn),IP沖突以及網(wǎng)絡(luò)設(shè)備故障或配置不當(dāng)會導(dǎo)致網(wǎng)絡(luò)延遲。此外,虛擬處理器的過度使用可能會造成問題。當(dāng)主機(jī)系統(tǒng)為某些VM提供的虛擬處理器數(shù)量超過所需數(shù)量時,其他VM可能沒有足夠的處理器時間。
當(dāng)管理員確定網(wǎng)絡(luò)延遲的原因,他們就可以將問題隔離到主機(jī)服務(wù)器硬件。例如,輸入/輸出系統(tǒng)配置不當(dāng)、網(wǎng)絡(luò)端口配置不正確以及VM驅(qū)動程序過期等問題都可能導(dǎo)致網(wǎng)絡(luò)延遲。對于Windows Server環(huán)境,網(wǎng)絡(luò)延遲的常見原因來自電源計劃問題。如果電源計劃設(shè)置不正確(例如設(shè)置為平衡),可能會導(dǎo)致性能問題。管理員應(yīng)該將電源計劃設(shè)置為高性能,以減少網(wǎng)絡(luò)延遲。
巨型VM和應(yīng)用程序殺手
巨型VM運(yùn)行8個以上的vCPU和255 GB的虛擬RAM,通常管理員使用它們來運(yùn)行需要大量CPU和內(nèi)存資源的應(yīng)用程序。但是由于資源調(diào)度問題,巨型VM也可能導(dǎo)致性能問題。為了更好地管理巨型虛擬機(jī),管理員必須參考vRealize Operations(vROps)、CPU和內(nèi)存需求指標(biāo)以對巨型虛擬機(jī)進(jìn)行調(diào)整。
此外,虛擬系統(tǒng)可能包含多個性能殺手,這些性能殺手會嚴(yán)重影響應(yīng)用程序的運(yùn)行。如果管理員遇到性能延遲,則可以采取自上而下的方法來找出問題,從應(yīng)用程序堆棧開始,然后向下移至OS堆棧、VM堆棧、ESXi堆棧,最后是基礎(chǔ)架構(gòu)。管理員找出問題后,便可以使用ESXi命令行和vROp等工具來修復(fù)性能問題。
僵尸虛擬機(jī)和VM蔓延
僵尸VM不會執(zhí)行任何有用的任務(wù),但是會消耗寶貴的系統(tǒng)資源。基本上,管理員在棄用一個虛擬機(jī)時會創(chuàng)建一個僵尸虛擬機(jī)。自動化是現(xiàn)代IT的重要組成部分,管理員現(xiàn)在可以自動創(chuàng)建大量VM。因此,管理員可能無法跟蹤系統(tǒng)中的VM,而這可能導(dǎo)致虛擬化蔓延(VM sprawl)。
跟蹤這些僵尸VM并減少VM蔓延是很困難的工作,不過,管理員可以使用VM標(biāo)簽更輕松地跟蹤VM。管理員創(chuàng)建虛擬機(jī)后,可將獨(dú)特標(biāo)簽附加到每個虛擬機(jī)上,以幫助確定虛擬機(jī)的確切用途。如果管理員在創(chuàng)建VM時沒有使用VM標(biāo)簽,則他們必須監(jiān)視整個系統(tǒng)的異常性能行為。例如,如果管理員注意到其系統(tǒng)的CPU、內(nèi)存和網(wǎng)絡(luò)內(nèi)部的性能問題,則可能表明僵尸VM和VM蔓延。
但是管理員不應(yīng)立即終止所有虛擬機(jī)。Backup Active Directory控制器和域名系統(tǒng)服務(wù)器不會一直保持活動狀態(tài)。管理員必須密切監(jiān)視其系統(tǒng),在確定存在僵尸虛擬機(jī)后,他們應(yīng)斷開虛擬機(jī)與網(wǎng)絡(luò)的連接,并將虛擬機(jī)移動到磁盤上來測試虛擬機(jī),以確保它們不會產(chǎn)生負(fù)面影響。