Pray:虛擬化實現(xiàn)了更高可用性的平臺,使企業(yè)的基礎(chǔ)架構(gòu)更加穩(wěn)定。我們所有的機群都采用了VMware的高可用和DRS(Distributed Resource Scheduler,分布式資源調(diào)度器)技術(shù),不用再擔(dān)心單點故障的出現(xiàn)。
應(yīng)用的性能是否獲得了提升?
Pray:有些應(yīng)用的性能通過虛擬化得到了提升。即便算入虛擬化層所帶來的性能損耗,在應(yīng)用從較慢的舊服務(wù)器遷移到更快的新服務(wù)器上之后,無論是應(yīng)用負責(zé)人還是業(yè)務(wù)負責(zé)人都對應(yīng)用級的性能提升感到十分滿意。
虛擬化給災(zāi)難恢復(fù)戰(zhàn)略帶來了什么變化?
Pray:我們正在逐步推動災(zāi)難恢復(fù)的工作。最終的目標(biāo)是實現(xiàn)一主一備兩個站點,主站點在Cambridge而災(zāi)備站點在圣地亞哥。我們希望通過惠普EVA(Enterprise Virtual Array)虛擬盤陣完成存儲局域網(wǎng)內(nèi)的數(shù)據(jù)復(fù)制。而后會通過VMware Site Recovery Manager(SRM)來實現(xiàn)災(zāi)難恢復(fù)的機制,基于腳本完成向備份站點的遷移,包括IP地址和域名服務(wù)的變更以及存儲數(shù)據(jù)等。
現(xiàn)在SRM已經(jīng)部署完成,我們正向著最后的目標(biāo)邁進。而且,即使在虛擬化平臺上,我們傳統(tǒng)備份方式的速度也有所提高,由此可以預(yù)期系統(tǒng)中斷和恢復(fù)的時間會相應(yīng)減少。
管理這樣的環(huán)境會面對哪些困難?
Pray:管理虛擬化環(huán)境是非常困難的,涉及大量的遷移工作并且必須考慮周全。管理能夠為你帶來效率的提升,但是當(dāng)面對虛擬化這種新事物時,管理工作本身就會變得極具挑戰(zhàn)性。
對于容量以及虛擬化管理的其他方面,你采用了哪些工具?
Pray:我們使用了Akorri公司的BalancePoint來實現(xiàn)容量管理和監(jiān)控,其同時涵蓋了虛擬機和物理機的管理。我們還通過Groundwork(Open Source Inc的網(wǎng)絡(luò)監(jiān)控軟件)來構(gòu)建兩級的監(jiān)控體系,它從Orion(SolarWinds的網(wǎng)絡(luò)監(jiān)視工具)、VMware vSphere和Satellite Server(RedHat公司)獲取信息,然后對故障的服務(wù)、服務(wù)器和網(wǎng)絡(luò)連接進行告警。我們最近還購買了VKernel的容量管理套件來應(yīng)對這樣的問題 – “隨后的這幾個虛擬機該部署在哪里?”以及“下一步該對資源進行什么樣的調(diào)整和規(guī)劃?”
另外,我們還通過相應(yīng)工具來實現(xiàn)架構(gòu)的優(yōu)化,這方面的工作在虛擬化環(huán)境中很容易被忽視。通過對CPU、內(nèi)存、磁盤和網(wǎng)絡(luò)資源的調(diào)整,你可以根據(jù)當(dāng)前的資源消耗情況對未來需求狀況作出預(yù)計。當(dāng)標(biāo)準(zhǔn)差(standard deviation,反映數(shù)值集合的離散程度)過大或者設(shè)定的閾值被超出之后,就著手對過載的虛擬機進行優(yōu)化。這是虛擬化的根本目標(biāo)所在,即保證環(huán)境的精簡有序以及工作和對應(yīng)資源的準(zhǔn)確適配。
尋找精通虛擬環(huán)境管理的人才是否容易?
Pray:我已經(jīng)花了一年時間來尋找合適的全職和合同崗人選。虛擬化環(huán)境管理的技能要求非常高,不僅要熟悉VMware,還要對網(wǎng)絡(luò)、存儲、備份和操作系統(tǒng)有一定的了解,而這些技能是需要時日來逐漸積累的。我們所需要的是綜合上面各方面技能并能融會貫通的人才。
虛擬化環(huán)境的增速如何?
Pray:我們現(xiàn)在80%的環(huán)境都是虛擬化的,而且這個比例還在上升中。達成更高目標(biāo)是非常困難的,因為我們的系統(tǒng)十分龐大。我們有210個ESX sockets,大約涉及分布于3個數(shù)據(jù)中心的110臺服務(wù)器。實際上,我們最近有加入了7臺服務(wù)器,就是14個sockets,即總共有224個sockets。而另外還有16臺服務(wù)器的需求,即32個sockets。以上所說的只是ESX主機,還沒有涉及具體的虛擬機數(shù)量。
為了應(yīng)對這種虛擬化的部署速度,數(shù)據(jù)中心設(shè)計的政策和流程有什么變化?
Pray:政策和流程的變換跟不上日新月異的技術(shù)更新速度,因而總是處于追趕的狀態(tài)。無論是Vertex還是我曾經(jīng)工作過的其他公司,政策和流程總是隨著技術(shù)的演進而整體更新。經(jīng)驗豐富的管理員會在變化中適時調(diào)整,相應(yīng)的經(jīng)驗和教訓(xùn)有時就會被吸收到今后的策略中。
哪個虛擬化管理策略是由教訓(xùn)總結(jié)出來的,能不能舉個例子?
Pray:存儲命名規(guī)范就是一個例子。我曾經(jīng)同時管理三種不同的存儲陣列,通過vSphere識別特定存儲區(qū)域的不同屬性是非常困難的:存儲位置、磁盤類型、與ESX主機通信所用的協(xié)議類型以及具體用途(生產(chǎn)、驗證、虛擬數(shù)據(jù)庫服務(wù)器)等。因此,我首先就是對虛擬化環(huán)境中的數(shù)據(jù)存儲進行命名規(guī)范。這項工作的重要性隨著存儲規(guī)模的擴展而日益顯現(xiàn),否則根本無法管理分布在數(shù)個站點上的海量數(shù)據(jù)。
能否在虛擬化環(huán)境管理方面給其他人一點建議?
Pray:應(yīng)該注意標(biāo)準(zhǔn)化、命名規(guī)范和邏輯目錄結(jié)構(gòu)等方面。你必須確保一個全局一致的虛擬化環(huán)境和一個易于擴展的體系架構(gòu)。否則,一切將變得亂七八糟,而隨著時間的推移系統(tǒng)會變得越來越難以管理。而且,無論剛開始時規(guī)模多有大,記得都要統(tǒng)一命名規(guī)范,從而確保文件和目錄增長時你不會為此頭疼。