管理虛擬環(huán)境并不輕松。即使部署規(guī)模很小,管理員仍舊需要注意很多發(fā)生在幕后的故事。不進(jìn)行合理的規(guī)劃并密切關(guān)注變化情況,即使是很小的問(wèn)題也可能導(dǎo)致失控。
我們向顧問(wèn)專家委員會(huì)了解了他們所見(jiàn)到的最為常見(jiàn)的錯(cuò)誤以及如何避免。
Jason Helmick:缺少對(duì)配置管理的規(guī)劃
如果不對(duì)配置管理進(jìn)行規(guī)劃,那么距離犯錯(cuò)就不遠(yuǎn)了。無(wú)論是公有云還是私有云,你必須規(guī)劃虛擬環(huán)境的服務(wù)器配置并掌控變化。詢問(wèn)Linux專家,他們將會(huì)花很長(zhǎng)時(shí)間向你表述Puppet或者Chef的優(yōu)勢(shì)。詢問(wèn)有經(jīng)驗(yàn)的Windows管理員,他們同樣會(huì)向你講述DSC的優(yōu)勢(shì)。
你需要能夠采用準(zhǔn)確的配置快速、輕松地部署服務(wù)器,而不是冗長(zhǎng)復(fù)雜的腳本以及漫長(zhǎng)的平臺(tái)測(cè)試。你還需要控制服務(wù)器隨時(shí)間變化而發(fā)生的改變。有管理員做出調(diào)整并導(dǎo)致服務(wù)器脫離最優(yōu)配置嗎?
虛擬環(huán)境出現(xiàn)問(wèn)題時(shí),你要問(wèn)的第一個(gè)問(wèn)題就是“發(fā)生了哪些改變?”硬件罷工的情況是很少見(jiàn)的,大多數(shù)服務(wù)中斷是由于某些人對(duì)配置進(jìn)行了有意或無(wú)意的調(diào)整。 避免這些中斷并采用合理的配置對(duì)環(huán)境進(jìn)行更好的控制。可以選擇相應(yīng)的工具:Puppet、Chef或者DSC。無(wú)論選擇哪一個(gè),在出問(wèn)題之前先要做好配置 管理。
Brian Kirsch:小心問(wèn)題陷阱
在當(dāng)今的虛擬環(huán)境中,軟件安裝、配置及維護(hù)帶來(lái)很少的問(wèn)題。虛擬化方面逐步采用配置向?qū)б约邦A(yù)配置設(shè)備,專家以外的人都能夠創(chuàng)建并維護(hù)虛擬環(huán)境了。這恰恰是問(wèn)題所在。技術(shù)不存在問(wèn)題,存在問(wèn)題的是合規(guī)性。外表簡(jiǎn)單可能意味著底層很復(fù)雜,問(wèn)題恰如冰山一角。
盡管虛擬環(huán)境看起來(lái)很簡(jiǎn)單,但安裝、配置及管理卻很復(fù)雜。在理想情況下,我們不會(huì)發(fā)現(xiàn)任何問(wèn)題因?yàn)橐磺卸颊!5谏洗螜z查時(shí)我發(fā)現(xiàn)了問(wèn)題,這意味必須有 人修復(fù)。技術(shù)人員必須與顧問(wèn)以及廠商一同查找出現(xiàn)的問(wèn)題,這時(shí)對(duì)底層知識(shí)了解的越多越好。這并不是說(shuō)你必須能夠自己解決該問(wèn)題,但能夠正確地定位問(wèn)題是恢 復(fù)系統(tǒng)的一個(gè)關(guān)鍵步驟。
通過(guò)采用虛擬化或者將核心生產(chǎn)應(yīng)用遷移到云服務(wù),企業(yè)能夠避免大多數(shù)頭痛的問(wèn)題。這消除了犯錯(cuò)及維護(hù)的可能性,大量的可用云服務(wù)為組織提供了滿足需求的現(xiàn)代數(shù)據(jù)中心。盡管這些云服務(wù)發(fā)生中斷的現(xiàn)象非常罕見(jiàn),但在將核心生產(chǎn)應(yīng)用遷移到云中之前我還會(huì)再三考慮。
組織開(kāi)始采取虛擬化路線,無(wú)論是私有云還是公有云,一定要確保員工經(jīng)過(guò)了很好的培訓(xùn),他們不需要是每個(gè)方面的專家,但也不應(yīng)該對(duì)此感到畏懼。虛擬化能夠?yàn)榻M織提供令人驚嘆的優(yōu)勢(shì),但是需要進(jìn)行很好的控制否則可能會(huì)變成可怕的怪獸。
Rob McShinsky:忽視虛擬基礎(chǔ)設(shè)施
你可能犯的最大的錯(cuò)誤就是忽視虛擬基礎(chǔ)設(shè)施。服務(wù)器使用時(shí)間逐漸增加,你可能會(huì)繼續(xù)使用舊固件、很少打補(bǔ)丁,對(duì)存儲(chǔ)或網(wǎng)絡(luò)疏于管理因?yàn)閱闻_(tái)服務(wù)器只運(yùn)行著一個(gè)應(yīng)用。在采用服務(wù)器虛擬化后 忽視這些基本的工作可能會(huì)影響性能,更糟糕的是可能會(huì)導(dǎo)致上百臺(tái)服務(wù)器宕機(jī)。所有的hypervisor、服務(wù)器以及存儲(chǔ)一直在革新,同時(shí)會(huì)發(fā)現(xiàn)bug。 運(yùn)行在基礎(chǔ)設(shè)施之上的虛擬機(jī)工作負(fù)載數(shù)量同樣呈級(jí)數(shù)增長(zhǎng),由于虛擬環(huán)境涉及眾多硬件,難怪會(huì)出現(xiàn)問(wèn)題導(dǎo)致宕機(jī)或者影響性能了。
關(guān)鍵是對(duì)基礎(chǔ)設(shè)施有一個(gè)全面的了解,同時(shí)要關(guān)注性能臨界值。如果環(huán)境未發(fā)生任何變化但你突然發(fā)現(xiàn)運(yùn)行不穩(wěn)定的情況,那么要了解可能是哪個(gè)資源層負(fù)載過(guò)高導(dǎo) 致出現(xiàn)了性能問(wèn)題。為開(kāi)展此項(xiàng)工作,你需要選擇具備診斷功能并能夠進(jìn)行趨勢(shì)分析的監(jiān)控工具。這些工具能夠提高工作效率,消除日常管理之痛。
Dave Sobel:環(huán)境的清單缺少管理及維護(hù)
我所發(fā)現(xiàn)的管理虛擬環(huán)境最大的錯(cuò)誤就是沒(méi)有一個(gè)系統(tǒng)來(lái)管理并維護(hù)環(huán)境的清單及相關(guān)信息。中小企業(yè)不會(huì)部署系統(tǒng)來(lái)記錄系統(tǒng)配置信息、使用情況或者主機(jī)的物理位置。發(fā)生災(zāi)難時(shí),這些信息對(duì)快速恢復(fù)至關(guān)重要,不幸的是這一工作往往被忽略掉了。