對于我們這些已經在IT領域中工作很長時間的人來說,虛擬化技術已經為保護虛擬機和保證應用程序正常運行提供了很大幫助。但是一套可靠的VMware備份和恢復計劃可以保證在數據中心遭遇災難襲擊之后能夠迅速恢復。
使用像VMware高可用性、DRS和vMotion這樣的技術可以讓我們在保持現有系統架構的情況下,同時提供幾乎100%的可用性。而在十年之前,想要為用戶提供這樣的高可用性和正常運行服務等級幾乎是不可想象的。此外,硬件可靠性和運行速度方面的提升也使得我們可以更好、更快地完成任務。
但是在其提供這些特性的同時,也存在一定風險。當基礎設施處在系統的自動控制之下,而系統升級變成例行程序并且毫無危險性之后,這樣很容易讓人變得掉以輕心。然而,我們還是要保持警惕,因為對于處理重大問題能力的要求并不會降低。
據我所知,許多虛擬化特性的前提都是保證共享存儲的可用性。存儲的冗余技術可以進一步保證其可靠性。但是如果你的大部分存儲突然發(fā)生故障將會怎樣?硬件故障最終會導致虛擬機無法使用,毫無疑問,你的用戶將會非常失望。不論你基礎設施架構經過了怎樣的精心架構,有時還是會發(fā)生一些糟糕的事情。我們可以從一些已經發(fā)生的、沒有使用虛擬化技術的事件當中學習可能挽救整個環(huán)境的經驗教訓。
保存?zhèn)浞莶⑶覝y試恢復計劃
曾經——也就是上世紀90年代——備份和恢復還是IT部門日常工作的一個重要組成部分。制作備份、服務器崩潰、重新部署服務器、恢復文件,不斷重復著這個循環(huán)。但是現在擁有了硬件冗余技術和實現可靠性之后,我們很容易忽視常規(guī)的備份任務。然而,備份任務應該成為你的虛擬環(huán)境中一個不可或缺的組成部分,以防止發(fā)生系統性的基礎設施故障。除了將備份文件存儲在和虛擬機同樣的存儲設備之外,管理員還應該在遠離基礎設施的地方保存?zhèn)浞菸募膹捅?,以防止數據中心發(fā)生災難。
備份系統利用了vCenter在連接和管理方面的優(yōu)勢,以及簡化虛擬機磁盤備份等特性,在過去的幾年中已經實現了很快的發(fā)展。如果想要創(chuàng)建一個可靠、支持VMware的備份平臺,需要在前期花費足夠的時間來確保構建一套完善、可靠和易于恢復的虛擬機備份方案。在發(fā)生重大災難時,異地備份可能會成為你最后的希望,所以要確保其能夠發(fā)揮作用。
還需要花費一些時間對虛擬機恢復流程進行周期性測試。而測試過程不應僅針對一個單獨的文件,而是整個機器。要記住這個IT領域中的定律:“沒有人會關心備份。他們只關心恢復!”確保你的恢復計劃可以正常工作——并且熟悉最適合于自己環(huán)境的恢復流程——可以為你的環(huán)境盡快重新上線提供極大地幫助。
物理還是虛擬vCneter?
現在已經有很多種方式可以對vCenter進行虛擬化,但是我相信仍然保留一些物理服務器會更加有意義,這其中就包括vCenter服務器。擁有一臺不依賴于共享存儲和主機的服務器可以幫助提供更好的穩(wěn)定性。
保證vCenter管理工具和操作環(huán)境的分離可以幫助在操作環(huán)境中進行快速和簡單的故障分析。在發(fā)生災難之后如果不需要首先考慮如何重新部署vCenter,而只需要關注如何恢復或者重新部署虛擬機,事情將會變得簡單很多。當然,這也需要為vCenter制定一套良好的備份和恢復方案,還有硬件冗余特性。
全面檢查基礎設施
我建議所有管理員都從全局角度來分析自己的基礎設施,尋找潛在的薄弱環(huán)節(jié),特別是任何單點故障。避免只關注于那些技術細節(jié),但是忽視了整體架構。要問自己:如果整個系統發(fā)生故障,我該怎樣做?使用這個問題來引導自己改善現有環(huán)境,保證用戶滿意。