在管理員的所有工作中,虛擬機備份很容易就會忘記,尤其是數據中心采用數據復制時更是如此。然而,復制并未解決所有問題。備份的主要目的是創建重要數據的副本,黑客無法在線獲取這些數據副本,在遇到軟件問題或者系統管理員偶爾犯的錯誤時備份能夠派上用場。提及數據備份、云以及虛擬環境自身存在挑戰。虛擬機是臨時的但數據是永恒的。系統管理員需要合理的虛擬機備份策略以確保所有備份得到正確的處理。
管理虛擬系統時的焦點是加強數據管理。計算出需要保存哪些數據以及主要的副本存在什么地方是很重要的。關鍵問題是基于恢復點目標策略確定備份頻率,不同數據集的備份頻率是不一樣的。如果復制策略合理,將數據復制到多個區域,那么很多故障機制比如硬件或電力問題就無效了。
多區域復制及快照作為備份策略的一部分
多區域復制以及頻繁的快照,提供了很好的可用性及數據完整性。快照限制了軟件事件的曝光,同時提供了可控的回滾。不幸的是,黑客事件截然不同,因為,正如某些最近備受矚目的事件所展示的那樣,黑客可能好幾天或者甚至數周都沒有被注意到。當然多區域復制對于純粹的私有云或者虛擬服務器集群來說可能并不輕松,它們往往傾向于重新強調將備份作為一種保護方式。
處理這些問題的關鍵是確定攻擊何時開始,提供一個基準的數據存儲視圖,然后了解受攻擊影響的數據集。這時良好的數據備份集就能夠脫穎而出。在很多情況下,我們通過恢復工具的強大程度來衡量備份軟件的優劣。
虛擬環境中的備份策略包括兩部分。存儲在網絡存儲中的數據能夠在存儲設備中被保護,簡化多臺機器共享數據的保護并提供更簡便的恢復工具。另一方面,針對特定虛擬機的數據文件需要采取與處理服務器文件類似的方式進行處理。尤其是本地實例存儲用存儲虛擬機時更應該如此。
網絡存儲最好通過快照處理,然后再進行備份。如果需要恢復,應該保持數據的一致性。增量備份通過廣域網保存,與數據災備遷移到遠端站點之前是否被遷移到本地數據存儲無關。
很多租戶需要訪問虛擬機池時,數據管理往往缺乏組織性,網絡存儲備份缺少處理碎片數據圖的可見性。這時最好的選擇是采用虛擬機備份。有兩種選擇:一種選擇是備份每臺機器上所選擇的文件;另一種選擇是只備份整個虛擬機。通常會選擇后一種,原因是易于設置、管理而且更為重要的是容易恢復。
經常犯的一個錯誤是假定虛擬機就像遺留環境一樣。管理員使用傳統的備份工具,在虛擬機中配置代理。在很多情況下,這些工具往往是過期的—版本滯后很多—因此穩定性是能夠實現的。由于云及虛擬環境中軟件快速更新,無法使用專門用于高效備份的API,這可能會放慢自動運維的腳步。
有很多工具支持虛擬機備份。和hypervisor廠商一樣,大型云供應商也提供了他們自己的產品。第三方工具利用API并提供他們自己的數據保護方式,尤其是在恢復領域更是如此。
最后一個問題是備份路徑。廣域網性能無法跟上流量需求的腳步,尤其是在美國更是如此。對于公有云虛擬機來說這不是什么問題,它們能夠利用本地存儲池作為備份流程的第一步,然后使用云與生俱來的多區域性將數據遷移到遠程站點。公有云還可以用于歸檔存儲,例如谷歌最近已經實現只需要很低的成本就能夠使得訪問歸檔數據的速度非常接近于在線數據。
對于私有云以及更簡單的虛擬集群來說,本地備份是近期的選擇,將未整合的數據傳輸到公有云作為一種選擇,但轉向混合云開辟了內部云存儲戰場,在多地域及易用性方面獲得了額外的福利。最終,云存儲有太多無法忽視的優勢,最終可能會停止使用本地存儲機制以及磁帶庫,用云備份網關取代,就像是它們自己在虛擬機中運行一樣。將備份緩存在本地的原因是最近的備份主要用于恢復數據。