如果想要讓備份和災難恢復正常運行,那么保證數據同步則是必須做到的。下文中所介紹的一些技巧將有助于IT團隊確保數據一致。
在一個理想的世界中,如果用戶的混合云平臺的一部分發生問題,整個系統的處理速度會有所減慢,然后系統會進行自動恢復,因為平臺的其他部分會承擔相應負載;或者在公共云的應用中,相應工作負載會被遷移至其他可用區域。但是,在實際應用中,在混合云備份和災難恢復中確保數據一致性是具有相當大難度的。
在不同云平臺直接的數據傳輸可能需要花費很長的時間,特別是在大量數據傳輸中表現得更為明顯。例如,配備兩個本地副本的存儲系統可以在幾毫秒內完成一次寫操作,而一個三副本的系統則需要花上10秒鐘以上。
解決這一問題的一個常用方法就是讓遠程副本具有最終的一致性。但是這一做法會留下幾分鐘到幾個小時的同步空白區,也就是在這個時間段內存在著數據不同步。混合云備份和災難恢復應用方案主要依靠的就是使用遠程副本;管理混合云中靜態運行部分的云供應商必須確保數據一致性。但是,確保本地部署私有云部分的數據一致性就是用戶的責任了。
確保數據一致的最佳做法
在混合云備份和災難恢復中,數據管理會變得更為復雜,因為用戶有可能都會在公共云或私有云中存儲數據。例如,一個常見的問題就是如何避免數據備份與數據集歸檔副本之間的差異。
為了做到這一點,我們應當了解數據集是如何變化的以及新數據是什么。在這里,用戶會對一個日志文件進行寫操作,但易于發生中斷,所以在文件關閉之前不會被傳輸到混合云平臺的其他部分。但是,采用一個堅固的設計和頻繁的傳輸機制就可以減少恢復點目標。
例如,在整個城市的托管設施中托管日志服務器可在幾秒鐘內提供RPO。托管供應商可能會使用不間斷電源系統并維護WAN鏈路,所以數據受到了良好的保護。創建這個日志服務器的方法有很多,但是其中一種方法就是使用托管服務器并將更新轉發至公共云。此外,為了防范黑客和敲詐,可考慮使用具有連續備份選項的軟件,這也就彌補了托管日志方法的不足之處。
當你在公共云中托管時,這個問題就更加深入了。請確保云服務供應商所采取的數據保護措施與用戶自己的保護措施類似。云供應商們在內部基礎設施方面并不是很開放,但是用戶應當了解他們是如何保護他們的同步數據并確保其與公共云數據的一致性,這一點是至關重要的。例如,在域間同步和在混合云環境中訪問這兩者之間是可能存在重大差異的。
類似地,云服務供應商也擁有著具有高可用性的日志服務器。但是,在混合云環境中,用戶可能需要一個軟件工具來將日志文件轉發至其他云或私有部分。隨著混合云變得更為強大以及對象存儲被允許跨多個區域連接,這個問題可能會消失。與此同時,用戶可能會在不同公共區域中遇到volatile文件的另外一個副本。
采取預防措施鎖定機制可防止跨所有云環境的多個用戶同時更新數據,并防止不確定結果的出現。如需創建一個單一的一致性數據集,應將時間點快照應用于所有云環境的相關存儲資源。
通常,快照會按照所有變更的時間順序記錄下所有的變更,但是用戶可以從主分支中恢復快照,并應用不會直接進入主分支的變更。用戶可以在開發工作或備份應用中使用一個臨時版本。在用戶應用時間點快照之后,可將一個完全恢復版本用于日志文件變更的位置。用戶可以使用這些鎖定機制來檢查一致性,雖然這有可能是不必要的。
恢復快照也可用于備份。可在任何云環境中創建恢復快照,但請記住云中的虛擬機在性能和存儲吞吐量方面存在著顯著的差異。此外,云服務供應商們在計算性能和存儲速度方面也存在著很大的不同。如果沒有采取特殊措施,工作運行有可能會變慢,或者如果選項發生變化,那么就可能會中斷備份窗口。
通過采用上述這些方法,我們就能夠在混合云備份和災難恢復應用中保持較低的RPO。自動恢復還不可用,但對于每一家主流的云服務供應商來說,這只不過是實際問題。