理想的世界中,如果混合云平臺的一部分出現問題,處理只會減慢,然后自動恢復,因為平臺的其他部分承擔負載,或者在公共云的情況下,隨著工作負載遷移到其他可用性區域。實際上,很難實現混合云備份和災難恢復的數據一致性。
在云平臺之間的廣域網數據傳輸可能需要很長時間,特別是大量傳輸。例如,具有兩個本地副本的存儲系統可以在幾毫秒內完成寫入操作,而三個副本系統需要10秒鐘以上。
解決此問題的一個常見方法是使遠程副本具有最終的一致性。但是這會留下幾分鐘到幾個小時的窗口,其數據不同步?;旌显苽浞莺蜑碾y恢復方案依賴于使用遠程副本;承載混合云的靜態業務部分的云計算提供商必須確保數據一致性。但是,這可能是組織對本地私有云部分的責任。
確保數據一致性的最佳實踐
混合云備份和災難恢復的數據管理變得更加復雜,因為用戶可以在公共云或私有云上存儲數據。例如,一個常見的問題是如何避免與數據集的備份和歸檔副本的分歧。
要做到這一點,要知道數據集已經改變了什么以及新數據是什么。寫入日志文件將在這里工作,但很容易中斷,并且可能在關閉之前不會傳輸到混合云平臺的另一部分。然而,堅實的設計和頻繁的傳輸可以減少恢復點目標(RPO)。
例如,在城市的托管設施中托管日記服務器可在幾秒鐘內提供恢復點目標(RPO)。托管提供商可能使用不間斷電源系統并維護廣域網鏈路,因此數據受到良好保護。創建此日志有不同的方法,但一種方法是使用托管服務器將更新轉發到公共云。此外,為了防止黑客和勒索軟件的攻擊,請考慮具有連續備份選項的軟件,這也將補充托管日記的方法。
當組織使用公共云時,問題就更深入了。確保云計算服務提供商采取類似于數據保護措施。云計算提供商在內部基礎設施方面不是很開放,但是了解如何保護同步的數據以便與公共云數據保持一致,這一點至關重要。例如,在混合環境中,域間同步和訪問之間可能存在重大差異。
可能,云計算服務提供商具有高可用性的日記服務器。但是在混合環境中,組織可能需要一個軟件工具來將日記轉發到其他云平臺或私有段。當混合云獲得動力時,這個問題可能會消失,并允許對象存儲跨越多個分段。在此期間,組織可能會遇到另一個公共區域中的易失性文件的額外副本。
采取預防措施
鎖定機制防止多個用戶更新所有云段中的數據,以防止不確定的結果。要創建一個單一的、一致的數據集,可以將時間點快照應用到所有云段中的相關存儲中。
通常,快照記住它們發生的序列中的所有更改,但可以從主分支恢復快照并應用不直接進入主分支的更改。組織可以使用臨時版本,用于開發工作或備份目標。在應用時間快照中的一個點之后,生成一個完全恢復的版本,應用于日志更改。組織可以使用這些鎖檢查一致性,盡管這不是必需的。
恢復的快照也用于備份。在任何云段中創建它,但請記住,云計算中的虛擬機在性能和存儲吞吐量方面有很大不同。云服務提供商在計算性能和存儲速度方面存在很大差異。如果不小心,工作將運行緩慢,或者如果選擇更改,可能會中斷備份窗口。
通過這些方法,可以在混合云備份和災難恢復方法中保持RPO的水平。自動恢復功能尚不可用,但對于每個主要的云服務提供商來說,這很可能即將出現。