自從人們開始依靠技術來運營業務以來,備份,業務連續性(BC)和災難恢復(DR)已經成為30年來IT團隊工作的重要組成部分。傳統解決方案是針對內部部署基礎架構和結構化應用程序和關系數據庫而設計的,但IT世界正在發生變化。在數字化轉型的時代,人們需要重新思考和重塑基礎備份和恢復架構的工作量,這些工作負載轉移到了云端,并在云端誕生了應用程序。
改變了什么?備份與恢復
自從計算技術突飛猛進以來,應用程序和數據平臺發生了巨大的轉變。這其中有幾種因素:
•新的應用。第三代應用程序是地理分布式的,跨越多個系統進行擴展,始終處于開放狀態,通常部署在云端模式中。
•現有的應用程序正在轉向云端。他們沒有消失,但企業正在將部分或全部應用移動到云端。他們還需要備份和恢復。
•恢復時間目標(RTO)和恢復點目標(RPO)窗口正在縮小:企業希望“永遠在線”,而不是每天都進行夜間備份。
•規模較小的企業將全面采用公共云。中小型企業不希望因為IT業務影響主要業務。他們一直在推動云應用和平臺的快速發展。
•企業將構建混合云。企業將通過內部部署和公共云環境部署應用程序和數據。而規模,合規性和其他因素,意味著他們需要在系統內部保留一些系統。
•每個組織都會使用多個云。沒有人會愿意將他們的業務綁定在一個云端或一個提供商。即使現在,企業正在分散云計算和本地的工作負載。企業的開發和測試的業務可能只使用一個云端,而同一應用程序可能部署在私有云或不同的公共云中。
云計算對備份,恢復和連續性的影響
云計算為組織提供了更多的靈活性,運營節省和按需付費模式。公共云提供商也可以構建更具彈性的基礎架構。亞馬遜公司確保EC2的99.95%的可用性和S3的99.99%的可用性; S3設計用于11個9的數據安全和可靠性,具有多個可用區域。因為云計算是如此可靠,并且成本低廉,它很快成為本地數據的備份目標。但是,當企業在云端中運行應用程序時,這不應該讓企業相信備份和恢復是“內置的”。亞馬遜公司甚至建議為所有AWS本機應用程序和云數據庫提供備份服務。
雖然服務可用性和數據恢復能力解決了基礎架構業務連續性和災難恢復,但它不提供備份和恢復的時間點恢復或應用程序級智能。與云計算平臺一樣,它們不會防止邏輯錯誤。而研究顯示,10個錯誤中有8個是邏輯錯誤,數據損壞,用戶錯誤。
現有備份產品和云計算
如上所述,傳統的備份和恢復產品不能滿足云應用的需求,即使是移動到云端的現有應用,而不僅僅是因為它們建立在不同的時代。此外,云計算和分布式架構還面臨其他挑戰:
•云計算打破了基于媒體服務器的傳統解決方案架構。云計算的應用程序和數據沒有駐留在特定的陣列或磁盤上,因此用戶無法輕松備份所看不到的內容。備份也不能捕獲云中的配置數據,例如AWS Cloud Formation模板。
•云計算不會以相同的語言溝通。傳統解決方案采用磁帶,磁盤或虛擬磁盤。在云中的備份和恢復意味著采用正確的集成協議,例如S3 API或谷歌云存儲。
•備份設備無法移動到云端。現有的備份設備(如EMC Data Domain或NetBackup)在內部工作得非常好,無法被拾取并移動到云端。
•傳統備份代理不會擴展。如果用戶可以獲得在云中運行的備份代理,則可能會在數十個或可能數百個節點之間進行擴展。
•虛擬機不是正確的抽象層次: Datos IO CODR架構的核心原則是可擴展的以應用為中心的數據管理和數據保護視圖,需將其與傳統方法區分開來。這就是為什么CODR架構反思應用數據,并使用全局語義重復數據刪除來實現存儲效率的原因,而不是依靠將數據視為不透明對象(如VM或LUN)的傳統重復數據刪除技術。采用這種方法的好處是可以通過網絡鏈接覆蓋云層的精細粒度和高空間效率的數據保護。
•云計算網關或遷移服務:僅限于單向。
數據保護必須重新發布
云應用的備份和恢復問題很新穎,因為云計算備份和恢復架構應該具有三個關鍵因素:
•彈性計算。架構應該在彈性計算實例上有效地擴展。服務器或設備不應有任何資本支出費用。
•沒有媒介服務器。備份大型的橫向擴展的數據庫需要直接的并行流架構,以便在數據庫和輔助存儲之間進行數據移動。傳統的備份架構依賴于迅速成為阻塞點的媒介服務器。直接并行流并允許數據以原生格式保持可用。
•語義重復數據刪除橫向擴展應用程序數據庫通常具有3倍的復制因子。如果用戶備份單個節點或甚至管理整個數據庫的快照,則三分之二的備份數據是多余的。隨著時間的推移,備份將不會在分布式架構中運行語義,其重復數據刪除效率達到75%至80%。