隨著全球數據總量的爆炸式增長,我們必須改變對相關信息的保護方式。
過去五年以來,應用程序的規范已經迎來徹底轉變。如今,我們需要在應用當中實現更多敏捷性、可擴展性與可用性要求。在如今這個時代,應用的主要趨勢開始轉向社交平臺、移動設備與軟件即服務(簡稱SaaS)。另外,其需要有能力從各種來源處獲取批量數據,同時實時處理以提供背景信息或者業務洞穴能力,借此建立競爭優勢。為了滿足這些新型需求,企業無法再單純依賴于傳統關系型數據庫。有鑒于此,一系列新型數據庫系統應運而生,其本質上具備分布式與橫向擴展特性,能夠被部署在商用硬件之上,同時提供可協調的統一性與性能調整機制。更重要的是,為了滿足敏捷性需求,云端數據庫即服務模式亦得到廣泛采用。
為了幫助大家理解這場分布式數據庫變革的規模之大,我們整理出了以下圖表,可以看到NoSQL類搜索數量正呈現出急劇上升之勢。
這意味著數據保護要求已經徹底改變,且受到數據至上時代的大力推動(包括Web規模應用以及分布式數據庫)。企業需要收集大量數據并從中獲取有價值信息,用以帶來更為可觀的商業價值以及更為迅捷的決策制定能力。大部分分布式與云數據庫已經提供復制功能,用于滿足數據保護及可用性要求。然而,我們仍然需要解決可擴展時間點備份與恢復這一重大難題。如果沒有時間點備份的支持,企業將時刻面臨著因人為錯誤、邏輯損壞或者其它運營故障造成的數據丟失風險。
傳統備份解決方案主要面向關系型數據庫設計,即面向共享式存儲并采用ACID事務模型。遺憾的是,這類設計無法滿足分布式場景下的時間點備份要求(包括本地存儲、最終一致性以及基礎設施的彈性特質)。
考慮到數據庫架構已經發生本質性轉變,數據保護舉措亦需要進行重新定義與重新設計。以下為數據保護在大數據時代下面臨的新挑戰:
·獲取最終一致性數據庫的一套持久性時間點備份副本,我們將其稱為當前全新分布式時代下數據保護的“版本控制”新規范:備份到快照到復制到復制數據管理再到版本控制。
·最大程度降低故障恢復時間(即低RTO)。
·隨應用程序的實際需求進行規模擴展。
·允許輕松更新測試/開發環境以實現持續開發。
·在發生故障時提供運營彈性。
·提供立足于公有云或者內部數據中心的部署靈活性。
大多數企業正在積極投資企業級時間點備份與恢復產品,從而確保自身能夠安心在分布式數據庫之上部署并擴展下一代應用程序。在未來五年內,各企業將重新定義數據保護技術,從而切實滿足下一代應用的實際需要。