雖然數據中心備份是基本數據保護策略的一個核心要素,但主要關注數據保護,保護和可用性的企業戰略集團(ESG)的資深分析師杰森·布福因森解釋了為什么存儲快照和復制也是必須一樣策略的原因。
人們可能聽說過存儲快照并不是備份的口頭禪。這當然是真的,但存儲快照在現代數據保護中越來越重要。根據企業戰略集團的數據,10個組織中有9個組織使用以存儲為中心的保護技術(快照或復制)來補充高度虛擬化環境中的數據備份措施。
存檔與備份,以及為什么人們需要了解二者之間的差異
從數據備份中區分數據備份是IT專業人員在數據恢復方面所遇見的最常見的問題之一。而人們需要知道為什么需要了解兩者之間的區別,以及為組織構建或優化最佳數據歸檔策略獲得重要提示和最佳實踐。
雖然備份繼續支持每個組織的數據保護策略,但存儲快照通常是確保IT基礎架構的可靠保護和快速恢復的一種補充方法。此外,快照與復制是現代數據保護的基礎。
快照的工作原理
雖然粒度細節可能略有不同,但快照本質上是表示文件系統或卷看起來像在一個特定時間點的磁盤塊的集合。無論應用程序,虛擬化層或其他抽象層,幾乎所有的存儲產品都可以歸結為文件系統,其中各個文件和文件夾實際上由存儲系統本身上的盤塊內保存的相關數據塊組成。要明確的是,這些可以是存儲陣列內的物理塊或軟件定義的存儲或虛擬設備平臺內的虛擬化塊。訪問文件,文件夾和數據的關鍵是磁盤映射,指向塊的本身,并駐留所選文件系統中。
簡單地說,假設一個75kB文件的數據分布在三個32kB磁盤塊上。所有高層訪問方法(包括文件信息,屬性和元數據以及應用程序相關性)都包含在由操作系統驅動的文件系統中,該操作系統將文件提供為結構化或非結構化數據。文件系統本身僅包含“文件”的條目和到三個磁盤塊的順序指針,這三個磁盤塊隨機分布在實際存儲介質上。可以將快照視為這三個塊的“凍結”內容,以及元數據和指針。
文件的中間塊更改后,也許在文件系統下,第一個和第三個塊保留,但第二個塊現在包含新數據。快照過程保留塊的副本,因此可以通過簡單地重新連接三個原始數據塊將文件“恢復”到以前的時間點。在充分披露后,快照幾乎總是發生在卷級別,而不是一個文件級以上例子描述。這個解釋適用于兩者,并且可以通過以下的“快照如何工作”更好地理解。
為什么快照很重要
根據調查機構ESG公司的研究,67%的服務器具有不到兩個小時的停機容錯,如調查的停機時間容錯。
雖然備份系統通常可以處理兩個小時以上的恢復率,但是在七個服務器中只有一個容忍由傳統備份機制強制停機6小時以上的時間窗口。并且因為備份數據將在替代硬件或服務上比原始數據駐留更容易壓縮和可存儲的狀態,所以即使是從備份數據進行最快的恢復也有一些實際的限制。另外,恢復到以前的快照的時間為幾分鐘或更少的時間,因未塊位于與主數據相同的陣列內。雖然逆轉從快照看起來肯定比從備份的恢復更好,但有一些常見的權衡:
·本地漏洞。根據定義,備份是在其他位置保存的副本,快照駐留在與生產數據相同的存儲中介質中,如果生產陣列被阻礙,快照將不可用。
·存儲消耗。有些與此相關,雖然備份經常對其存儲庫使用不同類別的存儲介質,但是快照總是在生產環境的高性能存儲系統內消耗容量。
·保護頻率。由于高級的存儲消耗,大多數組織將保留快照中的數據以天計算,與備份的月份或年份相比,存儲時間較短。也就是說,用戶可以在白天(每隔幾個小時或每15分鐘一次)存儲一次快照,而不太頻繁和典型的夜間備份操作。
在使用快照時,大多數組織應該使用快照作為他們最好的存儲方式,這個近乎即時的相對最近的數據可恢復性,然后將備份(甚至從磁盤)作為恢復的第二個選項。他們還應該將快照與備份結合起來,以確保數據在陣列外部可生存時間更長。
區分快照機制
快照方法中的一個可區別的特征是寫入時復制(CoW)與寫時重寫(RoW),基本上涉及當寫入新數據時磁盤塊的行為。
參考一下前面的例子:
·將需要三個磁盤塊的文件寫入塊A,B和C.
·調用快照,可能是由于存儲用戶界面中的策略或與存儲陣列集成的備份應用程序。
·文件已更新,需要替換邏輯文件中間的信息。
如果存儲系統使用寫入時復制,將發生以下情況:
·磁盤塊B的內容將復制到卷上的其他位置-新塊“D”。
·更新的文件數據寫入現有塊B-覆蓋現在已在其他位置保存的初始數據。
·通過將新數據寫入塊B,可以順序訪問這三個塊(ABC)。
或者,如果存儲系統使用寫入重定向,則需要滿足以下條件:
·新數據立即寫入新塊D.
·文件系統中的指針現在指示文件由塊“ADC”組成,原始塊B保留為快照。
通過將更改重定向到新塊,在生產使用期間不必在存儲系統中進行額外的I/O操作。
從歷史上看,額外的I/O導致明顯的碎片化,導致一些存儲系統執行回收或重組任務,特別是當文件系統保持在單個陣列(例如,個人計算機與多軸陣列)上時。在CoW和RoW示例中,當快照保留窗口已經過期(例如,在72小時的時間內至少已發生一個備份)時,磁盤系統回收作為自由空間的塊(CoW中的D,RoW中的B)快照指針將消失。
如何從快照獲得更多
從快照啟用的兩個常見功能包括克隆和可移動的快照。
·克隆,提供了各種品牌的術語,通常指使用快照功能用于除數據恢復之外的目的。許多組織希望將其數據副本用于應用程序開發,補丁測試,報告和分析等。但是他們不能承受所有的增量存儲容納不同的副本,也不想承受I/O從生產系統傳輸所有的數據。相反,因為快照字面上是指向塊的指針,所以這些指針通常可以被暴露為第二個文件系統(即,克隆),而不占用任何額外的存儲容量。雖然生產用戶繼續訪問實時數據,但開發人員,分析人員和其他受益人可以訪問克隆用于其目的,假定存儲陣列可以確保足夠的IOPS,以免阻礙生產環境的運行。雖然新數據可能會消耗少量的增量存儲,但它通常是臨時性的,并且遠遠少于創建數據集的完整新副本。
·盡管技術上不是快照的一部分,復制的塊本身通常被供應商所吹捧,往往被吹捧的供應商提供更有效的比基于文件的復制技術所執行的更高級別的功能。在存儲產品中通常是相同的基礎技術,用于管理作為快照編織在一起或傳輸以進行復制的塊功能。
·移動快照利用基于塊的一些陣列復制,但也復制從第二個數組重建相同快照所需的元數據和指針。或者,可以每小時在主陣列上配置快照,但僅在非現場二次陣列上每四個小時調用快照,在需要備份進行還原之前需要更長的保留時間。
上面描述的所有內容(CoW與RoW,克隆,復制等)特定于各個陣列的機制,但是,如前所述,快照通常與傳統的備份機制相結合,用于更靈活和全面的恢復場景。歷史上,存儲管理員使用獨立于備份管理員界面,采用供應商陣列的特定工具專門管理許多組織的快照。如今,許多領先的備份軟件產品集成了主流存儲產品的可管理性及其快照功能。雖然支持集成管理的陣列有很大差異,快照管理功能的集成和可擴展性也是如此,更常見的配置允許以下內容:
·單個管理UI(備份控制臺),用于通過類似于計劃備份方式的策略配置快照計劃,從而獲得所有每日,每周和每月恢復點(來自備份)和每小時恢復點(從快照)。
·單個目錄,其中主存儲上的快照迭代被視為恢復的另一個來源,以及備份軟件本機使用的任何磁盤,磁帶或云存儲。也就是說,關于目錄的可用性,供應商之間存在很大差異,其中一些備份界面與正確的存儲陣列相結合,可以呈現所有文件及其在每個快照中的版本的索引。其他組合在備份管理員手動安裝之前,無法查看快照。
恢復(來自備份)不能夠滿足業務部門的當前服務級別,特別是對于數據庫或虛擬化主機等核心平臺。然而,必須為那些事務應用程序提供額外的技術調整,由此存儲快照供應商向數據庫或管理程序層提供集成擴展,因此快照具有其處于最佳可行狀態的數據。這樣做,許多備份應用程序可以從快照中恢復單個項目,因為它們可以從自己的備份存儲介質中恢復,這是將數據保護策略現代化的整個過程。