當第一次考慮使用云服務進行數據歸檔時,我承認對采用這種方法是否明智和其實用性持懷疑態度。但云服務確實給IT企業提供了許多便利。但是,每種類型的數據存儲需求,包括主數據、備份、災難恢復、數據歸檔,都有很大不同。這就意味著,在你選擇云服務進行數據歸檔或存儲之前,一定要確保你所選擇的服務適合你的數據保護需求。
當然,所需的保護方式取決于你存儲數據的類型。在云端存儲的數據類型包括:
數據備份,用于系統崩潰后的數據恢復;
災難恢復,用以自然災害或意外斷電后的數據保護和維護業務連續性;
數據歸檔,用于存儲和存取以達到長期保存的目的。毫無疑問,數據歸檔是數據管理員一個長期的、持續不斷的策略,以當企業需要時能保證數據的可讀性和可用性。在考慮把云服務作為一個適當的方式之前,企業需要認清檔案系統的實質,以及其向云端進行數據歸檔的優點和風險。
檔案系統是什么?歸檔市場是當今存儲行業中增長最快的市場之一。也許正是因為如此,“存檔”一詞常常被替換成其他的名稱以適應各種新發布的產品。根據歸檔含義,這之中很多都不是真正意義上的檔案系統。檔案系統集合了存儲和管理數據的方法,以確保托管在該系統中的數據在任何時候都可讀并可用。存儲介質、特定的供應商、硬件和用于檢索軟件以及管理技巧都是確保數據完整性和可用性的重要因素。這些步驟包括:
數據完整性監測;
存儲介質完好性監測;
硬件和軟件的技術遷移策略;
智能索引(需要數據時能迅速找到;
以及保證足夠冗余防止數據丟失的主動監測。數據存儲在場外的AIT - 1磁帶上,而又不用AIT - 1驅動器和軟件索引該數據,這并不是歸檔系統,而是不正確的數據管理。該磁帶上的數據是不可索引,也無法讀取。自從其從磁帶驅動器或磁帶庫中遷移過來,就不能使用任何方法來驗證數據的持續完整性。相反,真正的歸檔系統能夠通過可靠的遷移和數據監測確保歸檔數據的完好和可存取性,即使系統改變也不會有任何影響。
關于歸檔的一個常見的誤解是,存儲在歸檔系統中的數據時最后的一份,也是唯一的副本。其實完全不是那么回事兒。歸檔應用程序通常依賴于系統內數據的多個副本。這點非常重要,因為數據的完整性可通過對比兩個數據副本的散列值來進行檢測。因此,利用多個副本,數據管理軟件在歸檔時可主動監測并修復數據損壞。
目前的技術能主動監測媒質的生命周期和其上面的數據情況,以確保在災難發生后,數據能夠恢復到原有的平臺。但是,這項技術只能監測磁帶庫中的數據。其不能監測庫外的磁帶存儲,除非有這么一項策略,周期性地庫外的磁帶定期放入庫中進行檢測。
考慮到海量的歸檔數據保護需求,建立一個歸檔系統可能讓人猶豫不決。即使存儲系統可以恢復數據,但其仍存在重建環境需要使用數據的問題。虛擬環境在重建備份系統方面發揮關鍵作用,使其能夠讀取歸檔數據。例如,想象一下10年前設計的工程示意圖。如果沒有恰當的操作系統和軟件來查看數據的話,現代化系統毫無價值。但是,虛擬化環境能夠創建恢復備份數據系統,以達到歸檔數據讀取和恢復的目的。
云適合何種情況?云是一個用于存儲數據的商業模式。無論是因為易用性、靈活性、應用程序托管或其他常見原因而遷移到云端,云提供了一個企業不需要花費大量的前期投資或對他們的IT設備進行大更換就能滿足其需求的模式。在日常生活中,企業和個人無論是因為缺乏專業的知識不足以管理還是不愿管理,都可以付費讓第三方來進行管理。這就比方說:很多人都為其家庭或企業聘請清潔服務,這并不是因為它很便宜,而是因為他們沒有時間或不愿做。但這里面總會有一些風險(就如你雇傭了清潔服務,可能會丟東西一樣)。
正是因為考慮到這些風險,就要求企業必須事先評估云歸棟服務。如果你了解云歸檔服務的一些原則,利用服務水平協議(SLA)確保數據被妥善管理,那么云服務是一個恰當的選擇。你能確定的是,不管怎樣,歸檔數據每年都會增長。即使數據保留期滿了,但根據目前的數據增長速度的趨勢,新的傳輸到云端的數據量將大大超過被清除的數據量。從經濟角度看的話,其意味著云歸檔成本只會不斷增加。此外,存儲容量靈活性的價值將越來越小,因為存儲歸檔需求比其他任何數據類型都更可預測。
首先,歸檔數據必須妥善管理。如果你不能肯定云服務能夠提供必要的數據管理,那么你應該謹慎行事。畢竟,數據對數據擁有者非常重要,但對服務提供商來說就不是那么回事。不管歸檔是選擇云服務還是內部管理,重點在于歸檔數據的培養過程,而不是具體的解決方案。只要歸檔數據被妥善管理,云歸檔服務只是一個恰當的商業策略,根據不同企業不同的預算和人員需求,其實用性會有所不同。