多年來,IT最佳實踐宣稱:數據備份和歸檔是兩個絕對不應相互交織的、截然不同的功能。
然而,這種傳統思維更多的是基于對備份架構的功能的過時看法。
現在,隨著更多的可擴展的軟件索引,再加上具有成本效益的、能夠處理混合工作負載和開放格式磁帶的磁盤備份設備,重新思考傳統思維并最終合并這兩個過程是否正當其時?
融合數據備份和存檔的價值
在確定合并備份和歸檔是否可能之前,應該考慮這樣做的價值。從融合數據備份和歸檔之中可以獲得什么?
第一個大收獲是數據只須被移動一次。如果沒有融合,數據會被反復地備份,在被確定適合歸檔的時候,會被再次拷貝。
第二個大收獲將會是消除多個存儲筒倉。可以同時存放備份和存檔的單個筒倉將大大地降低成本。
第三,適當的數據管理的最佳實踐是:歸檔只存放一份被歸檔的數據的副本。這意味著它從生產存儲和備份存儲中被移開。因此,存檔需要被保護,要么通過復制,要么通過把數據拷貝到另外一個存檔存儲區域。這是一個問題,尤其是對于磁盤歸檔而言。數據可以被復制到另外一個磁盤歸檔(昂貴的)或者“備份”到另外一個磁盤歸檔(復雜且容易出錯)。
融合的最終結果?顯著降低資金和運營成本,并且簡化IT流程。
備份和存檔可以被融合嗎?
在合并數據備份和歸檔的時候,第一項要克服的挑戰是確保軟件可以執行該任務。
備份是這個過程中關鍵的第一步,因為數據必須安全地被存放在備用的存儲設備上。這意味著如果合并備份和歸檔,必須發生在備份軟件之中。
這在過去是不可能的,因為備份應用程序只有相對簡單的數據庫,無法滿足跟蹤數以百萬計的文件的需求。即使備份軟件具備這些功能,用于備份服務器的典型的硬件也無法提供這個應用程序所需要的動力。
時移勢易。許多現代備份應用程序有非常可伸縮數據庫,可以跟蹤數以萬億計的對象。從服務器的角度來看,即使是適度的服務器硬件現在也適合托管該應用程序及其數據庫。
第二項挑戰是確保備份硬件(磁盤和磁帶)可以滿足需求并協同工作來控制存儲的成本。基于磁盤的備份系統成為初始備份和工作集的一個理想的著陸點。同時,多虧了橫向擴展技術,它們可以繼續為可預見的未來存放數據。
許多基于磁盤的備份系統現在可以支持備份和歸檔工作負載之間的差異。檢查的重點是系統的重復數據刪除引擎的可伸縮性。在組合環境中,將要跟蹤有數百萬個(如果不是數十億個的話)文件,因此重復數據刪除引擎可能會不堪重負。規劃者需要尋找可以分割數據的重復數據刪除引擎,這樣他們就不必管理所有的數據,或者尋找可以真正的擴展來滿足管理數以萬億計的文件的要求的引擎。
第三項挑戰是備份和歸檔可讀性。大多數備份和歸檔應用程序以專有的格式寫入數據。然而,這種專有的格式的使用正在發生變化。越來越多的虛擬化備份廠商以虛擬機管理程序直接可讀的本機的格式寫入備份。與此同時,越來越多的歸檔廠商正在以被稱為LTFS(Linear Tape File System,線性磁帶文件系統)的標準格式把數據寫入磁帶。現在很多磁帶廠商支持LTFS或者表示支持的設想。
缺少了什么?
缺少的關鍵組成是:備份軟件表現得更像歸檔軟件。這意味著對數據要有更多的文件級別的理解,以便可以根據文件的類型、位置和時長設置保留策略。有一些已經提供這種功能的備份應用程序,例如IBM的TSM和惠普的Data Protector。另一個關鍵要素是:這些應用程序以可以被操作系統讀取的本機格式寫入數據。
如何實現?
如果數據中心打算合并數據的備份和歸檔,有兩種可行的選項來實現這個目標。首先,IT規劃人員可以選擇提供可擴展的數據庫并同時支持磁盤和磁帶的備份軟件。他們也可能打算尋找可以跟蹤文件級別的數據的軟件。
一個替代方案可能是尋找合并磁盤和磁帶的歸檔產品。這些產品提供數據可以通過備份應用程序或一系列的腳本被發送到的、單獨的NFS / CIFS掛載點。該產品之后將管理數據從磁盤到磁帶的移動以及數據的保留。
結論
備份和存檔的融合可以顯著地降低管理成本以及與那些流程相關的硬件成本。事實上,有可以提供數據管理和集成各種備份和存檔硬件技術的備份軟件產品,例如索引和上下文級別(context-level)的搜索。
同時,Crossroads Systems公司和昆騰(Quantum)公司的那些歸檔產品已經演變成“另一個掛載點而已”。隱藏在這個掛載點背后的可以是廉價的磁盤、對象存儲甚至磁帶。數據可以通過簡單的拷貝命令或者使用應用程序的實用工具被轉存到這些存儲庫中,允許該存儲庫充當備份和存檔。可以對歸檔進行快照來提供時間點的回滾功能。