線性磁帶文件系統(LTFS)使得磁帶看上去像一個文件系統,其所支持的拖放操作和NAS共享系統十分類似。LTFS技術目前已經在歸檔應用中產生了積極的影響,并且我們將會很快看到其應用在更多更廣泛的領域中。
LTFS伴隨著線性磁帶開放協議(LTO)驅動第五代發布,迄今面市已有三年之久。作為文件系統,LTFS業已成熟,并且現已支持諸如Windows、Linux和Macintosh等核心操作系統。而目前,兼容LTFS的LTO-6將會把磁帶重新打造成主數據中心的存儲設備,并可能將磁帶的應用延伸至其原來的備份和歸檔以外。
什么是LTFS?
LTFS旨在簡化終端用戶和磁帶設備間的交互方式。LTFS的設計者希望將磁帶變得像USB閃存那樣易于使用:插入就可以寫入數據。不過考慮到磁帶的容量,數據會以TB為單位計算而非USB閃存GB的數量級。在很大程度上,LTFS達到了這一目標。終端用戶在LTO-5或LTO-6磁帶驅動器中簡單地插入一塊LTFS格式的磁帶,一分鐘后LTFS的可用容量就會顯示在用戶的桌面上。從而其可以像外部的磁盤驅動器或閃存那樣提供瀏覽,只是速率會略慢一些。
LTFS依托于前一代LTO的兩項變化。首先是在磁帶上創建分區,LTFS使用其中一個來存儲寫入磁帶的各種文件的目錄信息。其次是在上述主流操作系統上一系列的驅動器。
當安裝驅動器并將磁帶插入磁帶驅動器時,驅動器讀取日志分區并展示一個類似用戶瀏覽磁盤或USB驅動器的文件夾結構。文件可以在磁帶空間中像磁盤驅動器一樣進行拖拽,并且驅動器會更新目錄并將數據存儲在磁帶上。
外部存儲為什么如此重要?
在當今的數據中心里,備份和復制全天近乎實時在運行。這也使得數據幾乎零丟失以及應用可用性變得相對容易。但雖有強大的數據中心管理,創建近乎實時副本的能力仍具有一定風險。因此對于外部存儲仍有特定需求,而磁帶,尤其是LTFS的磁帶正在這一領域和其它外部存儲技術激烈地競爭著。
首先,由于不斷重復的存儲備份和復制,數據的錯誤修改或損壞可能會立即傳播到整個基礎架構中,這使得“最后一次正確的副本”幾乎無處可尋。甚至有可能在意外刪除后,數據從整個系統環境中就徹底清除了。同樣,病毒的感染也可能會復制到拷貝數據集,這些都引發了對無關離線數據拷貝的需求,可以對上述情況完全免疫。
第二種應用場景是由于數據增長速度已超過可用的廣域網(WAN)帶寬。雖然帶寬已經得以提升,并且目前能夠依賴增量復制確保二級站點和主站點之間秒級的同步,但有時仍需將完整的數據集傳輸至另一站點。例如在云存儲設備上部署基準數據,在協同企業內共享大型項目,或在電子發現過程中傳輸法律文件。在這類情況下聯邦快遞的卡車一整晚所傳遞的帶寬量遠勝于目前最快的城域網互聯。在這種潮流下,也就需要一種可以方便傳輸的存儲設備。
最后還要在財務現實性角度考慮在數年中存儲如此多的副本數據。除了磁盤容量本身的物理成本,數據中心的占地空間成本、電力及制冷同樣代價高昂。隨著走向大數據的實時分析,更需要確保更多的在線數據。不過同樣還有其它的數據集合是用于已知的恢復節點或是同一文件的副本,無需保持在線。當理解這種場景后,將非分析數據盡可能多地遷移到外部、離線和密集型設備上的策略就顯得很有意義。例如,數據庫備份在進行了兩三次甚至更多次的備份后,鮮有在線保存的意義,不必要將大量的副本放置在磁盤或可用于立刻恢復的介質上。
LTFS優勢
LTFS格式的磁帶相較于其它外部存儲設備有著諸多優勢。首先,磁帶設計之初就定位于離線設備,并且可以放置于托架上。而外部存儲則無法斷電并在托架上保存數年之久。在安裝合適的LTFS驅動器后,磁帶可以插入到任意的LTO-5或LTO-6驅動器中讀取。而不需要特定的應用程序,這也消除了磁帶長期以來一塊巨大的短板,即需要在讀取相應格式應用程序的所有位置上運行特定的軟件。
一塊LTFS格式的LTO-6磁帶可以存儲2.5TB的非壓縮數據,而壓縮數據可存儲6TB。這意味著許多數據中心可以將其所有的數據都存放到聯邦快遞的一個小包裹中。同時,磁帶能承受顛簸,較其它移動存儲更適合運輸。同樣,LTFS使得發送和接受方的數據中心不再需要運行同樣的應用程序來訪問磁帶上的數據。
雖然重復數據刪除技術可以通過消除磁盤上的冗余拷貝,使得存儲更為高效,但這種技術很少會部署在主存儲上。通常一份單獨的文件會保存在主存儲、二級存儲和備份存儲上,每一份都必須運行其單獨的重復刪除程序。磁帶可以確保一份清潔的、不用存儲在任何形式磁盤而只需要保存的數據。磁帶的成本和容量都使得這些“以防萬一”的副本存儲不會代價高昂。
使用LTFS的歸檔
之前所引用的LTFS應用案例都不需要任何額外的軟件,只要使用免費的LTFS驅動程序。歸檔應用程序供應商已經快速采用了LTFS相關的協議以使其產品更具吸引力。其中的大部分整合所選擇的磁盤系統中,和磁帶庫一同工作,自動化地遷移在磁盤和磁帶中的數據。
從用戶界面角度看,歸檔就像用戶網絡上額外的一個NFS或CIFS掛載點。數據會基于策略自動拷貝到某盤或數盤磁帶上,并同時在磁盤上保存用于更快地存取。隨著磁盤內的數據飽和,數據會再次基于策略從磁盤上移除,并只保留在磁帶上。
將磁盤和磁帶整合為單一掛載點的技術由來已久。雖然磁盤和磁帶匹配的歸檔產品只是在一些細分市場中獲得成功,但更廣泛的應用很大程度上受阻于歸檔產品本身將數據寫入磁帶的方式。這意味著應用程序需要運行數十年之久,雖然很少有產品會有這么長的生命周期。
LTFS則完全消除了這種擔憂。如果歸檔應用程序將數據輸出為LTFS格式,其可以在應用程序中自由遷移,或發送到某個沒有應用程序的站點。這項功能允許用戶基于環境改變選擇不同的應用程序。其同時迫使歸檔應用程序供應商從開發角度上保持競爭力,而且允許不同企業之間不用安裝相同的應用程序就可以遷移項目數據。
LTFS的未來
LTFS備份。LTFS下一步是讓備份應用程序供應商來制定標準。這將使得數據可移植性在備份應用中和其在歸檔應用中同樣得以保證。數據中心在決定更換備份應用時,其都要考慮使用舊的應用程序運行單個副本的成本,即便是備份到磁盤,因為絕大多數備份供應商都會使用專用的格式再寫入磁盤和磁帶。而LTFS允許用戶能夠簡單地在磁帶上保存歷史備份,并在需要時直接導入到新的應用程序中。
整合LTFS的NAS。存儲管理員面臨的一項最大挑戰就是要跟上不斷增長的非結構化數據的節奏。很多這種數據并不需要高性能的硬件。一種理想的解決方案是集成磁帶的NAS,從本質上講這其實可看作上述歸檔案例中的主存儲版本,不過有更快的速度和更大的磁盤緩存。這樣數據可以被自動地保護并最終從主存儲遷出。你可以想象下一款高速而高性價比的固態驅動器作為主存儲層,而之前的數據會遷出保存在LTFS磁帶,而無需IT人員的手動干預。
直接執行。LTFS的最終演進是在磁帶設備上直接執行數據操作,甚至直接修改。這意味著數據在恢復之前無需重新存儲回磁盤區域。舉例來說,對一項視頻文件的流化處理,而不用先移動到磁盤上面。在理想情況下,需要從歸檔中查找信息而不用恢復。數據庫應用直接訪問LTFS就可以實現這點,將其數據庫擴展到磁帶,并支持直接在磁帶上檢索舊的記錄或文檔。另一項實例是應用Microsoft sharePoint的Remote BLOB存儲特性來遷移舊的文檔或文檔副本到基于磁帶的存儲區域。
LTFS的真相
LTFS或許會改變數據中心使用磁帶的方式以及對磁帶的定義。在過去,LTO和其它磁帶格式代表著笨拙、緩慢和難以處理。而現在通過LTFS,能夠很簡易地和磁帶進行互操作,就像其它存儲設備那樣。其直接應用于數據傳輸量大而帶寬緩慢的場景。同時也能廣泛使用在備份和歸檔流程,以及可能用于數據庫和文件系統訪問數據。