存儲分層對于我們并不陌生。其指的是將數據存儲基礎架構配置成一組“層級”,每層由一組介質(內存、磁盤或磁帶)組成,其性能、容量和成本各不相同。
建立好分層后,分層存儲會將數據遷移到速度較慢但容量更大且更便宜的存儲層上。這種遷移動作的觸發因素可以是一些簡單的標準,比如文件元數據屬性中的“數據最后訪問時間”或“數據最后修改時間”(將很少訪問文件辨識出來并安全地遷移到較低的性能層),或者也可以精細地對業務數據內容進行分析,以及在應用程序中預定義信息生命周期管理政策。
存儲分層技術可以追溯到當初的大型機計算時代。早先IBM的大型機操作系統可以通過系統托管存儲和分層存儲管理(HSM)直接支持分層。隨著分布式計算體系架構的興起,這類存儲分層模式逐漸被淘汰。而實際應用中又局限于早期的網絡互連以及服務器背板速率對數據遷移的限制。此外,分布式存儲缺少廠商無關的存儲標準服務或者存儲資源管理(SRM)模板,這些技術可以使得不同廠商的存儲產品之間實現管理有序的數據遷移。
雖然互聯帶寬在這些年不斷改善,不同存儲(尤其是不同廠商之間的產品)之間的數據遷移對于傳統的分層存儲模式以及有效的容量利用(將合適的數據存放在合適的存儲上)而言仍是不小的障礙。即便如此,最近存儲的發展,包括存儲容量的需求增長以及現有陣列端不斷提升的存儲成本,使得分層存儲技術再次受到關注。
這種關注是那些提供存儲分層產品的供應商的動力之一。有些供應商熱衷于推廣第0層存儲,這種陣列完全由閃存和內存式固態驅動器組成。第0層陣列被視為初始寫入后用作高I/O的應用,尤其是在虛擬服務器負載環境中,可以用來提升I/O性能。
另一些供應商則推出多層存儲陣列——這種陣列柜中包含SSD,以及小容量/高速磁盤以及大容量/低速磁盤,所有這些磁盤柜都集中在同一機柜內——能一站式滿足用戶的各項需求。正如所料,這種在每個磁盤柜中的存儲介質(高速磁盤驅動器、大容量驅動器以及SSD)比起在傳統陣列中的同款產品,價格要高出很多,這在很大程度上歸因于廠商在陣列驅動器上所隱含的分層軟件的開銷。
在一些廠商的字典中,分層還有另一層含義,表示使用由DRAM或閃存SSD所組成的緩存來臨時存儲將要寫入磁盤的數據,這樣就可以同時接受多個訪問請求。這種“熱點數據”會臨時性寫入第0層存儲(內存),為多用戶請求提供比磁盤快很多的高速I/O訪問。當請求數量下降時,數據被判斷為“冷”,訪問會被重新定位到原始的磁盤介質上。通過這種混合技術,以內存擴展磁盤性能,可以獲取業內最高的讀寫性能而又無需為并行訪問配置過多的條帶化磁盤驅動器。
分層存儲模式
如果你想在你的存儲基礎架構中部署高速存儲分層,需要考慮以下幾點:
1、了解哪些數據需要遷移。只是根據“最近訪問的數據”指定遷移策略可能并不是最好的方式,因為可能需要排除應用軟件和其它文件。可以從各種正式的SRM軟件包中獲取報告,找出應當在高速存儲中駐留的數據。然后和數據管理者確認數據是否能安全地進行遷移。對于有些文件,即便其在90天內沒有使用,可能也需登記在內。
2、了解你的存儲以及向哪里遷移數據。有一些陣列允許數據簡易交互,而另一些則會要求目標存儲和數據原存儲陣列出自同一廠商。在有些陣列中,廠商使用“開放API接口”,允許各種應用將數據寫入其中,不過部署“封閉式API接口”會使得你的數據局限在某個陣列上。所以你需要理解HSM環境中每臺目標陣列的功能和限制。
3、建模、模擬和測試。HSM軟件包中通常有免費的使用時間,可以用以測試HSM環境。在遷移到生產系統之前應當對HSM環境進行充分測試。如果缺少了這個前提工作,你很可能會將文件移到較低的存儲層,而用其它內容填補上層存儲,當你要運行一項關鍵的年終匯報,不得不將原本降級的文件重新提升到原存儲層時,卻發現沒有空間了。為了避免分層存儲成為一部“血淚史”,請盡量耐心地測試每個步驟。
分層存儲的真正挑戰:明確使用目的
在最后的分析中,如果撇開混合技術,存儲分層這一廣泛使用的術語并沒有什么實際價值。在有些情況下,其被認為是一種降低容量需求或提供容量分配有效性的策略。從技術上看,這兩者在分層存儲模式中都難以實現。雖然將數據遷移到較低的存儲層或許可以節省上層空間,不過這絕非存儲分層的核心目的。相反,分層技術致力于將存儲置于合適的層級,使得數據訪問頻率和介質成本實現從商業角度來看是最高效的混合兼顧。因此,其宗旨是改善利用效率而非分配效率。
而另一部分廠商則從相反的角度出發,將存儲分層劃為歸檔技術,這很容易引起誤解。在HSM環境中,數據根據訪問頻率從高速存儲層移動到低速層。而歸檔通常是根據業務重要性程度而非單純的訪問頻率確定目標的一組數據集合。使用業務數據內容的信息生命周期管理策略或許能產生更合理的歸檔策略;而非HSM這種模式。
值得一提的是,IBM推出的線性磁帶文件系統(LTFS)增強了分層存儲模式的應用領域。對于各種文件,在超過半數的新文件被創建并存儲的今天,磁帶文件存儲利用磁帶庫配合前端LTFS服務器可以提供超高容量的存儲平臺,并較磁盤陣列實現總體應用成本的顯著降低。考慮到用戶文件的重復利用率在創建后的10到30天內顯著下降,像NAS平臺將舊文件遷移到磁帶系統中就很有意義。
雖然LTFS的倡導者中包含主動歸檔聯盟等,而事實上,LTFS磁帶仍是根據訪問頻率進行存儲分層和容量利用率的。隨著LTFS文件存儲的推出,存儲分層或許能夠實現其長久以來一直所倡導的商業價值。