戴爾-EMC公司正在著手打造一套2 TIERS軟件抽象層,旨在借此解決閃存之上一級存儲數據與對象陣列中大規模之間愈發嚴重的分裂問題。
其起步解決方案是將SAN磁盤或者混合型閃存/磁盤陣列進一步拆分為多臺陣列,這主要是考慮到一級數據速度需求不斷提升、而二級數據存儲容量快速增長的現實壓力。
根據戴爾-EMC公司的設計規劃,其中一臺陣列專門負責實現一級數據閃存存儲,并被定名為熱邊緣或者快速層。
另一臺陣列則面向存證地磁盤之上且經由對象存儲系統進行言說聽二級(近線)數據,其可以內部或者外部形式存在且數據訪問速度更慢,但每GB資源使用成本則遠低于熱邊緣存儲。
戴爾-EMC公司將此稱為冷核心或者容量層,其同時亦在著手打造一款2 TIERS抽象層用以實現這一目標。以下為戴爾-EMC方面公布的一份演示文稿:
我們對于演示文稿中提到出的第三點并不認同,因為內部文件或者塊訪問高容量磁盤并非被云存儲所替代,而是被可進行內部或外部(云端)部署的對象訪問型高容量磁盤所替代。
EMC方面認為,熱邊緣方案的存儲容量區間應該是在數百TB級別,而容量層的容量水平則要高得多; 預計可能達到數百PB。
將有一個統一的抽象層掌控元數據,用于指示數據條目位于哪個層以及層中的哪個具體位置。各數據條目隨后會被分配單一全局命名空間,此空間可容納數萬億個對象。此層中的代碼亦會將數據根據需求在不同層間移動,具體依據一套策略驅動型自動化數據放置(分層)方法。
EMC方面認為,利用其它方案以邏輯方式將兩層加以統一會耗盡位于熱邊緣的元數據空間,進而引發額外元數據被放置在容量層內,最終導致訪問速度緩慢。而解決這一難題的作法并非增加快速層內的元數據存儲空間,而是對元數據進行緩存。
要實現這樣的效果,其設想訪問快速層的一組客戶端服務器會利用RDMA訪問向一臺共享式DSSD陣列發送請求,或者利用ScaleIO訪問一臺虛擬閃存SAN以整合各本地直接附加閃存驅動器。
直接整合或者網絡附加型快速層存儲原理圖。
在此之后是一個基于對象存儲的容量層,其可以由一臺Isilon陣列或者一臺ECS向外擴展商用設備集群充當。這兩種層皆可分別實現擴展或者收縮。
需要注意的是,這套縮減閃存快速層容量的整體模式在一定程度上類似于昆騰公司的StorNext產品,其專門面向娛樂與媒體工作流市場。
每臺服務器都會訪問2 TIERS軟件,后者通過一個POSIX API與單一命名空間為服務器應用提供SAN,同時亦利用策略驅動型分層機制將陳舊或者不必要的數據發送至容量層。其會將指向數據的應用訪問映射至容量層中的對應對象。
這款EMC軟件利用一套分布式Orange文件系統配合運行于本地FUSE文件系統之上的一項只讀、通讀型翻譯服務,從而建立起快速層。這項服務采用動態負載命名空間(簡稱DLN)以實現元數據分層。DLN指向的是全局命名空間中的一部分,例如文件系統中的子樹。在此部分中包含指向對象的指針,例如文件系統目錄中的inode。
我們尚不清楚DLN如何實現加載或者預讀取。
利用這套2 TIERS模式,EMC公司推薦了兩種實例化思路,即利用DSSD快速層配合Isilon或者ECS容量層:
戴爾-EMC 2 TIERS示例
另一種備選方案是利用Omnibond的CloudyCluster——專門負責將OrangeFS部署在AWS當中——托管整套體系。
總體來講,這是一套面向后SAN/后NAS陣列內部或者公有云世界的解決方案。其SAN/文件系統被拆分為兩大類,且在邏輯層面利用2 TIERS軟件實現這種SAN拆分。
評論觀點
這種富有想象力的存儲方案正是我們期待從EMC身上所看到的,而且目前尚無其它主流競爭對手擁有與之等同的解決方案。事實上,惟一能夠在創新層面與之相匹敵的只有HPE的服務器事業部,其開發出了Synergy方案。
如果戴爾將EMC的這一發明應用至服務器,那么HPE無疑需要保持警惕。同樣的,如果HPE方面將其Synergy納入自家存儲產品,則戴爾-EMC亦將面臨嚴酷的競爭壓力。
順帶一提,戴爾-EMC方面已經注冊了2 TIERS商標。