云存儲如今已經不是什么新鮮的概念。而且,實際上對于用戶來說,也不需要理解這種概念的詳細內容。從使用者的角度來看,其實際上就是一種提供存儲業務的服務。不過,這卻在某種程度上對云存儲服務供應商提出了更高的要求。一方面,云存儲服務供應商需要為每一名用戶提供完善的支持,保證數百乃至上千用戶的訪問性能,按照服務級別協議(SLA)提供服務;另一方面,云存儲服務供應商自己也要關注存儲成本,以及管理的難易度,這在某種方面來說也是開源節流的方式之一。
云存儲業務模型
如果說云存儲是用戶方便且低成本的存儲選擇,那么,這些存儲難題也可以說是被轉嫁到了云存儲服務供應商身上。
在這種情形下,幾乎所有的云存儲供應商都將目光轉到了集群NAS上。
什么是集群NAS?
一般來說,集群NAS是一種松散耦合的計算節點集合。這里所說的松散耦合,其實基本理念同軟件工程里的概念有些相似。在集群NAS中,最小的單位個體是文件而非數據塊,每個節點都是獨立的實體且擁有無法被其它節點所訪問的一個或者多個卷。當用戶存儲數據時,數據會以文件形式存放于某個節點之上。出于數據保護的考慮,同一集群的其它節點上可能會有文件副本,但是卻無法以文件實例的形式提供給用戶。也就是說,集群NAS對節點的相互依賴和順序沒有特殊要求。這同數據塊方式操作的集群系統有著一定的區別。
這種工作方式對于大型的應用具有很高的實用價值,特別是連續的文件數據流。通過文件系統的調度算法,其可以將整個應用隔離成較小且并行的獨立任務,并將文件數據分配到各個集群節點上。目前,我們常見到其被應用于大型的數據庫查詢搜索、密集型的計算、生命科學、能源勘探以及動畫制作等領域。
對于集群NAS來說,硬件只是其中的一個部件,文件系統以及應用同樣是其有價值的組成部分。目前我們能夠經常見到的集群NAS產品包括,BlueArc的Titan和Mercury系列、HP的Ibrix系列、IBM的SoNAS、Isilon的IQ系列、NetApp的OntapGX等等。
集群NAS架構如何適應云存儲需求?
今年的集群NAS市場一掃往日的低迷,看起來一片紅火景象,這主要得益于一些大廠的切入,比如說戴爾,比如說HP,比如說IBM。
那么,這些大廠為什么會愿意同集群NAS扯上關系呢?我們可以從IBM對SoNAS的構想中得到一些答案。在同IBM系統與科技部大中華區存儲產品經理金微的交流中,他首先就把SoNAS同云存儲聯系到了一起。他認為,在目前的存儲形勢下,一方面大量非結構化數據持續增長,對于存儲系統的要求越來越高;另一方面,云存儲大規模的數據訪問也對存儲系統提出了要求。此外,包括賽門鐵克、Isilon等在內的其它廠商也都將集群NAS的應用領域提到了云存儲的級別上。
在當前各類產品都同云計算、云存儲扯上關系的時候,集群NAS應該是比較靠譜的應用選擇之一。
[page]
我們以SoNAS舉例,來看一下其在云存儲環境下的架構模型。不同廠商的架構盡管會有差異,但是出入不會太大。
SoNAS在內部數據交換方面采用了Infinband網絡,包含InterfaceNode、StorageNode和ManagementNode三種處理節點,分別負責數據對外交換、數據存儲以及數據管理工作。在這其中,InterfaceNode承擔著數據交換的重任,最小為2個節點,最大為30個。
我們前面已經說過,集群NAS的主要部件之一就是其文件系統。IBM在SoNAS上所采用的分布式文件系統叫做GPFS,用戶可以通過常見的文件訪問協議、TSM歸檔軟件接口來操作數據。目前,市場上除了SoNAS這類整合文件系統、x86硬件以及網絡設備的產品外,還有單純的文件系統產品,比如賽門鐵克的FileStore。
由于系統的優勢,集群NAS系統可存儲的文件數量一般都在億級以上,對于實際應用來說,文件數量限制基本可以忽略不計。同時,全局命名空間的大小也都為數個PB以上,某些廠商的全局空間容量甚至可以達到10PB。
目前,所有廠商的集群NAS設備都可以實現同原有系統的完美過渡,用戶實際上只需要進行本地或者遠程遷移就可以將數據轉移到集群NAS系統中。這種方便的新舊轉換也使得很多CIO在構建私有云時開始考慮利用集群NAS產品。可以說,云存儲市場的被發掘,為集群NAS拓展出了一個更為廣大的應用領域,這使得越來越多的廠商開始推出相應的產品。