橫向擴展的網絡附加存儲(NAS)已經來臨。不過,如果你認為它已經存在一段時間,從某種程度上而言也可以認為你是正確的。但使用集群文件系統并圍繞其建立的NAS遠非真正的NAS。NAS意味著簡單,這些家用的系統并不能滿足這樣的需要。
Isilon,如今已是EMC的一部分,可能是將橫向擴展NAS付諸實現得最淋漓盡致的廠商。Isilon 大約在10年前進入市場,并努力培育我們了解橫向擴展架構的價值。盡管過程如同向上攀登般艱難,因NetApp和EMC缺乏這樣的架構,并淡化相應的需求。不過Isilon最終取得了成功。
NetApp意識到橫向擴展架構的潛在價值并在2003年購買了Spinnaker Networks。盡管用了一段時間才完成所有的整合,但如今NetApp在橫向擴展NAS領域已占據相當重要一席。Dell也是如此,在收購Exanet之后,Dell現在提供將PowerVault和EqualLogic存儲集成在Exanet軟件后端。惠普同樣步入收購之路并選擇了Ibrix,并將其放置在LeftHand 或 3PAR的前端。IBM使用了自有的通用并行文件系統(GPFS)作為其橫向擴展網絡附加存儲(SONAS)的基礎。日立最近收購的BuleArc,實際上也是橫向擴展NAS的提供商。規模稍小的廠商,如Panasas和DataDirect Networks (DDN),也處于這個市場之中。Scale Computing,主要關注中小型業務/中小型企業(SMB/SME)市場,通過將IBM的GPFS架構在自身橫向擴展塊級存儲之上,也提供橫向擴展的NAS產品。
每一個主流的存儲廠商如今都已具有橫向擴展NAS產品,并對此架構傾注了極大的熱情。不過所有的橫向擴展架構NAS系統并非完全一樣。在選擇購買某種產品之前還有一些事情需要仔細考慮。
如同不同廠商的塊級存儲之間存在差異,各廠商的橫向擴展NAS產品也不盡相同。差別在于:
可擴展性,如何增加容量,基于性能的容量擴展,新節點的并入以及數據的重新分布
最小配置
節點的數量和類型。每個節點的存儲容量
以吞吐量為主,以IOPS為主還是在兩者之間取得平衡
系統的可管理性,對系統分區的能力
單個文件的吞吐量,單個文件系統的吞吐量
節點失效對性能的影響,最多可以失效多少節點而不丟失數據
在內部,數據是如何保護的,在系統易損期的數據重構時間以及系統是如何備份的
深入到每個因素的每一個細節會占據太多的時間和大量的篇幅,不過由于您的下一個NAS戰略性采購很可能是橫向擴展的系統,因此你必須做好準備。每一個廠商都聲稱它們的系統是可以無限擴展的,不過它們無一正確。無需理會理論上的限制,我們只需關注系統的實際限制即可。
其中一個最重要的考慮是運行在橫向擴展系統上的應用是以吞吐量為主還是以IOPS為主。當Isilon最初面世時,它明確針對媒體和娛樂市場。這意味著需要存儲和訪問非常大的音頻和視頻文件(應用以吞吐量為主),因此IOPS不太重要。不過當你需要處理大量的小文件和來自成千上萬用戶的請求時,這些則完全與IOPS相關。
所有的橫向擴展NAS系統都具有一個全局命名空間,不過在內部存在差異。例如NetApp,是將所有的小命名空間聚合成一個全局空間,而EMC Isilon提供OneFS文件系統來創建唯一的命名空間。這些差別未必和所有IT購買者有關,不過你還是應該了解這些差異。
一定要特別注意最初的起始配置。如果單獨的節點功能非常強大,而你至少需要三個節點起配,那么你的起始配置價格可能會超出范圍。如果對于你的應用來說單個節點能力遠遠不夠,你可能需要太多的節點來構建一個合理的系統,同時你必須考慮電能、散熱、空間以及成本。
你所選擇的系統應能處理存儲中隨時間不斷增長的文件數量,這一點至關重要。如果文件的數量數以十億計(如Web 2.0應用或者歸檔系統),你必須特別仔細的挑選你所購買的系統。如今,很少的系統可以處理如此巨大的數量。這也就是為何大部分的公有云構建在基于對象的設計而不是集群文件系統之上。
最后,大多數人都認為橫向擴展是未來的發展方向,也許你也會接受這個假定。不過你仍需要弄清楚那一種產品真正適合你的環境。我希望這些建議能幫助你取得基本認識并提出正確的問題。
關于作者:Arun Taneja是Taneja Group的創始人和董事長。Taneja Group是致力于存儲和存儲相關的服務器技術的分析和咨詢集團,你可以通過[email protected]與他取得聯系。