在此之前,你可能沒有考慮過你的IT部門需要一個橫向擴展(也稱向外擴展)系統。在如今環境多樣化的狀況下,橫向擴展系統將會具有深遠的影響。由于某些行業需要存儲大量的文件,因此需要足夠的訪問帶寬才能滿足應用對性能的要求,因此對外擴展系統已經首先在網絡附加存儲(NAS)方面發揮了威力。
例如,過去基于紙張或縮微膠片開展業務的一些大型傳統行業,在信息數字化后,其數據存儲壓力撲面而來。對提供橫向擴展NAS系統的供貨商而言,這些行業正是對他們充滿了吸引力的垂直市場,因為他們的產品正好可以為高性能的應用提供支持。
如果我們觀察一下 “橫向擴展NAS的垂直關聯行業圖”中的IO軸和吞吐量的關系模型,就會發現這些行業有許多應用都要求非常高的吞吐量。在許多橫向擴展NAS系統(包括明年將推出的支持并行網絡文件系統的NAS系統)中內置的并行數據服務功能提供的能力超過了每秒MB——傳統縱向擴展NAS系統提供的能力值。
縱向擴展NAS的垂直關聯行業圖
來源:企業戰略集團,2011年.
就在最近的五年前,這張圖還不是這個樣子。許多右上方的業務負載還擠在圖中的左下側。但是處理器技術(如多處理器和更快的芯片集),視頻、圖像和設計軟件(例如3-D CAD、4-D醫學成像、高清電視等等還有很多)等各方面的進步,已經催生了新的業務負載,而這些負載帶來了完全不同的性能需求。這些應用產生了海量的文件和多線程的訪問請求,單處理器或雙處理器的縱向擴展系統沒法及時完成響應,造成了業務系統的響應減慢或請求服務超時。
讓我們對一些具體的行業進行深入分析,來佐證我的觀點。
金融服務。這些習慣了管理巨量交易信息的用戶,現在成了高性能并行文件系統的主力用戶。高性能并行文件系統通常是應用在市場業績預測和商業智能方面。這些應用調用的文件,不只是內容巨大,還需要長時間的密集計算處理,需要高級別的數據保護并需要保證數據的即時可用性。金融服務的用戶特意尋找橫向擴展架構以消除數據整合的瓶頸。數據整合是金融服務IT的核心任務。對于這些用戶來說,理想的NAS解決方案是,可以隨時通過增加節點,來使數據的訪問性能變得更快。
生命科學。毫不奇怪,從事與健康相關的科學研究組織,對并行文件系統解決方案非常感興趣,因為這些系統可以提供高帶寬的數據傳輸能力和大規模的可擴展性。在這些組織中,緊密合作是非常必須的。例如,IT團隊必須得想辦法,使成千上萬的研究人員可以共享非常大的基因測序文件或蛋白質組數據。這些企業還必須加快他們的發現過程來獲得成功。如果能更快地發明一種新的藥物,這種藥物就可以被更快地進行測試,就能更快地獲得批準,并應用于醫療和科研實踐中。對這些組織而言,要加速藥物的發現過程,以IT為中心的解決方案就是,構建基于高性能并行文件系統的基礎設施,從而避免后續不斷進行顛覆性的系統改造和升級。
制造和設計。像已經明確的其他行業一樣,高科技制造商、航空航天公司、納米電子新企業、CAD / CAM設計公司以及其他更多的類似組織,也需要巨大的存儲量。他們都在尋找方法來優化數據管理。這些行業用戶需要實現存儲容量的無縫擴展,以應對數字信息的不斷增長,并提高工程團隊之間的信息共享能力。在這樣的環境中,系統失效會導致重大的經濟損失。所以制造和設計領域的用戶希望部署基于文件的存儲系統,以達到近乎100%的可靠性以及容量在線升級的簡易性。他們為增強文件系統管理、數據移動、復制和遷移/分級存儲等功能,尋找自動化的解決方案。
媒體和娛樂。傳媒和娛樂機構的經營模式已經發生了急劇的變化。在早期的年代里,他們會出版印刷的雜志,現在,這些雜志僅提供“單一網絡在線”格式。不僅所有編輯的內容需要迅速提供給讀者和編者,所有的廣告文件也一樣。對數字密集型的媒體和娛樂公司而言,大型視頻文件也加劇了數據增長帶來的問題。
今天的傳媒和娛樂機構創建和保護著TB或PB級的文件數據。在一些企業中,大部分數據是建立在“邊緣”——遠離主數據中心的遠程新聞分社或CGI設計工作室。這些業務機構為數據的復制備份帶來了難題,甚至可能會使得基礎設施的災難恢復(DR)能力受到障礙。媒體和娛樂機構正在尋找高性能的橫向擴展NAS解決方案來解決各種問題 ——例如提高虛擬服務器基礎設施的性能,或者,為內容的創作者和閱讀者提供信息的隨時可用性和及時可用性。
石油和天然氣。在過去,探尋石油和天然氣儲量具有很大的不確定性。今天,借助于數字化的信息數據,這已經成了一個高精度的科學過程。過去的十年中,在油層下降和提取操作變得更加復雜的同時,對疑似資源儲藏地點的三維可視化,已成為該行業無時不刻需要利用的工具。在石油和天然氣垂直市場的IT經理,面臨的挑戰是找到NAS基礎設施,以支持海量數據的共享和保護。這些數據是對石油儲量建模/仿真處理的結果。如果沒有一個這樣的架構,能夠在數據存儲容量增長的同時保持數據訪問的性能,那么保持企業的競爭優勢會變得非常困難——主要原因是 “見效時間”(資源開采)太長了。對石油和天然氣企業處理巨型規模的模擬計算而言, 橫向擴展NAS系統是一個很好的解決方案。而這樣的模擬計算,是他們在競爭中獲得成功的直接保證。
傳統的高性能計算、學術和研究。在公共部門工作的天體物理學家、分子生物學家、化學家、核物理學家和社會科學家,是海量數據的制造者和使用者。例如,由歐洲核子研究中心運行的大型強子對撞機,其IT團隊在2010年中期就管理著 70 PB的數據。甚至規模非常小的研究設施(通常是運行在經費有限的大學機構或商業實驗室)也依賴于高性能網格計算和并行文件系統架構,以支持建模和仿真任務,才能夠解決現實世界問題以及為“大”問題做出回答。他們的工作需要低延遲的網絡集群,以應對非常高的性能要求和帶寬要求。
這些行業是橫向擴展系統的先期實際采用者,因為它們在吞吐量性能方面有橫向擴展的剛性需求。但大多數的部門應該充分考慮,將許多PB的數據存儲在一個單一命名空間,其效率如何以及能節省多少運營費用。這是橫向擴展系統在云架構獲得應用的原因。這種架構使得類似Gluster這樣的公司,從基于云的業務和構建私有云的企業中獲得了巨大收益。Gluster推出了一種橫向擴展的文件系統,運行在普通硬件上,能夠支持塊、文件和對象數據。企業戰略集團預測,到2015年,所有外置NAS系統收入的80%都將來自于橫向擴展系統的交付,而且,“大文件的數據”和云計算將是其增長的核心點。