是不是為有望將貴公司的非結構化數據轉化為實用的商業信息感到興奮?你要做的第一步是建立可以處理PB級數據的存儲架構。EMC Isilon公司的Nick Kirsch表示,向外擴展型NAS(網絡附加存儲)是最佳解決之道,他向CIO們著重介紹了向外擴展型NAS的五個原則。
由于企業力求進入大數據領域:對紙張文檔進行數字化處理,并保存來往的電子郵件、Word文檔、Excel文件及其他各種各樣的非結構化數據,并希望從中發掘實用的商業信息,它們需要事先解決一個大問題:存儲。
EMC Isilon公司的產品管理主管Nick Kirsch說:“許多企業突然積累了數PB的信息。他們面臨著一個相似的挑戰:面對這么多的信息,他們該如何充分利用?又如何用一種可擴展的架構來存儲這些信息?”
一種可行的方案是垂直擴展(向上擴展)。此舉旨在把現有的存儲設備換成新的、容量更大的存儲設備,從而使現有的存儲節點容量更大、速度更快及/或功能更強。以這種方式整合存儲基礎設施頗有吸引力,因為這簡化了管理,并減少了場地占用面積和耗電量。但這種方案并非沒有問題:它不能輕松地橫跨多個地點,天生缺乏很強的整體適應性,而且大容量高性能的存儲設備很快變得成本高昂;處理不斷增加的洪水般信息時,最大的問題是,現在的存儲設備其容量只有那么大。
Kirsch說:“你可以建立越來越大的單一單元控制器。但到了某個時候,你無法建立更龐大的此類系統;只好添加第二個系統,最后可能需要管理數百個不同的系統。”
Kirsch表示,NAS方面走水平擴展(向外擴展)的道路是一條出路。向外擴展型NAS架構拋棄了價格昂貴、大容量的存儲設備,改用成本低廉的大眾化存儲部件,并將它們合并到一個總存儲池。你在必要時可以添加節點,而不是讓節點變得更龐大。其缺點是,你可能很快面臨一個極為復雜的管理環境。但是它可以橫跨多個地點,而且天生具有很強的適應性。可能從管理大數據的角度來看最重要的是,你可以迅速、低成本地添加存儲資源。
Kirsch表示:“我認為,說到存儲,人們最大的抱怨就是,管理一個系統容易得很,但要管理兩個或多個系統時,情況變得很復雜。”
Kirsch表示,就大數據而言,NAS比SAN(存儲區域網絡)更可取,因為SAN本來不是為非結構化數據和文件共享而建立的。為了讓SAN與NFS或CIF/SMB等網絡協議結合使用,必須在SAN前面部署文件服務器,這會增加管理復雜性,還會影響可擴展性。
向外擴展型NAS的五個原則
Kirsch建議CIO們應著眼于向外擴展型NAS架構的五個原則,第一個原則是力求簡單:
易于擴展。Kirsch說:“CIO們考慮采用的下一代存儲架構應該易于擴展。如果我有一只1TB容量的驅動器,我可以管理、保護和復制這個卷。為什么我就不能同樣這么輕松地管理15PB的數據?不應該就因為數據量更大而導致管理變得更復雜。”向外擴展型NAS架構可以借助軟件管理以及讓多個節點如同一個系統工作的虛擬化/抽象層來解決這個問題。
可預測性。Kirsch說:“性能必須具有可預測性。”如果我這周增加了6TB,下周增加6TB,我希望性能方面有同樣的線性擴展。我不希望非得重新為我的應用程序設計架構或重新培訓我的用戶。它應該完全以一種可預測的方式來擴展。我希望按需擴展、按需付費。別讓我在今天投入過多的資金。我知道,按摩爾定律,下個月會出現速度更快的計算系統;驅動器的密度也只會越來越高。讓我可以充分利用存儲基礎設施中的那些資源。另外,這應該是共享的對稱架構。別硬讓我了解你架構的差異。我只希望,需要時可以擴展該系統。
高效性。Kirsch說:“讓我可以充分利用存儲系統中的所有資源,無論它們在什么地方。讓我可以充分地利用我那些物理磁盤驅動器,這些存儲系統的利用率不是50%或55%,而是應該超過80%,無論處理器、計算部件或緩存在哪里,我都能充分利用這些資源。無論應用程序在什么地方運行,我都希望存儲系統能最大限度地提升該應用程序的性能。另外要把分層存儲功能(tiering)集成到該系統中。”換句話說,你需要把數據移到合適的存儲系統,以便優化性能或優化容量。面向大數據的向外擴展型NAS要有足夠高的智能化程度,以便為你自動處理這項任務。
可用性。Kirsch說:“該NAS架構必須隨時可用。要充分發揮N-way架構的優勢,好讓我在遇到多次故障后可以存活下來。如果我環境中的某個機架出了故障,也可以恢復如初。我希望該系統隨時可用;它要有靈活性。讓我可以保障系統的可用性,又可以兼顧業務部門的需要。如果業務部門愿意投入更多資金,我可以提供更高的可用性。要是數據不大重要,我可以適當降低可用性。”歸根到底,由于向外擴展型NAS存儲基礎設施建立在成本低廉的大眾化硬件上,硬件可能會出故障,所以在設計系統時需要顧及硬件故障率較高這一點。
適合企業環境。Kirsch說:“隨著技術日趨成熟,向外擴展型NAS不再是IT外面的那個次要項目,而是IT的一個重要組成部分。它要有快照、復制、配額及其他所有的傳統IT功能。這項技術其實從高性能計算(HPC)發展而來的,但是如果你打算建立一個向外擴展型系統,最終建立的此類系統一定要適合企業環境。”