在主站點上實現的數據存儲與工作負載廣為人知——而與之對應二級站點則并非如此。也正因此,近年以來二級站點相比主站點,在體系結構方面發展甚緩。
按照慣例,數據存儲的主站點與應用程序直接讀寫、交互數據;工作負載的主站點上則負責程序運行,但并不一定用于支持最終用戶。一級或二級應用程序(如ERP、CRM、Microsoft Exchange與SQL Server等)往往都被視為主站點上關鍵應用程序。在二級站點上,我們一般只會想到數據保護、歸檔、復制、重復數據刪除、壓縮、加密、分析報表以及二級應用的測試和開發,這些應用需要使用到那些在主站點中產生,并在二級站點存儲的數據。
不過,今天在二級站點領域發生著翻天覆地的變化,其中充斥著各種晦澀而混亂的概念,大量的供應商通常只針對解決某個單一的問題。事實上,直到最近業內才開始從一種統一的視角來觀察以往這些形態各異的,位于二級站點的應用和數據。
這些定義并非明晰確鑿的:雖然這聽上去有些奇怪——存儲與應用究竟是在主站點還是二級站點上,其邊界相當模糊。我們就此展開全文。
從主站點上著手
現在數據的二級存儲像主存儲那樣,正在開始經歷一種結構性的轉變。我們首先總結歸納出在主存儲端所發生的事,因為這同樣適用于這場在二級存儲上展開的變革。
煙囪式的主存儲帶來了相當大的混亂,對成本、時間效率以及應用程序性能所造成的影響數不甚數。所幸的是,我們已經看到了虛擬化技術應用、橫向擴展、融合,以及最近才出現的超融合所帶來的諸多改善。
虛擬化技術抽象了計算資源,改變了我們提供和管理硬件資源的方式。融合則以集成的方式將計算、存儲、網絡與虛擬化相結合,使得基礎架構更易于購買、交付和管理。超級融合從本質上將計算、存儲和存儲網絡(SAN、NAS)融合到一個單一的實體和橫向擴展的架構之中,從而顛覆了整個行業。
由于超融合技術消除了IT行業在過往的三十年內一直想要解決的痛點,其成長與發展遠未有結束。例如說,超融合可以減少或消除計算與存儲資源在配置、微調、交付、管理以及仲裁方面的負載,并且很快會涉足到網絡領域。
問題在于……
假如說超融合對數據存儲和工作負載的主站點而言能帶來如此多的收益,那么其能在二級存儲方面發揮同樣的作用嗎? 雖然超融合有諸多創新,但上述問題的答案是,“不”。
從概念上看這樣做似乎不難。我們應該應用超融合、橫向擴展的文件系統、虛擬化、軟件定義存儲(SDS)等技術,令二級站點像主站點那樣更具效能。
但這著實是一項艱巨的挑戰。我們不禁開始思考是否有可能開發出一款包羅萬象的產品來囊括所有二級站點上負載,而非各種功能的胡拼亂湊。
在解決這項難題之前,讓我們先來描繪出這項新的體系結構所要達成的目標。
超融合二級存儲
在Taneja集團內部,我們已經將這種新的體系結構定義為超融合二級存儲。命名規則相當簡單:這類產品應用超融合原則,并完全服務于二級站點的工作負載。
在開始閱讀我們對這種全新超融合二級存儲概念所做定義時,請注意,有些產品即使缺少某些特定的功能,但它們或許仍然會屬于超融合二級存儲這個范疇。其中的關鍵點在于,“產品的架構是否便于增加新的功能,而非從功能上完全進行重構?”目前市場上各供應商的產品沒有完全符合上述定義:有一些較為接近而另一些則完全不同。所有這些都與主存儲端的超融合技術發展完全一致。
另外,你還必須確定缺失的內容對你而言是否是至關重要的。這里所列出的是超融合二級存儲所應涵蓋的基本要求:
存儲必須使用節點的體系結構,支持幾近無限的“橫向擴展”模式,事實上,“無限”意味著這種結構與當前的公有云相同;即,對于特定的應用集合,結構可以無限按需擴展,而不用擔心性能下降或增加延遲的風險。
存儲能夠自動應對處理多項不同性能需求的工作負載而無需人工介入調整。使用在應用主站點的超融合架構原理在此同樣適用。
軟件定義是這類存儲的核心,其使得控制層與數據層分離,從而令系統可以使用市場上絕大多數現有的硬件,擺脫被硬件鎖定的風險;同樣,其既可以在本地,亦可以運行于云端。
存儲與公共云或私有云緊密集成。除了將數據發送到云端外,這還意味著能夠在云端完成數據的管理與保護。其必須能夠無縫得將云作為一個存儲層。
存儲可以應對處理當前或未來可能出現的所有二級站點的工作負載。在今天,這或許意味著數據保護、存檔、災難恢復、復制、數據遷移、重復數據刪除、壓縮加密、測試/開發以及復制數據管理(CDM)和分析。
存儲至少能夠支持多種混合的數據塊、文件與對象協議,其中包括iSCSI、光纖通道、NFS、SMB和REST,并且能夠在同一個存儲池中儲存所有的文件和對象。
存儲完全基于策略。首先設置工作負載的策略,可能使用預定義的模板,然后系統管理整個數據生命周期和工作流程,包括啟動和拆卸基礎架構資源,而無需操作員參與介入。
存儲具備的服務質量(QoS)控制。根據定義,許多二級應用程序要運行在基礎架構,因此系統必須能夠根據預設的策略自動分配資源,并且有適合的方案來確保其合規性。
存儲可以和主站點的存儲資源那樣同時支持物理與虛擬的工作負載。
存儲可以索引元數據與內容,具備構建定制化分析的能力,能夠支持復雜的搜索功能,包括在文件中搜索數據的能力。檢索的結果通過標準的API反饋給應用程序。
存儲可以通過一個基于Web頁面的管理控制平臺,經由任意可以接入互聯網的位置管理到整個二級基礎架構——并根據客戶需要設定全局命名空間。其能夠和常見管理平臺(例如VMware的vRealize Automation)相集成。
存儲體系結構具備自我修復的能力,在發生故障時不需立即更換故障部件;可以應對多塊磁盤與節電的故障;不會喪失靈活性與可用性;毋須進行數據遷移;且IT可以實時調整系統的彈性。
存儲可以內設數據虛擬化策略,從而確保某個數據副本可用于多項應用程序的工作負載。
存儲具備企業級安全性,包括后端的靜態數據加密,以及活動數據的存取訪問控制。同樣,存儲可選第三方的密鑰管理器。
存儲提供以秒和分鐘測量的恢復點目標,具有瞬時恢復時間目標(不需要進行數據回算和重構)。
行業中存在著一種普遍的誤解,即Hypervisor是實現超融合技術的先決條件。由于超融合技術首先使用在主站點并適用于虛擬工作負載,于是看似使用一項Hypervisor虛擬機管理程序必不可少。 但隨著行業向容器(container)技術轉移,這種先決條件將逐漸消失。 在二級站點上的情形同樣如此。
正如你所看到的,上述這些將成為一項廣泛的需求。 我相信當前我們正處于這樣一個時刻,即所有適合的技術都可以實現這種愿景。 目前市場上的數款產品已經非常接近,而其他供應商在接下來的18個月內爭相達成類似的目標,而另一方面,由于當前的架構設計,有些供應商或許永遠無法做到。
超融合,準備好了么?
假如脫離一定的評估標準,想必會有不少的供應商聲稱他們的產品能夠滿足上述條件,但事實并非如此。那么,讓我們來仔細看看市場上這些不同類別的超融合二級存儲產品,以此了解更多。
在計算機科學領域,一項毋庸置疑的事實是:你的體系結構在設定以后,便決定了未來可以達成,或難以(有效)實現的目標。因此,對于大多數在幾十年前便從事數據保護與數據復制產品的供應商而言,他們很難支持橫向擴展的節點結構、虛擬化以及在過去五年出現的許多其它技術。
例如,假如某家供應商是CDM領域的專家,那么很可能他們要求受管理的數據副本必須要遷移到特定的數據庫中。數據保護則可能是(也可能不是)該產品的組成部分(換句話說,可能需要第三方數據保護應用支持),產品可能(也很可能)不支持橫向擴展。
各家供應商所提供的分析技術水平層次不齊,其中大多數仍側重于存儲利用率與數據保護指標。當由某家供應商單獨提供歸檔技術時,其很可能會形成信息孤島。云集成或許只是單純實現了數據傳輸功能。大多數重復數據刪除產品只是:用于減少數據副本的專屬設備。它們與同一(或不同)供應商提供的數據保護產品協同工作。橫向擴展只適用于有限的一些供應商產品,遠非市場上所有的方案。
與此同時,某些復制產品只能執行特定的功能,從而又造成某項單一功能的封閉性。大多數產品缺乏真正的QoS功能。雖然可能存在服務級別協議和基于策略的控制平臺,但通常無法確定其合規性。經過設計,對象存儲提供商可以具備橫向擴展、單一命名空間、完全可靠安全的平臺(借助糾刪碼),但往往會缺乏完整的文件支持,并且難以支持上述所有二級站點的工作負載。
經由過去三十年的不斷發展,今天支持二級站點的產品系列遍布各個領域。其中的絕大多數只是被設計完成單一的使命,從這點上講這些產品做得不錯。但是世界正在發生改變,單靠數據保護是遠遠不夠的。我們必須重新思考和定義海量信息、消費數據、合規性、社交媒體、移動應用、云計算和大數據分析領域的保護與可用性的整理范例。
雖然從本質上去轉變二十年前架構的產品很困難,但供應商們卻在努力嘗試,有時經由自己的開發團隊,更多的則是借助合作伙伴。他們如何達成目標,或者如何達成目標,我們拭目以待。
今天有兩家企業,他們的視角與本專欄所定義的最為接近。Cohesity滿足了上述大多數的標準;Rubrik也較為接近,只是缺失了些許關鍵部分。 CDM領域的供應商,例如Actifio和Catalogic也有許多產品,很可能會彌補這些空缺。 IBM Spectrum Copy Data Management利用Spectrum Protect,并且(最有可能)將其與IBM Cloud Object Storage緊密集成,從而提供橫向擴展功能。同時我們也不應該忘記,SimpliVity(最近被HPE所收購)以及Scale Computing曾公開展示在單個基礎架構中為主存儲和二級存儲應用實現超融合的愿景。
在諸如亞馬遜網絡服務(Amazon Web Services)等公有云服務商的領導下,主數據存儲端的改造業已在過去十年推動了整個行業的發展。我認為超融合技術直接來自于將公有云的理念應用于企業自行部署的基礎設施。同時我還相信超融合技術會運用于數據中心內具有相同重要性的二級存儲。在這方面的需求量甚至會更大,畢竟存儲于二級存儲中的數據占到了整體數據量的80%。
我們可以使得二級存儲大放光彩,利用它實現更好的業務決策;同樣,它也可能變成龐大而臃腫的數據堆棧。昨天的體系架構很難幫助我們帶到前者。二級站點需要和主站點一樣基于超融合技術。