支持傳統的IT體系架構要耗費大量的時間,這與當前快節奏的業務環境背道而馳。新興的各種技術,例如融合與超融合基礎架構,公有云和私有云,以及基于Hadoop和Spark的橫向擴展產品與服務正在緩解局面。但這還不夠,我們希望可以將更多時間投入到創新應用的開發,而非維護管理IT基礎架構之上。
分解(Disaggregation),將一個聚合體分割成多個組成部分,這并不是什么破天荒的想法,但其重要性正在日益凸顯出來。在IT領域中,分解意味著將計算機分割成處理、內存、I/O、存儲、緩存、網絡結構等核心元素,從而實現最具成本效益的敏捷的基礎架構和高效的存儲配置。
但為什么我們要在諸如超融合等聚合IT資源的理念盛行十年之后重提這一話題呢?原因在于單獨擴展某單一資源通常會比將其作為一個整體進行擴展來得更具成本效益。
分解的理念在于用大量計算機來創建出獨立的資源池,然后根據需要分配適當的資源組合——內存、處理器、緩存、網絡架構以及存儲分配——從而為各個應用程序提供相應服務。如果操作得當,分解基礎架構可以隨時執行,提升高達80%的資源利用率,并且讓管理成本隨著存儲分配的自動化而下降。
我們用五款產品來詮釋分解技術是如何使用,并從中獲益的。其中三款和存儲相關:Nutanix、Pivot3和Datrium;剩下兩款DriveScale和HP的Synergy將分解應用于更前沿的領域。
超融合與分解
超融合的關鍵特點之一在于以計算或存儲規格預先定義的節點作為購買的最小單位,即便你只需要計算或是存儲。在Nutanix早期的產品中你別無選擇。不過現在Nutanix、Pivot3及其他公司可以銷售大容量存儲或者高性能計算的型號,一定程度上減緩,但未徹底消除這個問題。
Nutanix提供一系列的產品型號,從最低零存儲——完全沒有磁盤開始。此外,為了滿足一系列應用的要求,你可以構建具有多種節點的混合式集群,這亦是超融合技術的關鍵特性,可以讓你購買最適合的節點,并在整體上統一管理集群。
理想狀況下,分解所指的是計算與存儲的徹底分離,你完全可以購買100%的計算或存儲空間。但是在Nutanix環境中,只有100%的計算而非存儲。Nutanix對側重存儲的應用使用最小計算單元來滿足。雖然不算是純粹的分解,但至少在一定程度上達到了目的。
Pivot3則采用不同的方式,雖與Nutanix類似,但它有單獨的計算節點和具備最小計算能力的存儲節點。存儲節點可以應用于典型的超融合環境中,其中側重于虛擬機的運行,并假設使用虛擬化管理程序。不過亦可以脫離虛擬化管理程序使用節點——換而言之,其本質上支持裸機運行。客戶可以像從前那樣在物理基礎架構上運行尚未虛擬化的應用程序,同時仍然通過單獨的控制臺管理超融合集群中創建出的存儲池。
Pivot 3收購了NexGen Storage,一家具備卓越服務品質的外部磁盤陣列供應商,從而可以將NexGen存儲陣列“分解”集成到超融合資源池中。Pivot 3還允許使用iSCSI存儲資源運行集群的物理或虛擬應用程序。超融合集群內外部的所有應用程序均可以使用NexGen基于策略的服務質量功能。
雖然都不是純粹的分解,不過Nutanix和Pivot 3正在努力為客戶帶來價值。
分解與Datrium
Datrium僅有存儲產品,不過公司將傳統許多與存儲陣列相關聯的功能分割開來,擴展了對分解技術概念的外延。簡而言之,Datrium在橫向擴展的服務器架構中實現快照、壓縮、重復數據刪除、復制、加密等功能,不過在存儲陣列中留下了部分功能,例如鏡像的非易失性RAM和簡化的雙控制器。這樣的存儲比JBOD更為豐富,但比傳統陣列更加簡單。Datrium將此稱為DVX數據節點。
Datrium使用軟件定義的原則在服務器中實現這部分功能,充分利用橫向擴展;例如,你可以通過添加一臺服務器來提高重復數據刪除或加密性能。與此同時,Datrium運用更為智能但簡化的存儲,其聲稱用戶可以在超融合方面得到比其他100%的軟件定義產品供應商(如Hedvig和SwiftStack)更好的性能。與傳統的雙控制器存儲陣列不同,Datrium的數據節點不會形成任何孤島,并且相互獨立地提供橫向擴展所需的性能和容量。服務器還可以運行物理、虛擬和容器應用程序。
Datrium將此稱為“開放式融合”,而非純粹的分解,我們可以再來看看該理念還有什么其它的實踐形式。
HPE Synergy分解
HPE的Synergy是業內首款將其HPE產品稱為可組合的基礎架構平臺,這是最純粹的分解形式。從計算、存儲和網絡各個資源池開始,并根據需要在每款應用程序的軟件控制下進行組合。其使用單一的上層API來管控所有這三層,完成基礎架構構建、分解、管理、更新和擴展工作,Synergy同樣適用于虛擬化、混合云和DevOps操作模型。
不同于傳統的超融合技術,Synergy憑借其在虛擬化方面的優勢,涵蓋了各類物理和虛擬化應用——從傳統類型、移動類型到云端應用。而超融合技術在一個橫向擴展模型中將計算與存儲分配結合在一起,在大多數情況下,其只是沒能將網絡涵蓋在內。而從最初的形式上看,分解則從下往上構成了完整的基礎架構,包含網絡在內。
Synergy由三個基本要素構成:
池化的資源池。計算、存儲與網絡資源池根據每個應用程序所需和特定的服務級別劃分供應。你可以根據應用程序的需要,將物理、虛擬和容器工作負載以及內部的存儲容量,如直連的文件、對象或數據塊存儲,進行配置。鑒于3PAR存儲在HPE產品家族中的重要地位,其可以被配置為外部直連存儲、并作為資源池的組成部分。光纖可以支持多種協議,帶寬可以在不中斷的前提下擴展、調整。從而實現了隨時添加計算、存儲和網絡資源,不用影響業務運作。這些資源自動成為資源池的一部分,提供應用程序使用。同時擴展并不會增加管理負擔。
智能化的軟件定義。HPE將Synergy構建為內置智能化軟件定義的硬件。配置、擴展、取消等均經由模板完成,基礎架構能夠以近乎實時的速度進行組合和重組。Synergy既是基礎架構,亦具有軟件功能,使得曾經需要數小時或數日的常用功能現在可以在近乎即刻間發生。計算、存儲與網絡與適合的固件、BIOS、驅動程序以及操作系統鏡像一同提供,無需運營人員干預。這也是Synergy使用模板的目的,讓基礎架構便于使用,不再強調內部硬件或軟件的專業知識。這不僅適用于IT,同樣也適用于DevOps和測試人員。開發、測試和生產環境之間的差異會消失,都使用相同一致的界面。
統一的應用程序接口。不同于傳統的基礎架構中每個設備都擁有自身獨特的底層應用程序接口,你必須以此配置設備,Synergy在計算、存儲與網絡之間使用上層的應用程序接口。經過融合諸多基礎架構設備供應商(Dell EMC、IBM與Cisco、NetApp與Cisco等)的努力,簡化了計算、存儲和網絡的配置、管理。這通過掩蔽層來實現,在此之下,各元素仍有所不同。
Synergy統一的應用程序接口有兩大特征: (1) 比典型命令行界面更加高級; (2) 設計目的在于跨越計算、存儲與網絡。另外其提供了單一的界面來發現、檢索、盤點、配置、交付、更新和診斷基礎架構。而且還是將Synergy整合到其它管理平臺(包括Microsoft System Center、Red Hat和VMware vCenter),以及其它DevOps平臺(如Chef、Docker、OpenStack、Puppet和Python)的單一化工具。
HPE Synergy產品
HPE Synergy的第一代模型是10U機架高度的12000 Frame。你可以在一個閉環內配置多個Frame,并用單個控制臺同時管理上多個閉環。Frame中有五個重要元素——協同器、鏡像流化器、協同存儲、協同計算以及協同光纖模塊——從而創建出一個完全分解的平臺。
協同器。協同器負責發現、檢索、盤點、配置、交付、更新和診斷基礎架構中的計算、存儲與網絡資源。其是一臺基于HPE OneView和統一應用程序接口的物理設備。協同器使用IT或業務用戶開發出的服務器配置文件模板、能夠跨計算資源自動化配置、更新和回收計算資源的過程。可以通過單個模板創建出許多計算模板配置文件。
鏡像流化器。這是一款嵌入在Frame內的物理設備,鏡像流化器內為各類應用程序儲存了可啟動的寶貴鏡像,可以在幾分鐘內加載到計算模塊上。這可以取代傳統在物理設備上構建服務器、安裝操作系統、虛擬化管理程序、I/O驅動器應用程序堆棧等操作,將原本需要數小時乃至數日,易出故障的流程轉變為完全自動化、不會出錯的過程,并且只需數分鐘的時間。
協同存儲、計算與網絡。這些單獨的模塊讓存儲、計算與網絡和系統內其它各個元素緊密集成。你只需要在這些資源不足時加以補充。所有三種元素從體系架構上都是橫向擴展的,你可以構建以此逐一構建、管理起規模龐大的基礎架構。即便是網絡,在過去最為靜態的元素,在今天也是可編程的,能夠通過代碼完成交付或撤回。
DriveScale的分解方式
DriveScale已經將計算與存儲分解應用于下一代服務大數據分析的應用程序,例如Cassandra、Hadoop、Kafka、MongoDB和Spark。這些應用偏好橫向擴展架構,通常由通用型服務器和小型節點構建而成,包含計算與直連式內置存儲。這些節點數以百計,從而才能解決大數據的相關問題,每個節點都使用節點本地的相關數據來處理部分難題,然后整合結果,得出答案。通過將數據保存在本地,使其最貼近計算資源,使得延遲和流量變得最小。
這種方式在過去五年中已經掌控了整個大數據世界。但是伴隨著集群的日益膨脹,有時甚至出現成千上萬個節點,問題隨之出現,例如欠缺靈活性、繁瑣而昂貴的升級費用,以及應用程序孤島的問題。應用孤島產生的原因在于,對每一項應用程序,其計算與存儲分配的比例需要保持相同,而由于需要保持處理器溫度,機箱內可容納的驅動器數量是有限的。
DriveScale將計算與存儲分解開,從而可以在線不間斷地創建或變更應用程序上計算與存儲的分配比例。其要求從一家或數家供應商那里分別購買JBOD計算和存儲(服務器供應商由于改善了空氣流,可以比標準的商品化服務器提供更高的計算密度)。從而讓你在不同的時間節點分別更新服務器或存儲——通常計算會在每兩三年更新一次,而驅動器則會維持五年的時間。由于可以使用單獨的計算和存儲池,你可以隨意分配不同的應用程序資源,較以前大大提高了資源利用率。
DriveScale使用SAS轉以太網適配器,將磁盤驅動器連接到標準機架內的以太網交換機上,而該交換機會和集群內所有的計算單元相連。供應商的專利技術存在于協同軟件之中,通過編程方式交付、管理和回收資源。其圖形化界面基于RESTful API,可以向上集成客戶首選的管理工具,包含Chef、Puppet等。
值得你關注的分解技術
從字面上的解釋看,分解意味著將某些東西分割成各個組件,然后將這些組件形成資源池,可以用程序化的方式加以組合,從而將最適合的資源組合交付給應用程序。某些存儲與超融合供應商已經應用分解原則使其產品更具成本效益。不過DriveScale與HPE Synergy以最新的,不同尋常的方式來加以應用。
HPE Synergy是最全面、應用最廣泛的分解范例,證實了分解理念如何用于解決各種問題。HPE將協同體系架構視為超融合技術發展的下一階段。而其他供應商,如DriveScale,根據分解原則來解決具體的問題。
雖然公有云供應商(例如Amazon Web Services和Google Cloud Platform)所使用的體系架構的細節上不為人所知,但分解很有可能是其基本原則。可能是分解的早期階段,創建了單獨的資源池,將資源在適合的時間加以正確的組合,然后將其提供給應用程序。這無疑是正確的做法,所以說,現在是時候將“分解”添加到我們的日常的詞匯表中去了。