IT中充斥著各種有前景卻從未實現過的想法。隨著過去五年人們對可組合基礎設施的興趣趨于平緩,人們可能會把這種將硬件資源從其主機中分離出來的技術歸類為失敗的想法。但我們還沒有準備放棄這個想法,盡管可用的少量使用數據并不樂觀。
Statista針對IT主管和經理進行的一項調查發現,只有11%的受訪者擁有可組合系統的生產部署,而大多數人(52%)對該技術不感興趣。事實上,在接受調查的10項技術中,可組合基礎設施的關注度最低。
盡管如此,在過去幾年中還是出現了一些重要的產品開發。這些發展為可組合傳播者帶來希望,讓他們相信該概念將在企業應用中得以發揮,特別是在為高性能計算 (HPC) 和AI工作負載構建大型集群的企業組織中。
硬件可組合性:背景和技術
可組合硬件的想法可以追溯到大約十年前,當時Calxeda構建了一個具有集成10 Gb以太網結構的橫向擴展、模塊化Arm服務器。當時這個速度很快,并且連接了機箱中的相鄰節點。如今,Calxeda早已不在,但其知識產權現在由Silver Lining Systems使用,其最初被惠普用于其Project Moonshot服務器,可以說是構建可組合軟硬件系統的第一次嘗試。然而,惠普隨后放棄了它,轉而使用英特爾的新Atom處理器。Moonshot已發展成為HPE的Synergy產品線。
當另一家初創公司Liqid于2015年推出基于PCIe結構的可組合硬件的新方法時,這一概念得到進一步發展。Liqid系統的核心部件包括基于Broadcom組件的PCIe交換機。軟件管理系統可幫助配置和連接由CPU、內存、網絡接口卡 (NIC)、存儲、GPU和現場可編程門陣列 (FPGA) 資源組成的裸機服務器,這些資源集中在連接的服務器和擴展機箱中。
為什么選擇 PCIe?
Liqid最初使用內部設計的交換機,圍繞PLX的芯片構建。后來它采用了Broadcom的 PEX8700和PEX9700 PCIe Gen 3.0交換機芯片。2020 年年中,Liqid和Broadcom合作開發了PCIe Gen 4.0參考設計。此次合作使用Broadcom的PEX88000交換機,其吞吐量是其Gen 3.0部分的兩倍,每個端口的帶寬為每秒256千兆傳輸。這些交換機提供24或48端口配置。每個端口默認為四個PCIe通道,可配置為x8或x16,端口到端口延遲為100納秒。
由于PCIe在現代處理器中無處不在、高帶寬(每通道 64 Gbps)、低延遲、無損傳輸和直接內存訪問 (DMA) 支持,PCIe 成為服務器集群和可組合基礎設施的理想互連。其非透明橋接功能使主機處理器能夠將交換機端口視為PCIe端點。4.0代交換機(例如Broadcom PEX88000)嵌入了Arm處理器,用于配置、管理和處理熱插拔事件。它們通過I/O共享和 DMA等功能提供非阻塞、線速性能。
PCIe的缺點包括比以太網更高的端口成本,以及對電纜長度的嚴格限制將結構限制在服務器機架內。因此,以太網和InfiniBand已成為可組合基礎設施的替代方案。例如,Liqid宣布多結構支持所有資源類型的可組合性——CPU、內存、GPU、NIC、FPGA 和存儲——跨所有主要結構類型,包括 PCIe Gen 3.0、Gen 4.0、以太網和 InfiniBand。相比之下,HPE 在其Synergy可組合產品中僅支持以太網,以及用于存儲的光纖通道(FC)。
可組合架構的應用
可組合基礎設施最初被提議作為一種在AI環境中經濟高效地共享昂貴GPU的方式,特別是對于計算量更密集的模型訓練。然而,組合式對于HPC集群和裸機云基礎設施也是可行的,尤其是對于較小的利基提供商。它還適用于多租戶邊緣計算集群,例如,在5G基站或云“微”區域。使用PCIe到 NVMe、NVMe-oF、FC或InfiniBand的多節點可組合架構是分布式橫向擴展存儲系統的流行選擇,其中NVMe磁盤池與服務器集群共享。
盡管與PCIe架構無關,但 PCIe NIC、GPU和FPGA卡越來越多地使用 Nvidia 虛擬 GPU、FPGA 共享、SmartNIC 和數據處理單元 (DPU) 等技術在多個VM之間共享和虛擬分割。例如,VMware最近推出了Project Monterey,將VMware Cloud Foundation的一些功能擴展到DPU,例如 Nvidia的BlueField-2。該軟件使DPU的多個Arm內核能夠托管一個ESXi實例,從主機CPU卸載網絡和存儲服務。
從長遠來看,VMware Cloud首席技術官Kit Colbert認為,Monterey會不斷發展以支持多個主機和其他硬件加速器。
他在一篇博文中寫道,“該項目使我們能夠重新思考集群架構,并使集群更具動態性、更受 API 驅動,并針對應用程序需求進行進一步優化。我們通過硬件可組合性來實現這一點。”
跨服務器共享和動態分配硬件資源的選項正在成倍增加。它們通過更高的資源利用率提供對硬件加速器的更廣泛訪問以及更低的成本。
版權聲明:本文為企業網D1Net編譯,轉載需注明出處為:企業網D1Net,如果不注明出處,企業網D1Net將保留追究其法律責任的權利。