模仿是最真誠的贊美方式。如今,復制大型云服務提供商基礎架構建設的理念正值流行。這些大型云服務提供商依賴于下一代硬件平臺以提供更好的性能表現,同時價格非常具有競爭力。隨著時間的推移,這些云服務提供商不再自我封閉,開始和主流硬件廠商合作,共同推動整個產業向前發展。
這種趨勢預示了今年的Open Compute Summit(開放計算峰會)將會十分熱鬧,肯定不會令我們失望。從主板設計到英特爾的價格競爭再到超高速的LAN,所有人都能夠在這里找到自己感興趣的東西。
Google開放軟件
在商用現貨(Commercial Off-the-shelf,COTS)服務器CPU領域,谷歌推出了基于IBM Power處理器的服務器,正在挑戰英特爾的壟斷地位。谷歌以Power處理器為基礎對其軟件進行了大幅度調整,開放了一些新的配置以實現平臺多樣化。但是如果真的想要成為英特爾的競爭對手,谷歌還應該將芯片價格控制在較低水平。
IBM不久之后將會推出其下一代Power9 CPU,這是一款擁有24核心,使用14nM FinFET技術的處理器。預計在2017年,這款芯片將增加用于加密和壓縮的板載加速器,到時候對于任何英特爾的產品來說其都具有足夠的競爭力。美國的兩個主要超級計算機項目都在使用Power9,其中之一—Summit的目標是在每秒計算速度方面超過目前全球最快的計算機——中國的天河2號。
Power系列芯片擁有高速IO,使用了NVLink 2.0技術,這對于超級計算來說是一項重要特性。Summit的計算速度能夠達到300 petaflop,而其中的大部分都來自于GPU。但是中國在超級計算領域肯定不會停滯不前。現在IBM已經將其Power架構推廣到公共領域,有傳聞稱使用7nM工藝的Power9將會在中國進行生產。
谷歌和Rackspace正在為Open Compute Project(開放計算項目)開發服務器設計:使用Power9 CPU,基于48V rack架構。這意味著英特爾不再擁有對CPU計算能力隨意定價的權力,大家開始思考英特爾在COTS服務器領域當中是否依然具有不可逾越的優勢。這種趨勢能夠為激勵創新提供必要的壓力,而技術發展速度降低的主要原因在于我們不斷接近硅的物理特性極限以及英特爾對于市場支配地位的自滿。
不再使用交流電谷歌還發布了僅供內部參考的六個服務器發展藍圖——全部基于48V架構——這種方式能夠推動主流市場向前發展。這是谷歌首次進軍開放式設計領域,其目標是解決服務器領域所面臨的棘手問題。現在主流服務器電源供應是120或者240伏交流電源,意味著服務器需要使用規模龐大但是效率很低的電源供應。
從物理空間和實際效率兩方面考慮,云服務提供商已經不再使用交流電源這種方式。對于大規模電源需求來說,可以使用400伏+三相電源,因為這樣能夠提升10%的效率,并且易于實現冗余。這種電源供應方式可以讓服務器更加緊湊,同時減少熱量產生,適用于各種情況。如果使用固態電源組件,還可以進一步節約機房空間。假如企業使用Vicor全新的48 Direct-to-PoL模型,那么就不再需要規模龐大,但是效率很低的48伏電源供應。英特爾也在為Open Compute Summit認真進行準備。其從Altera公司收購的FPGA(現場可編程門陣列)技術正在發揮成效,XEON-D芯片當中內置了FPGA。FPGA開放了第三方編程接口,其目的在于為多種環境提供硬件加速器,包括加密和壓縮。
對于使用大量NVMe(非易失性存儲標準)硬盤的系統來說,英特爾推出了一系列參考設計,最終目標顯然是存儲和超級融合系統。相比于Power9架構,這種方式非常適合于壓力更大的需求。因為NVMe能夠支持超過四塊硬盤,已經超過現有系統設計的能力。
對于普通用戶來說,英特爾Broadwell XEON-D芯片擁有65W、16核心版本,非常適合于擁有一或兩個CPU的半寬1U服務器,這種服務器是大部分云和集群的組成部分,這樣就能夠避開來自ARM處理器的威脅。
在網絡前端,由于英特爾使用了PCIe fabrics和Omni-Path技術,因此Mellanox已經感受到了壓力。使用多端口交換機的PCIe正在獲得越來越多的關注,企業可以借此將多塊硬盤連接到一個系統當中。未來其還有可能演變為互連的集群系統,進入InfiniBand所在的領域。
不過,在未來的幾年當中,PCIe仍然只能作為一種短距離連接解決方案。這是一種延遲非常低的100Gbps連接技術,看起來非常類似于InfiniBand。不同之處在于英特爾準備提供高端的Knight Landing處理器,并且在CPU上使用Omni-Path架構,明顯是瞄準了市場中的高端需求。
在峰會上,Mellanox宣布將InfiniBand和以太網最快速度提升一倍至200Gbps,以此應對英特爾的競爭。雖然比Knight Landing晚了幾個月,但是其速度是Omni-Path的兩倍,并且在英特爾趕上來之前還有兩年時間,因此是一種非常具有吸引力的產品,保證需要最好性能的用戶(比如金融交易領域)繼續使用自己的產品。
微軟開放SONiC微軟也加入到這個競爭行列當中,其推出了一款開源的、基于Linux的網絡操作系統,名為SONiC(Software for Open Networking in the Cloud),目的是使用成本更低的白盒交換機。SONiC基于Azure Cloud Switch架構;這是另外一種主要云服提供商將工具集開源的案例。Cavium公司展示了與SONiC兼容的硅交換機,即XPliant系列,總轉發帶寬為3.2TBbps,單個連接為100Gbps。這種設計將會進一步促進軟件定義網絡的發展,生產出更為廉價的高性能交換組件,這對于云環境的成本是至關重要的。
存儲技術也在不斷發展。希捷公司宣稱其擁有有史以來速度最快的硬盤。在10Gbps級別,Nytro WarpDrive是一種兼容Open Compute Project的PCIe閃存卡。Diablo和Inspur公司合作發布了NVDIMM-F內存系統,使用超快內存總線作為接口,與英特爾在性能方面形成競爭。這可能是英特爾在下次峰會推出Xpoint內存NVDIMM的前兆。COTS標準已經有擁有十分嚴格的定義,英特爾向Open Compute兼容服務器當中添加新的內存設計不會出現任何問題。
這些廠商提供的參考設計,對于服務器買家甚至是中端用戶來說,將會逐漸成為通用標準。制造商提供的低價和高質量產品,加上COTS的可替代性,都將會顯著降低計算方面的開銷,并且對IT廠商的未來發展產生重大影響。