微波爐的發明是源于雷達研究的結果;鋼筋混凝土安全槽增加牽引摩擦力以防止受傷,最初是為了減少濕滑跑道上的飛機事故;固態特異纖維材料比鋼強五倍,能夠幫助NASA的海盜飛船登陸火星,而這種材料之后被用來創造具有超長使用壽命的花紋輪胎。上述這些例子都是科學技術在其最初僅僅是作為尖端科學實驗,而后被運用于主流應用的典型案例。而超級計算機技術無疑也將以同樣的方式進入并影響數據中心。
超級計算機是由什么組成的?
今天,絕大多數超級計算機都是龐大的集群服務器,與高性能網絡捆綁在一起的;那些經典的Cray向量超級計算機的日子已經一去不復返了。大量并行的大規模模擬的建立,應用程序工作負載被分布在服務器節點,通過共享通信結構傳遞信息。服務器節點通常配備浮點重CPU(floating-point-heavy CPU)和基于GPU數學的加速器,享有大型主機存儲器,但它們本質上僅僅只是Linux服務器。
大多數超級計算機將其存儲連接到相同的通信結構用于處理器之間的通信。存儲也必須是并行的,方便在失敗的情況下定期檢查點快速保存仿真狀態,以及大型數據集加載。互連因此是一個統一的架構承載管理,計算和存儲流量通過一根光纖連接到每個節點。
超級計算機的性能如何最終是由預算決定的。正是出于這個原因,基于商品標準的硬件組件是優選。一個開放的標準被稱為InfiniBand(IB)自其推出以來一直占據群集互連領域的主導地位,其具體的規范首先是由一個包括惠普、IBM、英特爾和微軟在內的行業協會于1999年發布的。
InfiniBand具有重要的屬性,包括極端的可擴展性,低延遲(端到端亞微秒級),高帶寬(每端口100Gbps)和硬件卸載,包括一個非常強大的功能,稱為RDMA(遠程直接內存訪問)。RDMA允許數據以線速從一個應用程序的存儲器空間流“零拷貝”到駐留在不同的服務器上的另一應用程序上,所有這些都沒有操作系統的干預,甚至沒有CPU的干預。這種功能加快了數據移動擴展內存的速度,而不僅僅是CPU核心速度(其已然停滯不前)。
對于那些有興趣了解更多關于IB的讀者,InfiniBand貿易協會提供了更多詳細信息。
這對數據中心而言意味著什么?
為了更好的平衡,大型服務器場的設計需要兼顧計算,存儲和網絡性能。許多因素都揭示了傳統的,已經有37年歷史的TCP/IP以太網是鏈接中的薄弱環節:
固態硬盤(SSD)正在穩步取代旋轉存儲,而不只是在其早期的關鍵應用,如數據庫索引和元數據存儲。傳統的NAS互連,能夠隱藏幾十毫秒的旋轉磁盤延遲突然被認為是阻礙固態硬盤及微秒級的響應時間。固態硬盤還提供數量級的吞吐量的增加,再次加強舊的互連。
統一線纜改善多系統級度量指標,如資本成本,氣流,散熱,管理的復雜度和每臺主機信道接口的數量,因為他們最小化網絡適配器,電纜和開關。這些特點使它們非常可取。微型和刀片服務器的外形因素使其每個節點不能獨立承擔三個獨立的接口。由于其耗流量控制和高延遲,TCP/ IP以太網與高性能的存儲網絡的匹配非常糟糕。
因為往往強調東西方向的流量,當前的數據中心工作流程的要求,需要新的結構拓撲。以太網生成樹的限制妨礙了高效的實現,如“胖樹”以交換機之間聚集的樹干為特色。
為覆蓋每個芯片上的大量CPU內核,許多核心處理器使用數十億個晶體管,服務器芯片朝這方面發展的趨勢非常強烈。很容易看出,網絡能力必須按比例和規模從根本上保持架構的平衡,否則核心將永遠是等待網絡I/O的狀態。
通過虛擬化部署,單臺物理機現在可以包含多臺虛擬機。這種配置的效果已經進一步加強了每個插座的網絡性能要求,推進超級計算機類負載水平。例如,一個運行在千兆以太網的TCP / IP協議棧可能需要高達1GHz的CPU性能;現在,超過20臺這樣的機器只需要一個單一的節點,甚至許多核心CPU在一款應用程序的一個周期之前都將因OS而飽和。
無論怎么看,InfiniBand都能夠輕易地解決這一切挑戰,同時也提供了平滑的過渡路徑。例如,通過IPoIB,InfiniBand可以以很快的速度承載傳統的IP流量,雖然這種能力不會立即公開顯示出所有協議的好處,但其提供了一個實現更有效的橋梁,被可以隨時間推移而進一步發展。此外,與人們普遍的誤解相反,InfiniBand實際上是最具成本效益的協議,如果能夠統一部署,一定能大幅降低成本。
InfiniBand的時代到來
顯然,更高效的數據中心可以通過一個開放的標準的超級計算機互連來實現。但InfiniBand在所有的原始性能和規模生產部署背后是否有足夠的深度?
InfiniBand最初的實現,是由于標準的精確無損流量控制方案,僅限于機架之間很短的鏈接。這種部署缺乏安全機制,如鏈路加密,并被僅限在單個子網的拓撲結構。由先進的軍事網絡所領軍,其他的早期采用社區和技術創新已經轉移到服務于這些市場,今天的InfiniBand解決方案意味著跨越全球距離的標準光纖基礎設施,提供強大的鏈路加密和多子網分割的手段。早在1999年,InfiniBand的設計是用來分離數據和控制平面,其成為了第一款軟件定義的網絡(SDN)。這種新技術的采用者們將受益于超級計算機和超級通信空間相對較快的創新。