InfiniBand明年將從100 Gbps走向200 Gbps。記者日前采訪了Mellanox營銷副總總裁Gilad Shainer。
Shainer表示,Mellanox將自下而上提供200 Gbps HDR InfiniBand規范產品,包括開關、芯片、網卡和相應的網線。
即將上市的Quantum開關設備支持40端口200 Gbps HDR InfiniBand,或80端口100 Gbps,將以模塊化開關的形式提供,可以擴展到200 Gbps速度的800個端口或100 Gbps 速度的1600個端口。切換延遲為90 ns,總容量達16 Tbps。
200 Gbps的ConnectX適配器設備的延遲為0.6微秒,支持第三代、第四代PCIe,包括Mellanox多主機支持(如果不需要200 Gbps,則可將分適配器分割給多個主機使用)。
假如有人覺得此類速度翻倍的游戲沒有什么意思,Mellanox也一直在推動利用開關減少CPU的負載的工作,這一點興許會更有意思。
Shainer表示,現在業界需要“在各種地方分析數據,特別是在遷移數據的時候。InfiniBand HDR設備著眼于高性能計算環境,并將擴大網絡計算和自適應路由功能,二者在運行上一代100 Gbps的環境里都頗為有用。”
Shainer稱,卸載處理器方面的工作多年前以RDMA(遠程直接內存訪問)起步,即是說數據遷移用到的CPU時間不到1%。這在Quantum和ConnectX里得以擴展。
他表示,“Quantum開關的功能包括執行數據整合和削減協議,以減少CPU的負載。”他還表示,機器學習訓練算法用到相同的基本概念。
ConnectX適配器也提供網絡內存儲、加密和其他安全方面的卸載功能。超級計算環境中的消息傳遞接口(MPI)也屬于ConnectX卸載功能的一部分,MPI利用集總和匹配減少CPU的負載。Shainer表示,ConnectX的卸載功能可以將“60%至70%的MPI工作負載卸載到網絡里……有朝一日,整個MPI框架將會遷移到網絡里”。
他表示,存儲卸載也是卸載功能的一部分,原因是檢查點的設置(將應用程序的狀態保存為返回點以備崩潰是用)目前是CPU負載的一部分。Shainer表示,“如果運行的節點達數千個,而又不想重新啟動應用程序,那么這一點就十分關鍵。”
檢查點的設置需要CPU時間,而HPC管理員不愿意在這些事務管理上消耗資源,因此ConnectX可以做背景檢查點的設置。
適配器加密卸載為磁盤加密添加一個有意思的功能。如果用了全盤加密,那么數據保護涉及的不是單個用戶。據Shainer介紹,“但如果是在網絡上,不同的用戶在網絡上可以使用不同的密鑰或不同的應用程序。”
Quantum和ConnectX還添加了遙測功能,內置的硬件傳感器可以提供實時數據收集。
200 Gbps的配件包括HDR銅電纜和拆分器(用于3米內的機架鏈接)、主動硅光光學電纜(用于100米以內的數據中心鏈接)和光收發器(2000米以內的鏈接)。
新產品將于2017年應市。