中國的超算在TOP500排行榜中已經七連冠,今年問世的神威·太湖之光更是全球首個浮點性能達到10億億次的超算,峰值性能可達12.5億億次,是美國最強超算“泰坦”的7倍多。美國依然是世界超算技術最強的國家,不過美國頂著萬年老二的感覺估計也不爽,2017年他們要推出新一代超算Summit(峰會),使用了IBM Power 9及NVIDIA新一代Volta顯卡,并配備HBM內存,浮點性能可達20億億次,比中國的太湖之光搶強了一倍,明年有望奪回TOP500第一。
美國Summit超級計算機將使用IBM處理器、NVIDIA Volta加速卡
IBM、NVIDIA聯合研發超算的合同是2年前就定下的了,美國能源部先期投資3.2億美元給IBM、NVIDIA,二者聯合研發兩套超算系統,一套位于勞倫斯·利弗莫爾國家實驗室,代號Sierra,浮點性能是100 PFLOPS(10億億次),另一套安裝于橡樹嶺國家公園,浮點性能高達150-300 PTFLOPS(15-30億億次),代號Summit,也就是今天新聞的主角了。
2014年立項時曝光的Summit超算規格及性能
Summit超算的最終規格現在也確認了,NextPlatform網站日前曝光了Summit超算的具體配置,如下圖所示:
現在曝光的Summit超算規格
Summit超算的性能大約是美國目前最強超算Titan的5-10倍,節點數量將從18688個大幅減少到4600個左右,每節點性能從1.4 TFLOPS提升到40 TFLOPS以上,每節點配備512GB DDR4及HBM做內存,遠高于Titan超算的水平。
根據該網站的爆料,Summit超算的浮點性能超大200 PFLOPS,也就是20億億次,比Titan超算不知高的哪里去了,但功耗卻很低,性能暴漲5-10倍之后系統功耗只是從9MW增加到了13MW,相比之下中國的太湖之光超算功耗是15.4MW。
Summit超算功耗超高的一個原因就是它使用了異構體系,主處理器是IBM的Power 9,14nm24核架構,而加速卡則是NVIDIA新一代Volta架構,它最早曝光于2013年,但本來是Maxwell之后的產物,但隨后NVIDIA調整了路線圖,多了Pascal架構,Volta順延到2017-2018年。
NVIDIA的Volta架構定位于Pascal之后
目前尚無Volta的架構細節,不過Pascal支持的3D顯存——也就是HBM、NVLink、混合精度等技術肯定都會用在Volta上,制程工藝很有可能還會繼續基于16nm,畢竟TSMC的7nm工藝還要等到2018年之后,進度沒這么快。
美國橡樹嶺國家實驗室表示Summit超算會在2017年問世,根據進度來看下半年的可能性更大,意味著NVIDIA的Volta顯卡最快也會在明年下半年問世。