時值歲末,TOP500回顧了2016年在高性能計算領域的最顯著變化趨勢,從機器學習到E級超算,有很多話題值得關注。
一、無處不在的機器學習
如果非要選擇一個2016年影響HPC的最重要趨勢,非機器學習莫屬。機器學習應用已經被證明其運算需求不亞于任何傳統的超算應用。作為人工智能的范疇,機器學習正在推動互聯網搜索、圖像識別、語言翻譯、推薦引擎和自動駕駛技術等應用上。同時機器學習也被列入到傳統HPC的工作流程和工程科學研究中。
因此機器學習也已經引起了許多IT供應商和用戶的目光,決定是否從現在開始重寫如芯片、系統和軟件開發的規則,并推出針對機器學習的解決方案。NVIDIA在2016年成為了機器學習的最大受益者之一,因為研發較早,為大型企業和汽車供應商開發基于GPU的機器學習解決方案,公司的股票在2016年增長了2倍,被業界廣泛認可。
IBM和英特爾也正在努力成為智能機器競爭的領跑者,IBM擁有Watson平臺,倡導認知計算,英特爾也提出了全新的AI戰略;同時,谷歌、亞馬遜、微軟等軟件巨頭也加大了構建軟件生態系統的力度,如工具和應用程序,這無疑給機器學習基礎設施提出了更高的要求;在可預見的未來,機器學習的發展將更加良性。
二、英特爾面臨的激烈競爭
雖然2016年NVIDIA在的機器學習領域大獲成功,但英特爾依然主宰高性能計算領域,因為超過90%的HPC系統配置了英特爾處理器,甚至包括了使用NVIDIA GPU加速的機器。盡管多年來,包括AMD、OpenPOWER供應商和ARM處理器的供應商努力攫取更大的市場份額,但迄今為止還無法撼動英特爾在高性能計算領域的統治。
雖然沖擊英特爾的結果不理想,但競爭還在繼續。AMD試圖通過即將推出的32核心的ZEN“Naples”處理器,重返服務器市場的競爭中,該處理器預計在2017年第二季度發貨。這是AMD從2011年推出Bulldozer架構后,再次發力服務器市場所做的努力。由于許多數據中心客戶渴望替代英特爾的方案,那么ZEN也許會扭轉AMD在服務器市場的局勢。
在過去幾年中,IBM所倡導的OpenPOWER計劃希望借開放Power架構讓自己更加主動。在2014年,OpenPOWER獲得美國能源部大單,價值3.25億美元合同,為勞倫斯·利弗莫爾國家實驗室和橡樹嶺國家實驗室開發和部署全世界最先進的基于IBM Power9的超級計算機系統。從那之后,雖然IBM稱在Power在HPC領域有所斬獲,但其他OpenPOWER供應商卻逐漸遠離了這一領域。
三、ARM欠HPC一個承諾
ARM服務器本應該在2016年進入數據中心(HPC、企業和云),但卻并不順利。經過半年的硬件開發和生態系統構建后,基于ARM的服務器目前僅僅在幾個HPC設施的研究項目中,而在主流數據中心中只是曇花一現。來自Cavium或AppliedMicro的ARM處理器解決方案還沒有火,后者已經與MACOM達成收購協議,而且MACOM表示將剝離AppliedMicro的計算業務。
在2016年最值得矚目的ARM服務器供應商非高通莫屬,高通的市值超過1000億美元,體量龐大。高通近日發布了48核心的Centriq 2400服務器SoC,并計劃在2017下半年發貨,未來高通可能會成為英特爾在數據中心市場最有力的競爭對手。
同時,ARM專為高性能計算和數據中心而設計的ARMv8-A可伸縮矢量擴展(SVE),已經由富士通簽下授權,并將應用于Post-K exascale系統中;但短期內ARMv8-A限于市場規模其前景還不明朗。
四、加速器和manycore處理器的進步
2016年,英特爾的Knights Landing Xeon Phi和NVIDIA的P100 Tesla GPU推出了一系列的多核協同處理器,都比上一代處理器速度提升了兩倍。雖然二者都是為了加速浮點密集型應用而進行的多核設計,但它們的加速模型路徑已經發生了改變,Xeon Phi可以作為獨立CPU運行,而P100 Tesla GPU仍需要連接CPU;每種方式都要考慮在性能與易用性之間的權衡,但最終選擇權還在客戶手中。
多核協處理器趨勢已經十分明朗,就是其可以獲得比多核CPU更好的功率和性能。許多的高速超級計算機,以及最節能的超級計算機,依靠加速器來提供大多數的flops。而它們沒有得到廣泛應用的的主要原因是可編程性的改善;如果說英特爾相比NVIDIA的優勢在哪里?那就是Xeon Phi與Xeon在使用相同的開發工具和軟件組件上,沒有本質區別。
FPGA在2016年發展迅速,主要受到兩個事件的影響。英特爾收購Altera,以及微軟在Azure云中廣泛部署FPGA。英特爾預計,到2020年30%的數據中心服務器將配置FPGA,執行機器學習、加解密,數據壓縮,網絡加速和科學計算等任務。微軟正在嘗試將它變為現實,在Azure引入FPGA以實現百萬億浮點運算(exaflop)能力來支持人工智能服務。未來10年FPGA的發展,也許2016年是重要的分水嶺。
五、E級超算 向前一步向后一步
美國政府正在大力醞釀新一代的超級計算計劃,美國能源部的E級超算項目重新調整其時間表,預計2021年完成首個系統的基礎工作,比原計劃提前了至少1年,以獲得E級超算競賽的主動權。而中國希望在2020年之前完成第一臺E級超算機器的運行,而法國的CEA也將在同年完成E級超算的部署。
于此同時,日本的E級超算計劃卻推遲了1-2年。富士通原計劃在2019年向RIKEN提供Post-K exascale系統,并于2020年投入生產。據推測,延遲的原因是半導體設計問題,這可能與實施新的ARMv8-A SVE處理器設計有關。
高性能計算在不斷的卡位競爭下推動向前,可能沒有人會特別關心誰先逾越E級超算的里程碑。隨著機器學習的大力發展,單純的角力超算性能高低的熱度會逐漸降低。不論怎樣,高性能計算都是技術和應用不斷取得進步的試金石。