最近,連續四次蟬聯超級計算機世界第一的“天河二號”遇到了麻煩,4月9日,美國商務部發布報告,決定拒絕英特爾公司向中國的國家超級計算廣州中心出售至強芯片用于天河二號系統升級的申請。國家超級計算長沙中心、廣州中心、天津中心和國防科技大學四家國家超算中心被列入出口管制名單。
美國方面給出的解釋是這4家中國超算中心從事“違反”美國國家安全或外交政策利益的活動。而據《華爾街日報》報道,美國商務部曾于今年2月18日發布一份通知稱,使用了兩款英特爾微處理器芯片的天河二號和早先的天河1號A系統,“據信被用于核爆炸模擬”。
美國暫時不賣芯片了,中國的超級計算機還有戲嗎?這得從頭說起。
一、超級計算機的由來
其實,計算機最早就是從超級計算機開始的,無論是第一臺機械計算機(英國巴貝奇爵士設計,未最終完成),還是第一臺電子計算機Eniac,都是做科學計算和軍事用途用的。
計算機性能的擴展有兩條道路,一條的不斷改進制造工藝,提升芯片設計水平,把單個芯片設計的很強悍,提升性能。還有一條道路是盡可能用比較多的機器并行,用多機機器一起運算來提升性能。
早期,超級計算機都是昂貴的高級貨,處理器是專門設計的,芯片組是配套的,甚至每根連接線都是定制的,成本極高。
而隨著PC和網絡的發展,人們發現追求強大的計算能力可以不那么昂貴。于是,人們開始嘗試用大批量生產的PC或者工作站來攢超級計算機。
若干臺PC或者工作站通過網絡連接起來,把任務分給這些機器并行,然后返回,計算能力絲毫不弱于昂貴的專用超級計算機,于是傳統的超級計算機開始沒落。
這個時代出現了很多平民化的超級計算機,譬如用浩鑫HTPC準系統湊起來的超級計算機,把一個學校的MAC電腦湊起來的超級計算機等等,這些看似玩具的東西居然一度占據了TOP500超級計算機排行榜,甚至谷歌自己用的服務器也是用這種辦法攢出來的。
而在這個過程中,人們發現,限制超級計算機能力居然是功耗,人們不能堆積太多的數量是因為功率和發熱限制,性能功耗比甚至比性能本身更重要。
于是,IBM開發出藍色基因,不追求單個核心的高性能,而是降低功耗,攢更多的數量來提升性能。但是因為單獨開發這種處理器在批量和成本上無法與通用的PC處理器相比,并沒有流行開。
二、從CPU到協處理器
索尼為了提升PS3游戲機的性能,聯合IBM搞了Cell處理器,這是異構計算的開始。因為在計算任務中,有些任務是簡單的,不需要復雜的邏輯處理,只需要足夠的計算單元暴力計算,這樣處理器就可以設計成兩部分,一個簡單的運算核心,幾個強大的簡單計算單元,這就是Cell的思路。
因為這種計算編程難度太高,所以Cell用在游戲機上并不成功,但是這個思路可以拿到電腦上,這就是我們熟悉GPU通用計算。
因為3D的需求,顯卡有強大的計算能力,這種能力只用于3D游戲浪費了,于是在Cell之后就有了GPU的通用計算,CPU處理復雜任務,GPU處理暴力計算,nVIDIA甚至搞出來CUDA專門解決這個問題,而且在GPU的設計上就為通用計算做了優化。
單臺計算機異構化,獲得強大的計算能力,那么就可以把這些單臺計算機聯網,組成計算能力強大的異構超級計算機。
于是中國在2009年搞出來天河一號超級計算機,就是CPU和GPU異構組成的超級計算機,一度排名世界第一。百度搞人工智能的計算機也是這種異構的超級計算機。
如果以后超級計算機全部異構化,那么CPU提供的計算能力只占一小部分,這無疑代表了nVIDIA和AMD要搶Intel的飯碗,Intel當然不能坐以待斃。
于是Intel開始自己做異構用的芯片,這就是Larrabee計劃,其實GPU本來就是一個個小的計算核心,然后組合起來。而Intel手里是有小核心的,這就是當年的奔騰一代處理器核心P54C。
Intel把這款20年的老核心集成起來做成眾核,做成協處理器,可以做3D顯卡,也可以做超級計算機的協處理器。這個項目初期失敗了。但是,Intel在這個基礎上發展出來了“眾核架構”(MIC)的Xeon Phi協處理器。并且獲得了天河2號(目前世界第一超級計算機)的選用。
而協處理器的能力取決于單個小核心的計算能力,P54C這個20年前的核心弱爆了。而Silvermont作為Intel反擊移動市場的利器,性能功耗比非常出色,于是,Intel把這個小核心攢起來做成眾核的Xeon Phi,這就是Knights Landing,也就是目前被禁售的處理器。
三、美國禁售會有影響嗎?
從技術上看,Xeon Phi相比nVIDIA和AMD的產品,優勢在于支持X86指令集,編程和編譯都比較方便,易用性更好。如果美國真的嚴格執行禁售,那么中國可以采購nVIDIA和AMD的產品,實際上天河一號就是用的AMD的顯卡作為協處理器。
而從這次禁售的范圍看,國家超級計算長沙中心、廣州中心、天津中心和國防科技大學四家國家超算中心被列入出口管制名單,這幾個都與軍方有一定關系。國家深圳超算中心,國家濟南超算中心,上海超算中心都沒有在管制名單以內,中國購買Xeon Phi并沒有障礙。
而且Xeon Phi作為Intel上貨架的產品,即使對中國全面禁售,世界這么大,中國通過轉口貿易進口也毫無問題。
所以,這次禁售更像是一次政治秀,起不到太大的作用。
四、中國自己有替代品嗎?
這次禁售更像政治秀,而即使美國真的全面禁售,在超級計算機方面,中國也是留有后招的。
中國早在1999年就買到Compaq公司的Alpha處理器的授權。Alpha處理器一款技術成功,商業失敗的處理器,其性能遠超越同時代的X86處理器,但是商業上卻失敗,其研發人員后來去了Intel和AMD,AMD公司的K7所使用的EV6總線技術,Intel的超線程技術,都是Alpha處理器的遺產。
中國買下Alpha的授權以后,逐漸發展出來了神威系列。2012年9月16日安裝在山東省的國家超級計算濟南中心就是使用神威1600處理器。
在技術指標上,16核心的神威1600在1.1ghz的時候,雙精度浮點運算能力是140.8G,i7 980xe 6核心在3.2ghz,雙精度浮點是107.55G。i7的功耗是130W,神威1600的功耗是70W。神威在性能功耗比上已經超越了當時的Intel。
而在協處理器的發展上,Alpha在10多年前就預留了64核的眾核架構,必要時候替代Xeon Phi也是完全可能的。
正如我們前面所說的,專用處理器專用架構價格高昂,使用困難。所以神威只是備用的后招,天河還是用Intel的處理器。
但是,一旦Intel真的買不到,中國自己也是有替代品的,神威性能足夠,無非成本和便捷程度有差異罷了。
所以,此次美國禁售芯片更像是一次政治秀,對中國超級計算機的發展并沒有實質性的影響,相反,它會給我們的決策部門提醒,讓中國自己的處理器產業有更好的發展環境。禁售阻擋不了中國超級計算機進步的腳步。