在剛剛結(jié)束的2011全國高性能計算學術(shù)年會(HPC China 2011)上,中國軟件行業(yè)協(xié)會數(shù)學軟件分會、國家863高性能計算機評測中心和中國計算機學會高性能計算專業(yè)委員會公布了最新一期“2011中國高性能計算機性能Top100排行榜”。我們首先來看一下排行榜今年的主要變化。
與去年相比,前十名中由國防科大研制、落戶在國家超級計算天津中心的天河一號A繼續(xù)保持第一的位置;由國家并行計算機工程技術(shù)研究中心研制,落戶在國家超級計算濟南中心的“神威藍光”超算系統(tǒng)取代了去年曙光星云的位置排名第二。第三位也是國防科大研制,安裝在國家超級計算長沙中心的天河一號A-HN。去年由曙光公司研制,落戶國家超級計算深圳中心的曙光星云系統(tǒng)排名第四。第五名之后的情形與去年相仿,變化不大。以下是Top10的排名:
雖然本次“神威藍光”沒有取得排名第一的成績,但對于國內(nèi)高性能計算領(lǐng)域來說具有非比尋常的意義:這是首臺全部采用國產(chǎn)CPU構(gòu)建的千萬億次超級計算系統(tǒng)。
中國計劃在天津、深圳、濟南建設3個國內(nèi)領(lǐng)先的超級計算系統(tǒng)研發(fā)、應用中心。其中天津超算中心已經(jīng)裝備了排名第一的天河一號,而深圳超算中心也在去年裝備了曙光研制的星云超算系統(tǒng)。如今,濟南超算中心正式掛牌,而這套由浪潮幫助山東信息通信技術(shù)研究院打造的“神威藍光”系統(tǒng)采用了MPP萬萬億次體系架構(gòu),全水冷散熱方式,并且處理器全部采用了江南計算所研發(fā)的“神威1600A”多核處理器。
中科院軟件所張云泉教授對記者表示,中國超級計算機全自主研發(fā)具有重大意義,不論從高速網(wǎng)絡還是從國產(chǎn)化處理器在安全性和通用計算性方面已經(jīng)達到世界先進水平。另一方面,全國產(chǎn)化的獨立自主也標志著我國高性能計算系統(tǒng)已經(jīng)可以走出國門,向其他國家出口。
全國產(chǎn)處理器顯“神威”
“神威藍光”超算系統(tǒng)是由國家并行計算機工程技術(shù)研究中心研制,獲得科技部863計劃支持,于2010年9月開始由浪潮集團承接該項目一同設計和建造而成的。該計算系統(tǒng)共計投資約6個億,建設周期2年,本次揭牌進入Top100榜單的屬于該系統(tǒng)的第一期工程。
從公布的數(shù)據(jù)上來看,“神威藍光”超算系統(tǒng)全部采用自主設計生產(chǎn)的處理器(ShenWei processor SW1600),系統(tǒng)共8704個CPU,峰值計算性能1.07016PFlops,持續(xù)性能795.9TFlops,Linpack效率74.37%,總功耗1074KW。
該系統(tǒng)采用了8700個神威SW1600微處理器,該處理器擁有16個計算核心,主頻在975~1100MHz之間——也得益于其流水線的減少,每個處理器的計算性能可以達到124.8~140.8Gflops。據(jù)介紹,該處理器的穩(wěn)定性遠勝于一般的x86集群,在Linpack測試中穩(wěn)定的跑了近9個小時,一次錯誤也沒有發(fā)生。
網(wǎng)絡方面,“神威藍光”采用了胖樹結(jié)構(gòu),節(jié)點間采用了來自Mellanox的QDR Infiniband網(wǎng)絡,其傳輸速度高達40Gbps,MPI消息延遲則小于2us。其存儲系統(tǒng)的設計容量則達到了2PB,I/O理論帶寬是200GB/s,適用于可續(xù)計算、MPICC、UPC、Fortran、C++和SWCC等常規(guī)科研環(huán)境和通用編程語言的程序。
此外,由于神威SW1600處理器的低功耗,該系統(tǒng)每個機柜擁有1024顆CPU,結(jié)合多種節(jié)能技術(shù)和水冷技術(shù)其能效比達到了741.06MFlops/W。據(jù)了解,“神威藍光”的冷卻用水是內(nèi)部封閉循環(huán),并且是來自礦泉水廠處理過的純水。該技術(shù)與以往的水冷技術(shù)相比,由于是內(nèi)部循環(huán),因此節(jié)約了大量的水消耗和風冷消耗。
另一個亮點在于“神威藍光”基于預警和數(shù)據(jù)挖掘的前瞻式主動容錯技術(shù),該技術(shù)大大提升了該系統(tǒng)的穩(wěn)定性和可靠性。而基于虛擬化的資源池結(jié)構(gòu)支持在線遷移功能,也大大方便了作業(yè)任務調(diào)度。
以下是“神威藍光”和“天河一號”以及“星云”系統(tǒng)的比較