近年來(lái),中國(guó)超算在全球范圍內(nèi)的影響力已今非昔比。20多年前,中國(guó)技術(shù)人員操作超級(jí)計(jì)算機(jī)需要在“玻璃房子”中進(jìn)行,如今中國(guó)已經(jīng)連續(xù)多年占據(jù)全球計(jì)算速度最快超算第一位。
“超算在應(yīng)用層面的滯后是我們長(zhǎng)期以來(lái)的一個(gè)痛點(diǎn)。”10月18日,2018年全國(guó)高性能計(jì)算學(xué)術(shù)年會(huì)(HPC 2018)在青島召開(kāi),中國(guó)工程院院士、浪潮集團(tuán)首席科學(xué)家王恩東在會(huì)上做主題演講時(shí)說(shuō),近20年來(lái),我國(guó)的高性能計(jì)算機(jī)不斷地在“打榜”,為了能夠在性能指標(biāo)上成為世界第一做了大量的研究性工作,然而在怎么用好超算的命題上,中國(guó)還有不少短板亟待彌補(bǔ)。
今年6月,由IBM公司研制、部署在美國(guó)能源部下屬橡樹(shù)嶺國(guó)家實(shí)驗(yàn)室的“Summit”超級(jí)計(jì)算機(jī),以浮點(diǎn)運(yùn)算速度峰值超過(guò)200PFlops的性能,超過(guò)中國(guó)“神威·太湖之光”成為新晉世界第一。不過(guò),記者觀察到,中國(guó)超算業(yè)界對(duì)此并不感到驚訝,反而是,在中國(guó)“霸榜”多年之后,越來(lái)越意識(shí)到超算終要回歸應(yīng)用這一命題。
“我想不僅僅是(依靠國(guó)家力量)做了幾臺(tái)機(jī)器,實(shí)際上在一些國(guó)內(nèi)的高性能超算中心的建設(shè)方面,我們也是在不斷地追逐新的性能指標(biāo)。”王恩東說(shuō),我國(guó)在高性能計(jì)算方面發(fā)展勢(shì)頭和氛圍都非常好,但“高性能計(jì)算發(fā)展的性能指標(biāo)跟應(yīng)用的關(guān)系”等問(wèn)題“需要我們認(rèn)真思考”。
“硬件先行”該告一段落了
王恩東介紹說(shuō),一般而言,美國(guó)或歐洲的一些超算中心,都是基于應(yīng)用來(lái)建設(shè)的。而反觀我們,“很多時(shí)候是先建超算中心再找應(yīng)用。我想說(shuō)這個(gè)階段是否可以告一個(gè)段落了?”
歐美國(guó)家對(duì)諸如超級(jí)計(jì)算機(jī)這種大型裝置的使用率向來(lái)十分重視。中國(guó)科學(xué)院計(jì)算機(jī)網(wǎng)絡(luò)信息中心總工程師閻保平告訴《中國(guó)科學(xué)報(bào)》記者,數(shù)年前她曾前往美國(guó)幾家國(guó)家級(jí)超算中心訪問(wèn),令她印象最為深刻的是,這些超算中心最大的一支隊(duì)伍不在運(yùn)維部門(mén),而是為超算用戶提供技術(shù)的部門(mén)——那里匯集了計(jì)算專(zhuān)家和各領(lǐng)域的科學(xué)家。她認(rèn)為,這種“混搭型”結(jié)構(gòu)是美國(guó)超算應(yīng)用水平居世界前列的重要原因。
“超算還是要面向應(yīng)用的。”王恩東在會(huì)上說(shuō),當(dāng)下我們應(yīng)當(dāng)以應(yīng)用為引導(dǎo),以滿足應(yīng)用、引領(lǐng)應(yīng)用來(lái)發(fā)展中國(guó)的高性能計(jì)算產(chǎn)業(yè)、技術(shù)和學(xué)術(shù)。
中國(guó)國(guó)家高性能計(jì)算機(jī)工程技術(shù)研究中心副主任何鐵寧認(rèn)為,美國(guó)之所以在“軟件推動(dòng)硬件”方面做得比中國(guó)好,深層次原因在于美國(guó)在基礎(chǔ)工業(yè)軟件、基礎(chǔ)科研方面的應(yīng)用軟件比中國(guó)豐富得多,這導(dǎo)致中國(guó)不得不反過(guò)來(lái)“以硬促軟”。不過(guò)他也認(rèn)為,“軟件的事情要馬上著手做”。
中國(guó)超算須構(gòu)建應(yīng)用生態(tài)
近年來(lái),中國(guó)超算在全球范圍內(nèi)的影響力已今非昔比。20多年前,中國(guó)技術(shù)人員操作超級(jí)計(jì)算機(jī)需要在“玻璃房子”中進(jìn)行,如今中國(guó)已經(jīng)連續(xù)多年占據(jù)全球計(jì)算速度最快超算第一位(今年6月被美國(guó)再次反超);在應(yīng)用方面,中國(guó)超算應(yīng)用團(tuán)隊(duì)也在2016年、2017年連續(xù)2年獲得超算應(yīng)用領(lǐng)域最高獎(jiǎng)“戈登貝爾獎(jiǎng)”。并且,中國(guó)也在部署下一代超算——E級(jí)超級(jí)計(jì)算機(jī),國(guó)家“十三五”高性能計(jì)算專(zhuān)項(xiàng)課題部署的3個(gè)E級(jí)超算的原型機(jī)系統(tǒng)——神威E級(jí)原型機(jī)、“天河三號(hào)”E級(jí)原型機(jī)、曙光E級(jí)原型機(jī),目前已全部實(shí)現(xiàn)交付。
無(wú)怪乎日本東京工業(yè)大學(xué)教授松崗聰早在2016年曾說(shuō):“中國(guó)已經(jīng)正式成為了高性能計(jì)算機(jī)領(lǐng)域的世界領(lǐng)導(dǎo)者之一。”
然而,如果我們向上看,與真正的超算強(qiáng)國(guó)美國(guó)相比,仍存在很多不盡如人意之處。比如,在HPC 2018會(huì)議上公布的中國(guó)超算性能Top100排行榜中,雖然第一次出現(xiàn)所有入圍高性能設(shè)備均為國(guó)產(chǎn),但多數(shù)核心計(jì)算架構(gòu)(主處理器和加速器)仍為“Intel CPU+NVIDIA GPU”或“Intel CPU+ Intel Phi”。
“今天中國(guó)超級(jí)計(jì)算機(jī)或多或少存在這樣的情況,就是我們?cè)趪?guó)際上的地位很高,但回頭照照鏡子,我們?cè)趹?yīng)用領(lǐng)域里還存在相當(dāng)大的短板。”中科曙光總裁歷軍在近日召開(kāi)的“高性能計(jì)算應(yīng)用研討會(huì)”上說(shuō),“未來(lái)我們可能還需要再花5~10年的時(shí)間,在應(yīng)用水平、應(yīng)用廣度方面跟國(guó)際發(fā)達(dá)國(guó)家縮小差距,補(bǔ)上這個(gè)短板。”
如何補(bǔ)齊這些短板?歷軍認(rèn)為,一條必由之路是基于中國(guó)自主的核心計(jì)算架構(gòu),構(gòu)建超算研制與應(yīng)用生態(tài)。
中科曙光是國(guó)內(nèi)高性能計(jì)算領(lǐng)域領(lǐng)軍企業(yè),在上述中國(guó)超算Top100排行榜中,曙光公司以40臺(tái)系統(tǒng)入圍榜單,位列該榜單廠商份額第一位。由曙光負(fù)責(zé)研制的E級(jí)原型機(jī)系統(tǒng),探索了基于國(guó)產(chǎn)CPU和加速芯片架構(gòu)的系統(tǒng)研制。
“我們希望與大學(xué)、研究所建立更緊密的合作關(guān)系,安排經(jīng)費(fèi)、資源、人員來(lái)共同營(yíng)造基于國(guó)產(chǎn)核心技術(shù)的應(yīng)用生態(tài)。”歷軍說(shuō),在曙光看來(lái),只有用好了,高性能計(jì)算機(jī)的研制才真的好了,“彼此相輔相成”。
挖掘高性能計(jì)算新的應(yīng)用領(lǐng)域
目前,超算的應(yīng)用場(chǎng)所主要仍在高校、科研院所,企業(yè)所用超算極少,而應(yīng)用領(lǐng)域也多分布在傳統(tǒng)的科學(xué)大數(shù)據(jù)分析、工程計(jì)算等方面,“用好超算”在社會(huì)各界還是個(gè)新命題——這距離HPC 2018大會(huì)主題“HPC+一切皆可計(jì)算”的愿景相去甚遠(yuǎn)。
“計(jì)算發(fā)展很快,數(shù)字產(chǎn)業(yè)化,云物移大智,我們所處的信息社會(huì)、智能社會(huì),它的支撐就是計(jì)算。”王恩東說(shuō),當(dāng)下,結(jié)合新的發(fā)展需求,業(yè)界要去思考:高性能計(jì)算新的應(yīng)用領(lǐng)域在哪?
他舉例說(shuō),當(dāng)前云計(jì)算發(fā)展態(tài)勢(shì)迅猛,但云計(jì)算不等于高性能計(jì)算;人工智能計(jì)算(AI)也在快速發(fā)展,且高性能計(jì)算能夠?yàn)锳I提供一些支撐,但AI計(jì)算也不是高性能計(jì)算。
他認(rèn)為,中國(guó)高性能計(jì)算產(chǎn)業(yè)“相比國(guó)外也是落后的”。這源于中國(guó)在發(fā)展高性能計(jì)算之初就是“研究和產(chǎn)業(yè)兩條線”。“西方國(guó)家是山峰就在山脈里面,我們的山峰是在海洋里面的。”王恩東說(shuō),“單純依靠國(guó)家財(cái)政支出去支撐一兩臺(tái)峰值計(jì)算機(jī),對(duì)中國(guó)超算持續(xù)健康發(fā)展可能是不利的。”
閻保平認(rèn)為,十幾年前我國(guó)高性能計(jì)算機(jī)硬件落后,經(jīng)國(guó)家推動(dòng)后掘起了;現(xiàn)在是應(yīng)用軟件落后,“指揮棒”應(yīng)該往應(yīng)用這邊偏了。“在部署高性能計(jì)算機(jī)研制的時(shí)候,國(guó)家對(duì)應(yīng)用軟件、算法的部署應(yīng)一并跟上,而且要側(cè)重做一些突破性的投入和研發(fā)。超算硬件、軟件是一體化的,這樣才能提高國(guó)家高性能計(jì)算的整體實(shí)力。”