在剛剛結(jié)束的Hotchips 2015會議上,一家成立不久的中國企業(yè)公布了一顆代號”火星”的ARM指令集64核心處理器。令人震驚的是,這顆由中國團隊開發(fā)的CPU擁有媲美Intel公司最頂級服務(wù)器芯片的性能,毫無疑問是目前ARM陣營最強大的處理器。
Phytium,中文名飛騰,是一家成立于2012年的年輕CPU研發(fā)企業(yè)。然而光是從公司名稱和所在地——廣州,我們就可以知道這家企業(yè)的真實身份。飛騰公司是中國國防科技大學(xué)高性能處理器研究團隊建立的企業(yè),而國防科大在IT界最為人熟知的作品就是天河2A超級計算機——連續(xù)五屆奪得世界超算排行榜性能冠軍。天河2A的部分芯片采用了國防科大自主開發(fā)的Sparc指令集CPU,飛騰1500。顯然,飛騰公司的名稱就是取自這款產(chǎn)品。公司選址在廣州也是為了靠近廣州超級計算中心,也就是天河2A的所在地。
與中科院計算所知名的龍芯處理器團隊不同,國防科大的CPU研發(fā)機構(gòu)在公眾眼中沒什么名氣。事實上,早在十年前業(yè)內(nèi)就有傳聞指國防科大正在逆向山寨Intel的IA64體系處理器安騰。后來安騰CPU在市場上舉步維艱,NUDT(國防科大英文縮寫)也停止了對其模仿的工作,轉(zhuǎn)而開發(fā)采用Sparc指令集的高性能芯片。經(jīng)過數(shù)年的努力,NUDT先后研制出飛騰1000、飛騰1500兩款服務(wù)器處理器,開始逐漸為業(yè)界所知。
天河系列超算開始在全球超算領(lǐng)域嶄露頭角后,國防科大將眼光放到了更遠的未來。天河2A和之前的一系列國產(chǎn)超級計算機均采用Intel、Nvidia、AMD等美國企業(yè)生產(chǎn)的處理器,其計算能力、軟件編寫嚴(yán)重依賴這些外國公司。若想自己掌控超級計算機的研發(fā)節(jié)奏,研制自主知識產(chǎn)權(quán)的高性能處理器是必經(jīng)之路。此時,學(xué)校的CPU團隊經(jīng)過幾代產(chǎn)品的研發(fā)已經(jīng)頗具實力,他們便擔(dān)負起了設(shè)計有著世界一流水平的CPU的重任。
如今,NUDT的努力結(jié)出了碩果。Hotchips 2015大會上,飛騰公司介紹了他們的”火星”,一顆兼容ARMv8指令集,四發(fā)射亂序執(zhí)行,擁有多達64個核心,主頻達到2GHZ的服務(wù)器CPU。
在標(biāo)準(zhǔn)測試集Spec 2006中,”火星”的多核整數(shù)分?jǐn)?shù)高達672,浮點分?jǐn)?shù)585。相比之下,Intel目前最強的處理器Xeon E7-8890v3和Xeon E5-2699v3的整數(shù)、浮點成績分別是680和460,"火星”的性能足以與它們媲美。
“火星”的核心代號為”小米”,這個名字足夠令許多人浮想聯(lián)翩了。不過取這個名字很可能只是巧合,因為飛騰公司與制造智能設(shè)備的小米公司并沒有任何關(guān)聯(lián)。”小米”核心是典型的現(xiàn)代高性能處理器微架構(gòu)設(shè)計,四發(fā)射、兩個浮點單元,不長的流水線和三級緩存方案。它顯然并不是為密集浮點運算設(shè)計的產(chǎn)物,單周期雙精度浮點輸出只有4Flop。但是"小米"核心的訪存結(jié)構(gòu)設(shè)計很激進,192個寄存器、單核心512K L2、2M L3的設(shè)計非常像Intel的Haswell微架構(gòu)。”火星”采用二維mesh多核互聯(lián)結(jié)構(gòu),每8顆”小米”核心組成一個陣列,每個陣列有一個雙通道DDR3-1600內(nèi)存控制器;8個陣列組成”火星”芯片,總共64個核心、32M二級緩存、128M三級緩存和16通道內(nèi)存,205G/s理論內(nèi)存帶寬。芯片上還有32個PCIe 3.0通道。
“火星”的理論浮點計算能力是512G DP Flops,采用28nm制造工藝,主頻2GHZ,核心運行電壓不足1v。雖然整個芯片面積達到了嚇人的640平方毫米,但是滿載功耗只有120w,甚至比使用22nm先進工藝,性能相當(dāng)?shù)腦eon E5-2699v3、E7-8890v3都低一截。ARM陣營性能功耗比較強的優(yōu)勢過去僅僅體現(xiàn)在移動設(shè)備使用的低功耗芯片上,而飛騰公司證明了即使在高性能服務(wù)器處理器領(lǐng)域,兼容ARM指令集的處理器也能取得對同時代Intel頂級產(chǎn)品的功耗優(yōu)勢。
“火星”的量產(chǎn)版本預(yù)計會在2016年推出,預(yù)計會首先用在國防科大下一代超級計算機(可能命名為天河3)上。不久前,國防科大展示了一款用來取代Intel Xeon Phi浮點運算芯片的計算卡Matrix 2000,預(yù)計下一代天河會使用”火星”和Matrix 2000的組合來搭建。
除了”火星”,飛騰公司還展望了他們針對主流市場開發(fā)的”地球”處理器。”地球”顯然是”火星”的簡化版,核心數(shù)量可能減至4-16個,面向桌面PC、低功耗服務(wù)器等市場。從”火星”單核心Spec測試集成績來看,8核心的”地球”就可以提供與Intel Core i7 四核處理器接近的多線程性能,而功耗可能還有優(yōu)勢。而兼容ARMv8指令集意味著無論是”火星”還是”地球”都可以輕易運行安卓、Linux系統(tǒng)和市面上無數(shù)的應(yīng)用,甚至可能兼容微軟的Windows 10。性能差距不復(fù)存在后,ARM陣營進軍桌面PC和服務(wù)器市場挑戰(zhàn)x86的地位也就有了足夠的底氣。飛騰公司不僅僅做到了世界一流水平,更為重要的是他們?yōu)檎麄€ARM陣營建立了信心:
從此之后,再也無人能質(zhì)疑ARM指令集是否能開發(fā)出高性能產(chǎn)品了,x86體系在PC、服務(wù)器市場稱雄二十年后,終于遇到了強大的對手。
而值得國人驕傲的是,這一歷史性時刻是一家之前默默無聞的中國企業(yè)創(chuàng)造的。自從2006年Intel發(fā)布酷睿2處理器以來,十年時間里除了老牌巨頭IBM,未曾有任何企業(yè)挑戰(zhàn)Intel性能冠軍的寶座。
如今,第一個向老大哥扔出巨斧的不是AMD,不是Nvidia,也不是一眾歐美企業(yè),而是幾年前還背著”山寨”惡名的中國團隊。即使是業(yè)界最老資格的前輩,此刻也應(yīng)向年輕的飛騰致以敬意。
毫無疑問,”火星”的發(fā)布會大大刺激ARM陣營的發(fā)展,直接影響未來數(shù)年的CPU產(chǎn)業(yè)格局。照此趨勢發(fā)展下去,我們很快就會在桌面、高性能服務(wù)器領(lǐng)域看到ARM與x86的直接對抗。當(dāng)Intel的神話不再閃耀,IT產(chǎn)業(yè)又會迎來一個高度競爭的全新時代。