日前,“SEMICON China 2017國(guó)際半導(dǎo)體展”在上海盛大開幕,“SEMICON China 2017國(guó)際半導(dǎo)體展”由國(guó)際半導(dǎo)體設(shè)備與材料協(xié)會(huì)(SEMI)和中國(guó)電子商會(huì)(CECC)共同舉辦,多家公司參加了本次盛會(huì)。
上海兆芯集成電路有限公司副總裁傅城博士在會(huì)議上公布繼開先ZX-C系列處理器之后,兆芯最新一代ZX-D系列4核和8核通用處理器目前已經(jīng)成功流片。此外,媒體還報(bào)道:在展會(huì)上業(yè)內(nèi)人士還向我們透露,兆芯將在明年(2018年)推出16nm的ZX-E 8核CPU,并公開了Fritz Chess Benchmark國(guó)際象棋性能測(cè)試的成績(jī)。而且在測(cè)試成績(jī)的圖片上還有“兆芯處理器媲美國(guó)際主流水準(zhǔn)”的字樣。
其實(shí),這并不是兆芯第一次宣稱其處理器媲美國(guó)際主流/國(guó)際整體水平。在“十二五”科技成果展上,兆芯官方資料宣稱:國(guó)產(chǎn)X86通用處理器的成功自主研發(fā)和量產(chǎn),令國(guó)產(chǎn)處理器在性能方面完成了一次跨越式的提升,從“十二五”初期的不足國(guó)際整體水準(zhǔn)的10%提升到了目前的80%。
但實(shí)際上,兆芯在“十二五”科技成果展上的宣傳,和這次Fritz Chess Benchmark測(cè)試成績(jī),以及所謂的“兆芯處理器媲美國(guó)際主流水準(zhǔn)”是有較大水分的。
Fritz Chess Benchmark測(cè)試成績(jī)存在的問題
根據(jù)公布的Fritz Chess Benchmark國(guó)際象棋性能測(cè)試的成績(jī),一些媒體在報(bào)道中宣稱:運(yùn)行在3.0GHz頻率下的ZX-E8核心處理器性能已經(jīng)超過了AMD的FX-8370處理器,非常接近采用Skylake核心的英特爾Core i5-6600處理器,意味著國(guó)產(chǎn)處理器的性能提升了一大步。
而根據(jù)圖片中顯示,ZX-D的測(cè)試分?jǐn)?shù)與Intel I3 6300相當(dāng)。圖片中的這種表達(dá)方式,很容易讓人認(rèn)為ZX-D(8核版)性能與Intel I3 6300處理器相當(dāng),ZX-E與Intel i5 6600處理器性能相當(dāng),超越了AMD的FX 8370,并使宣傳圖片上所謂的“兆芯處理器媲美國(guó)際主流水準(zhǔn)”實(shí)至名歸。
然而,這個(gè)圖表中的測(cè)試成績(jī)其實(shí)是存在一些問題的,經(jīng)不起推敲。舉例來說,Intel I5 7500的測(cè)試成績(jī)就很有問題。
眾所周知,這些年Intel雖然在降低能耗,提升核顯性能上下了不少功夫,但在CPU性能提升上就非常吝嗇了,每一代產(chǎn)品更新近乎是一點(diǎn)一點(diǎn)擠牙膏,以至于Intel被廣大網(wǎng)友冠以“牙膏廠”的美譽(yù),而I5 6600和I5 7500理論上提高不大。Spec測(cè)試定點(diǎn)成績(jī)的話,CPU性能大約提高5%。而在這個(gè)兆芯公布的測(cè)試中性能提高了將近3000分。
但實(shí)際上,14000分的測(cè)試成績(jī),即便是Intel I5 7600K也達(dá)不到這個(gè)分?jǐn)?shù)。根據(jù)第三方測(cè)試,Intel I5 7600K的測(cè)試成績(jī)?yōu)?2000+分,而主頻更低的Intel I5 7500測(cè)試成績(jī)根本不可能比Intel I5 7600K的分?jǐn)?shù)更高。
拔高國(guó)外廠商產(chǎn)品也就罷了,但發(fā)布錯(cuò)誤的測(cè)試成績(jī),壓低國(guó)外廠商的產(chǎn)品測(cè)試分?jǐn)?shù),來抬高自己,這種做法就非常值得商榷了。
Intel I3 6300的測(cè)試成績(jī)存在略顯偏低的情況,實(shí)測(cè)I3 6100都有將近7800分,與圖表中公布的Intel I3 6300的測(cè)試結(jié)果相當(dāng),而Intel I3 6300比Intel I3 6100主頻更高一些,測(cè)試的成績(jī)也應(yīng)當(dāng)會(huì)高一些。如果說I3 6300的分?jǐn)?shù)偏差還可以用測(cè)試誤差來解釋,那FX 8370的成績(jī)就有點(diǎn)匪夷所思了。
AMD FX 8370的測(cè)試成績(jī)有很大問題,兆芯提供的圖表中,F(xiàn)X8370的成績(jī)只有9000多分,但這個(gè)分?jǐn)?shù)大約只和FX 6350差不多。FX 8370的分?jǐn)?shù)要比兆芯公布的成績(jī)高很多。
根據(jù)網(wǎng)絡(luò)公布的測(cè)試,F(xiàn)X 8350的國(guó)際象棋分?jǐn)?shù)就已經(jīng)達(dá)到12000分左右了,F(xiàn)X 8370的測(cè)試成績(jī)只會(huì)比FX 8350分?jǐn)?shù)高,有的測(cè)試中跑出了12751,還的測(cè)試甚至跑出了13546分的成績(jī)(這個(gè)成績(jī)可能是超頻下取得的)。而在兆芯提供的圖表中,F(xiàn)X8370的成績(jī)只有9300多分,明顯少了3000多分。由于偏差幅度實(shí)在是太大,這已經(jīng)不能用測(cè)試誤差來自圓其說了。
必須要說的是,這里給ZX-D和ZX-E作為參照的CPU中,還有并未在中國(guó)大陸開售的。比如AMD的Zen,圖表中的四核的Zen中國(guó)大陸目前還買不到,也就無法去證實(shí)其實(shí)際性能。在圖表中一些測(cè)試數(shù)據(jù)存在明顯問題的情況下,挑出一些跑象棋測(cè)試明顯吃虧的CPU(比如雙核的G4500,原因下文會(huì)介紹),或者目前中國(guó)大陸還買不到的CPU(四核Zen),或者故意大幅壓低作為直接對(duì)比的fx 8370的測(cè)試成績(jī)來做參照,很容易使人產(chǎn)生一些聯(lián)想。
特別是一些媒體根據(jù)圖表報(bào)道的結(jié)論,“運(yùn)行在3.0GHz頻率下的ZX-E8核心處理器性能已經(jīng)超過了AMD的FX-8370處理器”,這完全是將FX 8370處理器的測(cè)試成績(jī)壓低3000多分的前提下,得出的結(jié)論。
Fritz Chess Benchmark測(cè)試并不能說明全面問題
首先要說明的是,F(xiàn)ritz Chess Benchmark測(cè)試并不說明全面問題。Fritz Chess Benchmark測(cè)試的是多線程,核心數(shù)越高,測(cè)試成績(jī)就越好。象棋剛出現(xiàn)的時(shí)候確實(shí)是重要的cpu測(cè)試軟件,主要考驗(yàn)cpu分支預(yù)測(cè)效率的高低,缺點(diǎn)就是流水線流不起來,不體現(xiàn)cpu絕對(duì)性能的好壞。但隨著技術(shù)的進(jìn)步,分支預(yù)測(cè)效率都達(dá)到了頂峰,Intel、IBM、AMD這些國(guó)際大廠在分支預(yù)測(cè)上大多不相伯仲。所以只要核數(shù)主頻類似,緩存性能差不多,哪怕微結(jié)構(gòu)和制程有差距,象棋分?jǐn)?shù)也都差不多,衡量?jī)r(jià)值就變小了。
據(jù)多位有十年以上工作資歷的工程師表示:這個(gè)測(cè)試程序?qū)儆诜种芗统绦颍创a是不斷地判斷,全是if else嵌套多達(dá)5-6層,碰到分支密集型程序,分支預(yù)測(cè)器猜不準(zhǔn)的情況下,流水線就會(huì)不斷中斷,再好的設(shè)計(jì)都沒有用了。
換言之,就是碰到分支密集型程序基本上哪個(gè)處理器都做不好,也就是說,這個(gè)測(cè)試中流水線會(huì)流不起來,在用強(qiáng)弱CPU做對(duì)比的時(shí)候,會(huì)縮小不同CPU之間的性能差距,抹殺部分Intel、AMD這樣國(guó)際大廠產(chǎn)品的性能優(yōu)勢(shì)。
所以性能比較要全面,拿各種各樣的測(cè)試程序來綜合測(cè)試,反應(yīng)各種模塊的性能。SPEC2000/2006要測(cè)試20多個(gè)程序,而且覆蓋廣泛,代表性強(qiáng),是比較權(quán)威的測(cè)試。像spec cpu2006測(cè)試的26個(gè)程序就基本上能說明問題。不僅Intel、ARM這樣的國(guó)際巨頭會(huì)有SPEC測(cè)試成績(jī),國(guó)內(nèi)龍芯、申威、飛騰都會(huì)公開CPU的SPEC2000/2006測(cè)試成績(jī),并說明使用的編譯器、操作系統(tǒng)等測(cè)試環(huán)境。
比如之前被認(rèn)為裸CPU性能可以匹敵Intel E5的飛騰2000,即便飛騰有國(guó)防科大這樣的特殊背景,但也不避諱公布SPEC測(cè)試成績(jī),其SPEC測(cè)試成績(jī)也非常亮眼:
在2GHz主頻下,采用GCC4.8編譯器,SPEC2000和SPEC2006的測(cè)試成績(jī)分別為:
SPECint_base2000:1610 SPECint_base2006:12.4
SPECfp_base2000:1589 SPECfp_base2006:11.3
SPECint_rate2000:690 SPECint_rate2006:570
SPECfp_rate2000:615 SPECfp_rate2006:482
正是如此亮眼的成績(jī),使得飛騰2000贏得了谷歌、百度等大公司的青睞,飛騰也成為國(guó)內(nèi)ARM服務(wù)器出貨量的領(lǐng)頭羊。
而在SPEC測(cè)試成績(jī)上,兆芯的官方網(wǎng)站上一直對(duì)此諱莫如深,因而外人也很難去評(píng)估其實(shí)際裸CPU性能。目前,比較罕見的公開資料是《面向C4350AL處理器的GCC移植與優(yōu)化》。
在該論文中,中國(guó)科學(xué)院軟件研究所對(duì)兆芯C4350AL做的SPEC2006測(cè)試,測(cè)試結(jié)果為:
SPECint_base2006:8.4
SPECfp_base2006:5.5。
下圖附帶了《面向C4350AL處理器的GCC移植與優(yōu)化》論文中所有子項(xiàng)的測(cè)試成績(jī)。
不過,C4350AL是兆芯早些時(shí)候的產(chǎn)品,其實(shí)就是VIA Nano的馬甲。由于在核心微結(jié)構(gòu)上一直穿馬甲——兆芯過去的做法一直是拿VIA的技術(shù)改制造工藝堆核心數(shù)量。ZX-D核心微結(jié)構(gòu)到底有多少修改還是未知數(shù)(核心微結(jié)構(gòu)到底是否改得動(dòng),有多少源代碼是VIA的陳舊代碼,有多少是國(guó)內(nèi)工程師自己新寫的,有多少是向第三方購(gòu)買的?),加上沒有其他中立權(quán)威機(jī)構(gòu)做SEPC測(cè)試,并給予公開成績(jī)的情況下,也就只能用中國(guó)科學(xué)院軟件研究所測(cè)試的C4350AL的成績(jī)作為借鑒了。
作為參照,Intel I5 4460的SPECint_base2006和SPECfp_base2006的成績(jī)都在30以上,即便是Intel多年擠牙膏,性能也是有提升的,Intel最新CPU的SPEC2006測(cè)試成績(jī)只會(huì)更高。
單線程性能非常有限
而本次公布的Fritz Chess Benchmark測(cè)試,這里其實(shí)玩了一個(gè)小手段,網(wǎng)絡(luò)上公布的兆芯Fritz Chess Benchmark國(guó)際象棋性能測(cè)試成績(jī)其實(shí)是有貓膩的。Fritz Chess Benchmark顯示的是多線程性能,也就是說,如果測(cè)試的CPU核心數(shù)越多,那么,測(cè)試結(jié)果會(huì)越高。
覆蓋的指令集老舊也是Fritz Chess Benchmark測(cè)試的一個(gè)問題,而且這個(gè)測(cè)試成績(jī)僅僅測(cè)試定點(diǎn)成績(jī),并不測(cè)試浮點(diǎn)性能。測(cè)試對(duì)核心數(shù)、主頻、緩存等因素比較敏感,比如E5 2650 v2有8核16線程和20m緩存,即便默認(rèn)頻率只有2.6G,跑分依舊高達(dá)兩萬多。
但Fritz Chess Benchmark測(cè)試對(duì)很多方面的考察不足,特別是對(duì)一些單線程性能強(qiáng)勁,但核心數(shù)較少,或者是閹割了緩存的CPU就會(huì)存在測(cè)試成績(jī)和該CPU在實(shí)際使用中的表現(xiàn)不匹配的情況。比如圖表中作為參照,只有雙核的Intel G4500、Intel I3 6300處理器,以及圖表中緩存相對(duì)小一些的AMD A10 7890。
具體來說,ZX-E是8核CPU,而ZX-E與Intel i5 6600測(cè)試分?jǐn)?shù)差距大約為10%,本質(zhì)上是8核對(duì)比4核的結(jié)果,換言之,如果就以單線程(單個(gè)CPU核)性能來說,按照網(wǎng)絡(luò)上公布的Fritz Chess Benchmark測(cè)試成績(jī),目前還處于PPT狀態(tài)的ZX-E連Intel i5 6600的一半都不如。
同樣,8核版的ZX-D在圖表中能的數(shù)據(jù)能夠媲美Intel I3 6300處理器也是8核對(duì)比雙核的結(jié)果,雖然Intel I3 6300處理器的超線程特性會(huì)給測(cè)試帶來一定加成,但本質(zhì)上來說Intel I3 6300依舊是雙核,等于是用ZX-D 8核的成績(jī)對(duì)比Intel I3 6300雙核的成績(jī)。換言之,就是ZX-D 8核綁在一起的性能約等于Intel I3 6300雙核的性能。如果以這個(gè)象棋測(cè)試為基準(zhǔn),換算為單線程性能的話,ZX-D的單線程性能可謂慘不忍睹。
也許有人會(huì)說,多線程性能過得去不是也挺好?為何要執(zhí)著于單線程性能?
其實(shí),作為桌面CPU,最重要的就是單線程性能,因?yàn)樽烂嫫脚_(tái)程序都是串行的,如果單線程性能上不去,用戶體驗(yàn)會(huì)很糟糕,即便是8核、16核CPU,在單線程性能不足的情況下,實(shí)際用戶體驗(yàn)很可能會(huì)反而不如雙核CPU——在使用中很有可能出現(xiàn)網(wǎng)絡(luò)上調(diào)侃的“1核有難,7核(15核)圍觀”的情況。
此外,很多應(yīng)用往往做不到8核/16核優(yōu)化,不少都是雙核優(yōu)化的,比如大量國(guó)產(chǎn)網(wǎng)絡(luò)游戲。而恰恰國(guó)產(chǎn)網(wǎng)絡(luò)游戲的用戶數(shù)量還真不少,換言之,就是面對(duì)國(guó)產(chǎn)網(wǎng)絡(luò)游戲的CPU非常有市場(chǎng)。如果用單線程性能有限,但卻有8個(gè)核心的CPU,比如8核版的ZX-D來運(yùn)行這些雙核優(yōu)化的網(wǎng)絡(luò)游戲,用戶體驗(yàn)會(huì)非常差,實(shí)際的游戲體驗(yàn)反而不如之前圖表中,測(cè)試成績(jī)不如ZX-D的Intel G4500。
這也是玩國(guó)產(chǎn)網(wǎng)絡(luò)游戲,Intel I3系列CPU雖然只有雙核,但實(shí)際游戲體驗(yàn)卻勝過AMD一系列6核、8核CPU的原因——這些年,AMD雖然開發(fā)出了一系列6核、8核CPU,但無論在用戶體驗(yàn)上,還是在商業(yè)上,都不是Intel的雙核、四核CPU的對(duì)手,而且近乎處于被碾壓的狀態(tài)。甚至有網(wǎng)友調(diào)侃“I3默秒全”,這種說法的根源也在于Intel的CPU在單線程性能上遠(yuǎn)遠(yuǎn)強(qiáng)于其他公司的X86 CPU。
就商業(yè)上來說,AMD這些年這一大票單線程性能不行的6核、8核CPU顯然是失敗的,而兆芯CPU的單線程性能比AMD都有不小差距,ZX-D和ZX-E將來在商業(yè)市場(chǎng)上的前景就可想而知了,只能仰仗兆芯強(qiáng)悍的背景,向黨政軍推廣采購(gòu)了。事實(shí)上,某地方政府一直在不遺余力推廣兆芯,下圖來自其政府采購(gòu)網(wǎng)。
而AMD最新的Zen顯然是AMD總結(jié)經(jīng)驗(yàn)后嘔心瀝血之作,其最大的特點(diǎn)就是大幅提升了單線程性能,Zen的微結(jié)構(gòu)性能已經(jīng)與Intel的Haswell相當(dāng),雖然Haswell是數(shù)年前的產(chǎn)品,但考慮到Intel這些年一直擠牙膏,Zen的性能還是很不錯(cuò)的,而這也是AMD對(duì)Zen寄予厚望的原因。
因此,對(duì)于桌面CPU,單線程性能才是最重要的,單純堆核心數(shù),然后用某一個(gè)特定的、以偏概全的、非權(quán)威測(cè)試說明多線程性能接近Intel的某些CPU,而非像飛騰那樣公開SPEC2000/2006測(cè)試數(shù)據(jù),就宣稱“兆芯處理器媲美國(guó)際主流水準(zhǔn)”,這絕非科學(xué)客觀的態(tài)度。