日前,ARM在深圳召開了2015 ARM Tech Forum,會(huì)議上沒有太多新東西。還是前一段發(fā)布的A72架構(gòu)和CoreLink CCI-500,不過近來,ARM一直對(duì)Intel把持的服務(wù)器和數(shù)據(jù)中心市場很感興趣。
ARM高級(jí)副總裁Pete Hutton樂觀表示到2017年ARM將在服務(wù)器芯片市場占有5-10%的份額,Canaccord銀行的分析師更樂觀認(rèn)為到2018年ARM將能贏得服務(wù)器芯片市場的20%的份額。
為何ARM如此有信心?在Intel把持的服務(wù)器市場,ARM會(huì)有機(jī)會(huì)嗎?
一、A72架構(gòu)和CoreLink CCI-500
長期以來,ARM走的都是低功耗,低性能路線,產(chǎn)品性能距離桌面的X86處理器很遠(yuǎn),更不用說服務(wù)器芯片了。但是隨著智能手機(jī)的不斷升級(jí),和PC市場的停滯,這個(gè)性能差距越來越小。
在A9之后,ARM意識(shí)到自己無法在性能和功耗之間兼顧,于是推出了大小核的策略,ARM稱之為big.LITTLE,在低負(fù)載用小核心,高負(fù)載用大核心,平衡性能與功耗的矛盾。這樣ARM就可以不太顧及功耗發(fā)展高性能核心。
第一款產(chǎn)品是A15,第二代是A57,如今的A72理論上是第三代產(chǎn)品。按照ARM的說法,Cortex-A72是其性能最出色、最先進(jìn)的處理器,構(gòu)建在Cortex-A57的基礎(chǔ)之上,性能可達(dá)Cortex-A15 3.5倍。不過,從架構(gòu)圖和規(guī)格表上看,A72和A57并沒有本質(zhì)的不同,仍舊最多四核心,一級(jí)二級(jí)的緩存容量都沒變,只是做了一些細(xì)節(jié)調(diào)整,比較明顯的變化是砍去了NEON SIMD引擎中的加密擴(kuò)展功能,總線接口擴(kuò)展到128bit。
ARM自己則說是通過過對(duì)讀寫指令操作的不斷優(yōu)化以及細(xì)節(jié)上的創(chuàng)新提升了性能降低了功耗。
不過,我們要知道,按照ARM這種性能算法,A57比A15也有1.9倍的性能提升。那是建立在20nm對(duì)28nm工藝的基礎(chǔ)之上的。同樣,A72這個(gè)所謂3.5倍的性能提升,也是建立在16nmfinFET對(duì)28nm的工藝優(yōu)勢上。如下圖:
實(shí)際上,ARM的A57在同頻下相對(duì)于A15只有25%-30%的提升。1.9GHZ的A15跑specint2000,大約是1100分,1.7GHZ的A57跑specint2000是1250分。
按照ARM的比例,3.5倍的A72相比1.9倍的A57只提升了1.84倍,估計(jì)同頻A72相對(duì)于A57大約也是25%左右的提升。也就是1.7Ghz的A72跑Specint2000大約在1550分。
而根據(jù)前不久華為提供的內(nèi)部測試的數(shù)據(jù),同頻同工藝下,A72相對(duì)于A57只有大約5%的性能提升。功耗也只下降了5%左右。
華為的數(shù)據(jù)或許沒發(fā)揮出A72的潛力,但是A72相比A57在核心上的進(jìn)步并不如ARM描述的那么大恐怕是事實(shí)。
核心上進(jìn)步不太大,真正的進(jìn)步是 CoreLink CCI-500,CoreLink CCI-500最大的變化就是增加了一個(gè)“探聽過濾器”(Snoop Filter),從而使探聽控制不再局限于單個(gè)簇內(nèi)部的CPU之間,可以擴(kuò)展到整個(gè)處理器的所有核心。
過去,ARM雖然支持多核心,但實(shí)際上是四個(gè)核心一個(gè)簇,簇內(nèi)部是有偵聽的,可以解決緩存一致性的問題,而簇之間是沒有的,所以從四核心到八核心會(huì)有一定的性能下降。
而ARM提倡的大小核恰恰是八核心的,這次增加“探聽過濾器”可以提升多核心的性能。而 CoreLink CCI-500最多支持的CPU簇從2個(gè)增加到4個(gè),每個(gè)簇可以支持四個(gè)處理器,這樣算最多可以支持16個(gè)處理器。
處理器增加,多核心效率提升,這就給進(jìn)軍高性能建設(shè)鋪好了路。
在內(nèi)存性能方面,ARM宣稱CoreLink CCI-500可以提升30%的內(nèi)存性能。再加上CoreLink CCI-500的內(nèi)存貸款提升到了四通道128-bit內(nèi)存位寬,這樣數(shù)據(jù)的吞吐能力也有可觀的提升,這對(duì)服務(wù)器來說至關(guān)重要。
所以,ARM的信心來源還是技術(shù),在大小核戰(zhàn)略之后,ARM的大核心性能已經(jīng)有了長足進(jìn)步,單個(gè)核心已經(jīng)逼近Intel當(dāng)年的酷睿2處理器,但是功耗卻不大。性能功耗比不錯(cuò)。
另外一方面, CoreLink CCI-500提升了核心的支持?jǐn)?shù)量,提升了多核心效率,還提升了內(nèi)存性能與帶寬,這都對(duì)服務(wù)器的性能是好事。
ARM的野心勃勃來自于技術(shù)的提升。
二、ARM有機(jī)會(huì)嗎?
其實(shí)ARM進(jìn)軍服務(wù)器不是現(xiàn)在才開始提的,2011年Calxeda推出了搭載480個(gè)ARM處理器核心的低功耗服務(wù)器,惠普的微服務(wù)器也采用Calxeda的芯片,2013年百度采用MARVELL的ARM處理器搭建服務(wù)器。
但是這些嘗試都失敗了,因?yàn)楫?dāng)年的ARM處理器太弱,如今ARM憑技術(shù)進(jìn)步想要卷土重來,它有機(jī)會(huì)嗎?
單純從性能看,ARM確實(shí)有了進(jìn)步,現(xiàn)在用ARM指令集的芯片做服務(wù)器,在多核心支持上,內(nèi)存帶寬上都值得嘗試。
但問題是,服務(wù)器不僅僅是個(gè)性能問題。多年以來,在硬件上、軟件上、網(wǎng)絡(luò)標(biāo)準(zhǔn)上,Intel已經(jīng)深耕多年,IBM、HP這類巨頭也已經(jīng)在Intel的戰(zhàn)車上捆綁了多年。
即使在IBM自己的PowerPC的小底盤,也是有成型的標(biāo)準(zhǔn)規(guī)范,ARM作為一個(gè)后來者加入,很難被接受。
你換用了ARM指令集的芯片,你的儲(chǔ)存設(shè)備能否配套,原來的軟件怎么辦?原來的系統(tǒng)怎么辦?原來的數(shù)據(jù)備份怎么處理?
這種轉(zhuǎn)換的成本非常之高,幾乎不可能遷移。
而Intel也不是固步自封,在智能手機(jī)市場,Intel雖然走錯(cuò)了路,但是追的很快。目前,Intel的智能手機(jī)芯片性能并不比ARM差。雖然在智能手機(jī)上因?yàn)榘沧肯到y(tǒng)的原因發(fā)揮不出來,但是到了服務(wù)器市場,換上Intel熟悉的軟件環(huán)境,就是ARM有力無處使了。
在服務(wù)器上,Intel同級(jí)別的芯片完勝ARM,用戶完全可以用Intel的低功耗芯片方案來解決問題,成本會(huì)比換用ARM更低。
而且Intel還防御性的收購了Altera,真正要做低功耗低成本,ARM也不是對(duì)手。
在高性能領(lǐng)域,Intel有眾核方面,其效率也不是ARM靠堆芯片所能比擬的。
所以,從硬件到軟件,用戶都沒有換馬的必要,嘗試ARM不過是試水而已。
雖然ARM自己的技術(shù)進(jìn)步了不少,但是在服務(wù)器市場機(jī)會(huì)依然渺茫。