而這也正是華為海思、高通、蘋(píng)果等企業(yè)能夠在芯片業(yè)務(wù)上一年一旗艦的快速推出產(chǎn)品的核心原因。
當(dāng)然,既然已經(jīng)在智能終端領(lǐng)域只手遮天,下一步就必然是利潤(rùn)更豐富、前景更好的數(shù)據(jù)中心領(lǐng)域了。
在2011至2013年,以高通、Calxeda、SeaMicro為首的ARM陣營(yíng)曾向數(shù)據(jù)中心領(lǐng)域發(fā)起了一輪聲勢(shì)浩大的進(jìn)攻。
希望憑借更好的能效、海量的核心數(shù)量來(lái)在云化數(shù)據(jù)中心領(lǐng)域攫取一塊市場(chǎng)。不過(guò)面對(duì)強(qiáng)大的Intel以及相對(duì)貧弱應(yīng)用和生態(tài)系統(tǒng),當(dāng)初信心滿(mǎn)滿(mǎn)的各路ARM英豪最終也都偃旗息鼓。
高通數(shù)據(jù)中心業(yè)務(wù)被邊緣化,甚少有新消息傳出,SeaMicro被AMD收購(gòu),Calxeda耗盡現(xiàn)金流倒地而亡……
雖然第一批ARM數(shù)據(jù)中心方案的探索者沒(méi)有成功,但ARM并沒(méi)有放棄自己對(duì)數(shù)據(jù)中心市場(chǎng)的野心。被迫退回原有市場(chǎng)的ARM做了兩手準(zhǔn)備,并在5年之后重新殺向數(shù)據(jù)中心市場(chǎng)。
發(fā)力HPC領(lǐng)域
2011年,日本超算Kyo在人類(lèi)歷史上首次實(shí)現(xiàn)了10petaflops(億億次)的計(jì)算性能。從Kyo開(kāi)始,人類(lèi)也就開(kāi)始了向E級(jí)計(jì)算(百億億次)挑戰(zhàn)的征程。
根據(jù)全球各大超算強(qiáng)國(guó)公布的下一代E級(jí)超算時(shí)間表來(lái)看,美國(guó)、中國(guó)、日本和歐盟的對(duì)應(yīng)產(chǎn)品都將在2020-2023年之間完成組裝和調(diào)試。而除了性能之外,各國(guó)對(duì)E級(jí)超算的核心需求除了性能之外就是自主可控了。
由于沒(méi)有自己的專(zhuān)屬處理器架構(gòu)(Intel、AMD及IBM同為美國(guó)公司,他們掌握核心專(zhuān)利的x86、POWER架構(gòu)可以理解為美國(guó)的專(zhuān)屬產(chǎn)品),中國(guó)、日本及歐盟無(wú)一例外的將目光投向了更加開(kāi)放的ARM架構(gòu)。
其中中國(guó)的天河3號(hào)將采用飛騰公司研發(fā)的FT2000Plus64核ARM芯片(中國(guó)另有一套曙光公司的神威E級(jí)方案,處理器采用SW26010,屬于RISC架構(gòu))。
日本的后京(PostKyo或PostK)將采用富士通的A64fxARM架構(gòu)64核心處理器;而歐盟的E級(jí)超算雖還沒(méi)有明確具體架構(gòu),但預(yù)計(jì)會(huì)在CPU方面采用ARM架構(gòu)、在加速卡方面采用RISC-V開(kāi)源指令集。
巨頭們的選擇雖然有些無(wú)奈,但在RISC-V、OpenSPARC等開(kāi)源架構(gòu)中,ARM仍舊是平臺(tái)生態(tài)最好、產(chǎn)品最完善的一種。
另一方面,ARM公司在ARMv8.2A架構(gòu)中加入的SVE(ScalableVectorExtension)技術(shù)也能夠在很大程度上提升對(duì)應(yīng)的ARM處理器在大規(guī)模互聯(lián)場(chǎng)景中的性能表現(xiàn),使其更適合應(yīng)用在HPC這種大規(guī)模集群之上。
至此,在象征計(jì)算技術(shù)最前沿的E級(jí)超算領(lǐng)域,ARM架構(gòu)基本占領(lǐng)了五分之三的份額,實(shí)現(xiàn)了對(duì)數(shù)據(jù)中心市場(chǎng)的躍鼎打擊。
云化數(shù)據(jù)中心里的ARM
雖然E級(jí)超算對(duì)ARM架構(gòu)青睞有加,但這顯然不能給ARM公司貢獻(xiàn)多少有意義的營(yíng)收。ARM的真正發(fā)力點(diǎn)仍需要放在商用數(shù)據(jù)中心市場(chǎng)上。
而隨著主流Linux系統(tǒng)對(duì)ARM處理器支持的越來(lái)越好,以Marvell公司ThunderX處理器為代表的ARM陣營(yíng)也開(kāi)始了向商用數(shù)據(jù)中心領(lǐng)域的再一次進(jìn)發(fā)。
在大型數(shù)據(jù)中心紛紛完成云化之后,下一步的發(fā)展方向便是容器化及其背后對(duì)應(yīng)的serverless模式。
在強(qiáng)大的Kubernetes加持下,以往復(fù)雜而臃腫的應(yīng)用和服務(wù)可以被更加輕量化、擴(kuò)展和迭代更方便的微服務(wù)模式所取代。而對(duì)于數(shù)據(jù)中心來(lái)說(shuō),這種更加碎片化的應(yīng)用交付和部署模式顯然可以進(jìn)一步提升硬件的利用率,并進(jìn)一步降低云的成本。
這種碎片化的應(yīng)用或計(jì)算在很多情況下并不會(huì)產(chǎn)生太高的計(jì)算需求,如果仍以龐大的x86CPU核心或vCPU來(lái)運(yùn)行的話(huà)顯然會(huì)產(chǎn)生一定程度的浪費(fèi)。
而以ThunderXCN99802.5GHz處理器為例,1790美元售價(jià)將包含32個(gè)核心、128線(xiàn)程以及56個(gè)PCIe3.0通道和8個(gè)DDR4內(nèi)存通道以及高達(dá)2TB的內(nèi)存支持;功耗也只是180W。
另一方面,ThunderX處理器內(nèi)部還集成了一個(gè)高性能25Gbps網(wǎng)絡(luò)控制器,相當(dāng)于為服務(wù)器提供了一個(gè)廉價(jià)的高性能網(wǎng)絡(luò)集成方案。
除了Marvell的ThunderX2之外,華為也推出了自己的鯤鵬920處理器及對(duì)應(yīng)的泰山服務(wù)器產(chǎn)品。
相對(duì)于ThunderX2,鯤鵬920直接采用了更先進(jìn)的7nm工藝和ARMv8.2架構(gòu),并在180W的TDP之下提供了64個(gè)運(yùn)行于2.6GHz頻率的核心、8個(gè)DDR4內(nèi)存通道和40個(gè)lane的PCIe4.0連接。
當(dāng)然,華為也發(fā)揮了自身在網(wǎng)絡(luò)技術(shù)方面的優(yōu)勢(shì),為鯤鵬920內(nèi)置了一個(gè)100Gb的RoCE控制器。
目前,AWS已經(jīng)批量部署了自己的基于ThunderX2方案的ARMbased服務(wù)器,并開(kāi)始對(duì)外提供服務(wù)。而各家ARMbased服務(wù)器產(chǎn)品也大多瞄準(zhǔn)云計(jì)算、分布式存儲(chǔ)等數(shù)據(jù)中心的核心應(yīng)用場(chǎng)景以及一些原生Android服務(wù)的新領(lǐng)域。
ARM在數(shù)據(jù)中心市場(chǎng)能成功嗎?
與第一次沖擊不同,此次在助推ARM向數(shù)據(jù)中心市場(chǎng)前進(jìn)的廠(chǎng)商包括了Marvell和華為等資深企業(yè)級(jí)廠(chǎng)商。
他們均在數(shù)據(jù)中心市場(chǎng)中擁有廣泛的合作生態(tài)和豐富的商業(yè)經(jīng)驗(yàn),這無(wú)疑會(huì)給ARM在數(shù)據(jù)中心市場(chǎng)中的發(fā)展提供強(qiáng)大的支持。
雖然現(xiàn)在來(lái)給ARM在數(shù)據(jù)中心市場(chǎng)上的表現(xiàn)定結(jié)論還太早,但在吸取了第一次的教訓(xùn)并獲得了強(qiáng)大的支持后,ARM未來(lái)的數(shù)據(jù)中心之路顯然會(huì)走的更好、更遠(yuǎn)。