在麒麟950的發(fā)布會上,華為宣布用于服務(wù)器的自主芯片正在緊鑼密鼓的研發(fā)中。其實,正在開發(fā)ARM服務(wù)器芯片的遠遠不止華為,國防科大、高通、AMD等IC設(shè)計單位或公司都已經(jīng)設(shè)計出或正在設(shè)計ARM服務(wù)器芯片。
相對于ARM的32位指令集授權(quán)上的謹慎,ARM對其的64位指令集授權(quán)則顯得非常大方,除了拉攏ARM陣營IC設(shè)計公司沖擊服務(wù)器芯片市場外,也有ARM的64位指令集自身的原因。
ARM 為什么會放松64位指令集授權(quán)?
其實,當(dāng)初的ARM的64位指令和32位指令不是一回事,兩者無法像MIPS64和MIPS32,X86 64和X86 32那樣完全兼容。ARM的64位指令某種程度上是重新定義過的,在軟件上與ARM 32位指令無法兼容,只有在系統(tǒng)狀態(tài)切換時才能在32和64位指令間切換,如果內(nèi)核是ARM 64位的,應(yīng)用是ARM 32位的,或者內(nèi)核是ARM 32位的,應(yīng)用是ARM 64位的,就會出問題。
最初的ARM的64位指令和32位指令有點類似于Intel當(dāng)年IA-32和IA-64的關(guān)系,IA-64是超長指令集(VLIW),與是CISC的IA-32不兼容。
因此,ARM之所以熱衷于推銷64位指令,根本原因就在于此,當(dāng)年Intel正是因為IA-32和IA-64的不兼容,在IA-64的生態(tài)建設(shè)上力所不逮,被AMD抓住機會做出了64位的X86服務(wù)器芯片,迫使Intel不得不推出了64位的X86芯片,并放棄了安騰,才重新占據(jù)上風(fēng)。
ARM可能是吸取了Intel當(dāng)年的教訓(xùn)——為了更快速的推廣64位指令集和建立相應(yīng)的軟件生態(tài),必然要一改過去對ARM 32位指令集授權(quán)的謹慎,選擇了向諸多頗有實力的廠商授權(quán)64位指令集,加速生態(tài)建設(shè),防止被競爭對手抓住機遇。同時,用虛擬化的辦法混跑32位和64位。在ARM 32位指令集時代,華為、國防科大等一大批原本公司或單位是不具備ARM指令集授權(quán)的,但也借著ARM推廣64位指令集的東風(fēng)拿到了授權(quán)。
不過,即便如此,指令集授權(quán)費用依舊價格不菲,據(jù)小道消息稱,國防科大拿到的授權(quán)費為每5年1億美元,而且5年后是否延續(xù)授權(quán),以什么價格都必須重新和ARM談判,雖然沒有關(guān)于華為的小道消息,但對照國防科大的條件,很有可能也是類似的價格,也是5年期的授權(quán)。
華為在ARM芯片方面有什么成就?
華為的ARM芯片最廣為人所知的就是海思麒麟了。6年前,初出茅廬的K3因為成品不夠成熟以及營銷、鋪貨策略失誤導(dǎo)致最終連在山寨機市場都無法立足,但第一次大膽嘗試給海思公司積累了寶貴的經(jīng)驗。兩年后的K3V2則是全球首個發(fā)布的集成了4核ARM cortex A9的手機芯片方案,雖然存在兼容性差、功耗大等問題,但之后的麒麟910,用Mali450MP4替換掉GC4000,并使用28nm HPM制程工藝后一舉脫胎換骨,成為海思麒麟第一款能用的SOC,榮耀3C LTE版、P7、Mate2、榮耀X1等機型在搭載麒麟910后,其性能和功耗的完美平衡倍受好評,并逐步被市場接受。
2014年5月發(fā)布的麒麟920堪稱驚艷,麒麟920采用大小核架構(gòu),集成了4核ARM cortex A7和四核ARM cortex A15,在GPU方面選擇了 Mali T628MP4。客觀地說,麒麟920在性能方面相對于麒麟910是一個質(zhì)的飛躍。良好的功耗控制和多核調(diào)度使麒麟920在保障性能滿足絕大多數(shù)應(yīng)用的同時,功耗控制得非常好,相對于處于同一檔次,并被媒體報道存在漏電瑕疵的聯(lián)發(fā)科MT6595,麒麟920在多核調(diào)度、性能和功耗的平衡方面做得更好。搭載麒麟920系列SOC的榮耀6、榮耀6plus、Mate7等機型無一例外獲得成功,其中Mate7還成為國家領(lǐng)導(dǎo)人用于贈送外賓的禮品。
2015年的麒麟930集成了8核ARM cortex A53,在GPU方面和麒麟920一樣選擇了 Mali T628MP4,在性能方面相對于麒麟920提升有限,但其基帶使用了華為自主研發(fā)的4GMSA技術(shù),在信號的穩(wěn)定性和通話質(zhì)量方面有一定提升。
最新發(fā)布的麒麟950集成了4核ARM cortex A53和4核ARM cortex A72,得益于16nm FF+工藝,麒麟950在功耗和性能的平衡上做得非常好,ARM cortex A72 在2.3G主頻下,單核功耗為1.25W,加上智能感知處理器、LPDDR4、新系統(tǒng)總線等新特性,麒麟950完全能續(xù)寫自麒麟920以來開創(chuàng)的輝煌歷史。
但華為的ARM芯片不僅僅只有麒麟。在2015年初,華為發(fā)布了集成32核ARM cortex A57的芯片,該款芯片采用臺積電16nm制程,是用于高性能、低能耗設(shè)備的網(wǎng)絡(luò)處理器。此外,在麒麟950發(fā)布會上,華為還宣布正在設(shè)計自主微結(jié)構(gòu)的服務(wù)器芯片,該款芯片一旦上市,將徹底結(jié)束華為使用ARM公版微結(jié)構(gòu)的歷史。
其實,海思的芯片是服務(wù)于華為的發(fā)展戰(zhàn)略的,并有云、管、端三個方向,“端”指的就是終端,就是大家最常見的手機芯片,也最為人所知。而“管”則廣泛用于通信領(lǐng)域,比如大家打電話,十有八九要經(jīng)過這些芯片處理。“云”的CPU市場普及,最大障礙并非技術(shù),而是軟件生態(tài)。
華為的ARM服務(wù)器能賣得好嗎?
相對于使用ARM公版微結(jié)構(gòu)的手機芯片,華為自主設(shè)計的服務(wù)器芯片才是筆者更關(guān)心的話題。不過,在短時間內(nèi),筆者并不看好ARM服務(wù)器芯片。
正如同Intel在打入手機芯片市場時,受制于軟件生態(tài),導(dǎo)致事倍功半的結(jié)果,在向PC和服務(wù)器芯片市場進軍時,ARM也遭遇到了同樣的難題。加上Intel已經(jīng)上市的低功耗服務(wù)器芯片徹底堵死了ARM通過低功耗服務(wù)器芯片侵蝕市場的可能性,導(dǎo)致ARM很難在服務(wù)器芯片市場于Intel競爭,只能靠走差異化或,政策保護的路子。
具體來說,國防科大的64核ARM服務(wù)器芯片“火星”性能不可謂不強,根據(jù)SPEC2006模擬器成績,在多核性能方面能與Intel E5比肩,但受制于相對較弱的單核性能和軟件生態(tài),將來即便和銀河麒麟操作系統(tǒng)聯(lián)手出擊,在相當(dāng)一段時間里,也只能在黨政軍市場中混口飯吃。
而高通也是看到了憑借純粹的市場競爭,ARM服務(wù)器芯片很難撼動X86服務(wù)器芯片的地位,而美國政府顯然不會為高通拉偏架打壓Intel。于是高通找到貴州省政府,成立合資公司貴州華芯通半導(dǎo)體技術(shù)有限公司,依靠中國地方政府的保護和投資獲取ARM服務(wù)器芯片的生存空間。(該公司首期注冊資本為18.5億人民幣,貴州省政府的投資機構(gòu)占股55%,美國高通公司的一家子公司占股45%。筆者認為該項合資,有可能演變?yōu)楹腺Y公司拿高通的芯片穿個馬甲,搖身一變成為具有“中國自主知識產(chǎn)權(quán)”的芯片,再由地方政府買單,借助政府的力量向黨政軍推廣,和兆芯基本一個性質(zhì))
而AMD做ARM芯片則是出于急病亂投醫(yī)——在X86芯片上被Intel多年壓著打,股價早已是低的不可思議后的無奈之舉,而且還有很強的試試水,撈一票的性質(zhì),雖然AMD的ARM宣稱能夠運行Windows。
華為的ARM芯片哪怕在1-2年后成功研發(fā),即便擁有不弱于國防科大“火星”的性能,其市場前景依舊不樂觀——很有可能要華為自產(chǎn)自銷,或者借助華為和政府、運營商之間良好的關(guān)系來打市場,非黨政軍市場的數(shù)據(jù)中心很有可能依舊以X86服務(wù)器為主流。
結(jié)語
筆者認為,華為自主設(shè)計高性能服務(wù)器芯片,其最大的意義并非在于該服務(wù)器芯片能在商業(yè)上從Intel手中搶走市場份額,而在于服務(wù)華為的“云、管、端”發(fā)展戰(zhàn)略,以及培養(yǎng)人才、鍛煉隊伍、積累經(jīng)驗和技術(shù)!
目前,國內(nèi)成功研發(fā)出安全可控高性能芯片的單位僅僅有龍芯、申威和飛騰,三者都是有著深厚的技術(shù)積累和淵源——龍芯源自中科大的技術(shù)力量,龍芯的董事長和總裁都是夏培肅院士的學(xué)生;飛騰則與哈軍工一脈相承;申威則和建國初期就存在的科研院所有很深的淵源......
相對于其他合資ARM陣營IC設(shè)計公司拿國外芯片穿馬甲,或拿ARM公版微結(jié)構(gòu)“設(shè)計”SOC的廠商來說,華為自主研發(fā)之舉顯然更具雄心,也更有在技術(shù)上開拓創(chuàng)新的勇氣。