也許是龍芯名稱中的“龍”字,承載著太多國(guó)人的希望,自誕生之初就處于社會(huì)輿論的風(fēng)口浪尖。有人說(shuō)龍芯是騙經(jīng)費(fèi)的項(xiàng)目,也有人說(shuō)龍芯的科研人員是為理想而奮斗的志士,還有人說(shuō)龍芯的科研人員“太天真”,是土八路斗美械師,自尋死路。龍芯究竟怎么樣?無(wú)數(shù)篇橫看成嶺側(cè)成峰的報(bào)道給龍芯包裹上了層層迷霧。那么今天,就讓我們一起揭開(kāi)迷霧下的真相,洞察志士的艱辛與心血。
1、龍芯的誕生
回溯歷史,中國(guó)也曾經(jīng)擁有過(guò)自己的CPU和全自主的半導(dǎo)體產(chǎn)業(yè)。但因在上世紀(jì)80年代奉行“造不如買、買不如租”、“市場(chǎng)換技術(shù)”等方針路線,不僅沒(méi)能拉近和國(guó)外的技術(shù)差距,反而把原本的家底敗得精光,國(guó)內(nèi)市場(chǎng)完全被外資占領(lǐng)。在中國(guó)失去獨(dú)立研制高性能計(jì)算機(jī)的能力之后,美國(guó)要求中國(guó)把高價(jià)進(jìn)口的高性能計(jì)算機(jī)放在透明玻璃房中,并提出了非常苛刻的要求——玻璃房門的鑰匙在美國(guó)人手里,使用用途需要向美國(guó)人匯報(bào),使用前都要經(jīng)過(guò)美國(guó)人許可。
銀河號(hào)事件、臺(tái)海危機(jī)、中國(guó)駐南聯(lián)盟大使館被炸事件給中國(guó)政府敲響警鐘,“落后就要挨打”。亡羊補(bǔ)牢,猶為未晚。中國(guó)于2000年前后重啟了一大批軍工科研項(xiàng)目,中科院計(jì)算機(jī)所也開(kāi)始著手芯片設(shè)計(jì)研發(fā)。于是,龍芯開(kāi)始了漫漫長(zhǎng)征路。
龍芯課題組成立之初是著眼于解決國(guó)防和信息安全領(lǐng)域無(wú)芯可用的困境。課題組成立于2001年,成立的時(shí)候可以說(shuō)用臺(tái)詞“七八號(hào)人,兩三條槍”來(lái)形容再合適不過(guò)了。只有一間50-60平米的實(shí)驗(yàn)室,人員也是東拼西湊——有已經(jīng)年近70,曾在上世紀(jì)70年代參與國(guó)產(chǎn)芯片研發(fā)的老研究院?jiǎn)T,聽(tīng)說(shuō)計(jì)算機(jī)所要設(shè)計(jì)龍芯,就主動(dòng)帶著幾個(gè)學(xué)生過(guò)來(lái),其中也有剛走出校門的青年學(xué)子。
課題組成立時(shí),龍芯團(tuán)隊(duì)總計(jì)也就10來(lái)個(gè)人。到2006年,龍芯團(tuán)隊(duì)逐步發(fā)展為將近100人的研發(fā)設(shè)計(jì)團(tuán)隊(duì)。到2014年,龍芯中科公司有研發(fā)設(shè)計(jì)人員將近400人。
2、龍芯是國(guó)家的“親兒子”?
龍芯的“龍”字會(huì)給國(guó)人一種錯(cuò)覺(jué),認(rèn)為龍芯是國(guó)家的“親兒子”,是用舉國(guó)體制輸送資金和人才打造的國(guó)產(chǎn)芯片。但實(shí)際上,龍芯成立之初僅僅是中科院計(jì)算機(jī)所里的一個(gè)芯片研發(fā)課題組,國(guó)家對(duì)龍芯的扶持也非常有限。
在人才方面,在課題組成立時(shí)候才10來(lái)個(gè)人, 2006年才發(fā)展到100余人,2014年才400人,可以說(shuō)龍芯團(tuán)隊(duì)的骨干人才都是自己培養(yǎng)的,不少設(shè)計(jì)師都是胡偉武親自帶出來(lái)的博士生。與之形成鮮明對(duì)比的是兆芯和宏芯的親兒子待遇——2013年4月成立的兆芯,到2015年已有員工已擴(kuò)充至1000人;而在2014年成立的宏芯,國(guó)家則直接從計(jì)算機(jī)所抽調(diào)人才,停薪留職去支援宏芯。
(胡偉武)
在資金方面,自2001年成立以來(lái),從國(guó)家863計(jì)劃、核高基專項(xiàng)中累計(jì)獲得項(xiàng)目經(jīng)費(fèi)5億人民幣。龍芯中科公司成立后,獲得北京市政府2億人民幣的股權(quán)投資。也就是說(shuō)龍芯成立至今共從國(guó)家獲得資金7億元。平均下來(lái),每年獲得國(guó)家補(bǔ)助為幾千萬(wàn)元。對(duì)比紫光、兆芯和宏芯獲得的補(bǔ)助可謂少得可憐——
2014年紫光獲得國(guó)家集成電路大基金400億元人民幣;宏芯成立時(shí)獲6億注冊(cè)資本,從2014年至今,獲得補(bǔ)助不少于20億元人民幣;兆芯成立時(shí)上海市政府出資12億元,從2013年成立至今,獲得補(bǔ)助不少于70億元人民幣。
另外,芯片研發(fā)對(duì)資金需求極大,國(guó)家對(duì)龍芯的補(bǔ)助無(wú)異于杯水車薪。
舉個(gè)列子,俄羅斯貝爾加電子的Baikal-T1處理器研發(fā)成本折算為人民幣是1.85億元,該芯片是購(gòu)買MIPS Warrior P5600微結(jié)構(gòu)集成雙核CPU,主頻1.2G,用于路由器、打印機(jī)、復(fù)印機(jī)等產(chǎn)品。如果貝爾加電子自主研發(fā)微結(jié)構(gòu)的話,成本會(huì)更高。換言之,貝爾加電子研發(fā)一枚路由器芯片的研發(fā)成本(而且還不是自己研發(fā)微結(jié)構(gòu))相當(dāng)于國(guó)家對(duì)龍芯的總投入的四分之一。若以國(guó)外巨頭作參照,則差距更大,2014年Intel研發(fā)經(jīng)費(fèi)超過(guò)100億美元,員工達(dá)10萬(wàn)余人。
3、龍芯經(jīng)營(yíng)現(xiàn)狀
自2010年龍芯市場(chǎng)化運(yùn)營(yíng)以后,龍芯選擇了走主動(dòng)挖掘民用市場(chǎng)、提升造血能力的道路,將過(guò)去的向國(guó)家要經(jīng)費(fèi)轉(zhuǎn)變?yōu)閺氖袌?chǎng)賺收入,沒(méi)有再向國(guó)家要過(guò)一分錢。
2014年,龍芯在純商業(yè)行為的收入占總收入的比重從0上升到1/3,國(guó)家安全市場(chǎng)的比重占2/3,實(shí)現(xiàn)了自主經(jīng)營(yíng)、自負(fù)盈虧、收支平衡。
4、龍芯科研隊(duì)伍兩個(gè)特點(diǎn)
一是用毛澤東思想武裝科研隊(duì)伍。
龍芯中科研發(fā)團(tuán)隊(duì)繼承了老一代無(wú)產(chǎn)階級(jí)革命家的革命精神,在技術(shù)研發(fā)走獨(dú)立自主的發(fā)展道路,不依附于國(guó)外技術(shù)體系(例如Wintel、AA)。在工作中踐行艱苦奮斗,自強(qiáng)不息的拼搏精神,每周6天班,每天加班到深夜,不少研究員以實(shí)驗(yàn)室為家。當(dāng)為解決客戶的問(wèn)題之時(shí),一周平均每天只睡3小時(shí)更是常態(tài)。雖然工資待遇很一般,工作強(qiáng)度非常大,但骨干研發(fā)隊(duì)伍異常穩(wěn)定。在龍芯公司化后,除少數(shù)研究員因計(jì)算機(jī)所科研需要外,龍芯團(tuán)隊(duì)的大部分科研人員以破釜沉舟的勇氣和決心脫離體制下海,接受市場(chǎng)的檢驗(yàn)。
二是骨干研發(fā)人員全部自己培養(yǎng)。
龍芯科研骨干基本來(lái)自國(guó)內(nèi)頂級(jí)學(xué)府,有的是所在市、縣高考狀元,有的是是科大少年班的天才少年。比如龍芯總裁胡偉武,就曾是浙江永康高考狀元,師從著名計(jì)算機(jī)系統(tǒng)結(jié)構(gòu)專家夏培肅院士,博士論文曾獲“中科院院長(zhǎng)獎(jiǎng)學(xué)金特別獎(jiǎng)”、首屆“全國(guó)百篇優(yōu)秀博士論文”,獲得了公費(fèi)出國(guó)獎(jiǎng)勵(lì),受夏培肅院士教誨,胡偉武決定留在國(guó)內(nèi)做科研。再比如入選MIT2015年TR35杰出青年創(chuàng)新人物的陳云霽,也是胡偉武的學(xué)生,他就來(lái)自科大少年班。
5、指令集
指令集就是一個(gè)編碼集合。它是用一些代碼表達(dá)讀、寫等操作,命令計(jì)算機(jī)做各種運(yùn)算的一套命令標(biāo)準(zhǔn)。指令集可分為復(fù)雜指令CISC、精簡(jiǎn)指令RISC、超長(zhǎng)指令集VLIW。
CISC指令集的每個(gè)指令可執(zhí)行若干低階操作。諸如從內(nèi)存讀取、儲(chǔ)存、和計(jì)算操作,全部集于單一指令之中,指令數(shù)目多而復(fù)雜,指令編碼格式混亂,導(dǎo)致編碼器復(fù)雜,流水線設(shè)計(jì)較為困難,指令不定長(zhǎng)也帶來(lái)指令對(duì)齊方面的額外挑戰(zhàn),因此付出了性能的代價(jià)。CISC指令集經(jīng)典代表:X86。
RISC指令集對(duì)指令數(shù)目和尋址方式都做了精簡(jiǎn),固定指令長(zhǎng)度,統(tǒng)一指令編碼格式,加速常用指令,流水線設(shè)計(jì)更容易,因此效率也更高。有一段時(shí)間,因?yàn)镽ISC的高效率,Intel在發(fā)展CISC產(chǎn)品線的同時(shí),也不得不研發(fā)了RISC處理器。RISC指令集典型代表:Alpha、Mips。
CISC和RISC與在競(jìng)爭(zhēng)的過(guò)程中相互學(xué)習(xí)、取長(zhǎng)補(bǔ)短,CISC指令集在解碼階段上實(shí)現(xiàn)向RISC類指令的轉(zhuǎn)化,將后端流水線轉(zhuǎn)換成類RISC的形式。而隨著技術(shù)發(fā)展,RISC指令集也達(dá)到數(shù)百條甚至上千條(loongISA有1907條),在指令集上殊途同歸了。
超長(zhǎng)指令集(VLIW)使用非常長(zhǎng)的指令組合,把許多條指令連在一起,以能并行執(zhí)行。因?yàn)楹虲ISC和RISC軟件生態(tài)不兼容的原因已經(jīng)很罕見(jiàn)了,Intel的安騰,英偉達(dá)的丹佛都是其代表。
龍芯選擇兼容Mips,一方面是因?yàn)檎n題組當(dāng)時(shí)只有10余名成員,人力財(cái)力精力有限。另一方面,龍芯自己定義一套指令集技術(shù)上沒(méi)有難度,但是無(wú)法兼容現(xiàn)有的計(jì)算機(jī)體系。
舉例來(lái)說(shuō),你既可以用“+”、“-”、“*”、“/”來(lái)定義加、減、乘、除和也可以用 “-”、“+”、“/”、“*”來(lái)定義加、減、乘、除,既可以用大寫漢字來(lái)“壹”來(lái)表示1,也可以用“一”來(lái)表示1。
1+1=2,這種表述方式全世界都看得懂。
但是壹+壹=貳,就只有中國(guó)人才看得懂了。
而你若將“-”定義為加,那么壹-壹=貳,就只有你自己看得懂了——因?yàn)槟銦o(wú)法讓全世界的人跟著你的指揮棒走,讓全世界人民在日常數(shù)學(xué)運(yùn)算中用“-”來(lái)表示加,無(wú)法讓全世界學(xué)校的教科書中用“-”來(lái)表示加,無(wú)法讓已經(jīng)被證明的數(shù)學(xué)公式和定理中用“-”來(lái)表示加。
因此,重新定義指令集技術(shù)上難度近乎于零,美國(guó)也一度禁止將單獨(dú)的指令集申請(qǐng)為專利,只有當(dāng)指令集與實(shí)現(xiàn)方法相結(jié)合的時(shí)候才被允許申請(qǐng)專利。
研發(fā)兼容Mips指令集的CPU,就如同我們?cè)跀?shù)學(xué)上放棄了傳統(tǒng)的漢字而使用阿拉伯?dāng)?shù)字去證明數(shù)學(xué)定理,Mips指令集和阿拉伯?dāng)?shù)字只是知識(shí)的載體而非知識(shí)本身,真正具有價(jià)值的是指令集的實(shí)現(xiàn)方法和被證明的數(shù)學(xué)定理。
ARM于2012年購(gòu)買了498條Mips指令專利,但這并不會(huì)對(duì)ARM的自主知識(shí)產(chǎn)權(quán)造成影響。同理,龍芯使用兼容Mips指令并不會(huì)對(duì)自主知識(shí)產(chǎn)權(quán)構(gòu)成影響。而真正對(duì)龍芯自主可控路線產(chǎn)生影響的是指令集的發(fā)展權(quán)——是否有資格自主擴(kuò)展指令,是否能讓軟件生態(tài)跟著你的指揮棒走。
6、龍芯的指令集
龍芯走兼容MIPS指令集發(fā)展路線,在2008年金融危機(jī)后,以比較低的價(jià)格購(gòu)買了MIPS指令的永久授權(quán),在十幾年的發(fā)展中對(duì)指令集進(jìn)行了相當(dāng)大的擴(kuò)展,逐漸發(fā)展出了自己的指令集loongISA 。
loongISA指令集共1907條指令。
源自mips:
216條mips基礎(chǔ)指令,獲得永久授權(quán)。
311條DSP指令,獲得永久授權(quán)。
自主指令:
mips基礎(chǔ)指令擴(kuò)展——148條loongEXT,
虛擬機(jī)擴(kuò)展——5條loongVM指令,
二進(jìn)制翻譯擴(kuò)展——213條loongBT,
向量指令擴(kuò)展——1014條loongSIMD
龍芯在MIPS的指令系統(tǒng)的創(chuàng)新方面已經(jīng)遠(yuǎn)遠(yuǎn)超過(guò)了MIPS公司,之所以購(gòu)買Mips指令永久授權(quán)主要是減少市場(chǎng)化過(guò)程中的麻煩。
舉例來(lái)說(shuō),Transmeta公司曾經(jīng)市場(chǎng)前景良好,但I(xiàn)ntel起訴它,打了兩年官司。雖然最終Intel輸了,但兩年過(guò)程中沒(méi)有人敢跟Transmeta做生意, Transmeta被官司拖垮了。
MIPS公司破產(chǎn)后,所擁有的技術(shù)專利分的比較散。雖然MIPS被英國(guó)Imagination公司收購(gòu),但I(xiàn)magination的主營(yíng)業(yè)務(wù)是GPU,在CPU設(shè)計(jì)方面技術(shù)底蘊(yùn)不足,它既沒(méi)有能力,也沒(méi)有意志扛起MIPS陣營(yíng)的大旗,指令集擴(kuò)展和微結(jié)構(gòu)研發(fā)都不如龍芯。
而龍芯只要保持現(xiàn)有的發(fā)展勢(shì)頭,使應(yīng)用軟件跟著龍芯走,構(gòu)建并壯大自己的產(chǎn)業(yè)聯(lián)盟,那么龍芯對(duì)Mips的擴(kuò)展就是行之有效的,而且有機(jī)會(huì)奪取Mips陣營(yíng)的主導(dǎo)權(quán)。
7、編譯器
程序員在編程的時(shí)候?qū)懙氖蔷幊陶Z(yǔ)言,但是計(jì)算機(jī)運(yùn)行的時(shí)候是機(jī)器語(yǔ)言,編譯器就是將程序員的編程語(yǔ)言翻譯成機(jī)器語(yǔ)言的工具,而編譯器的好壞也非常影響一款計(jì)算機(jī)的整機(jī)性能,比如SUN就曾經(jīng)依靠對(duì)編譯器的優(yōu)化使CPU的spec跑分提升了50%,大幅提升了整機(jī)性能和用戶體驗(yàn)。
國(guó)際上使用最為廣泛的編譯器是GCC,該編譯器對(duì)X86、ARM、MIPS、Alpha等指令集的CPU優(yōu)化各不相同,對(duì)市場(chǎng)占有率高的X86和ARM優(yōu)化得較好,版本也比較新(GCC部分代碼就是Intel提供的),但對(duì)龍芯、申威的優(yōu)化比較差,版本也比較老舊。
因此,龍芯自主研發(fā)了LCC以提高編譯器的效率,雖然LCC誕生的時(shí)間還很短,對(duì)自家CPU的優(yōu)化能力無(wú)法與Intel公司的ICC編譯器相比較,以GS464E的spec2000跑分為例,使用LCC比使用GCC4.8整數(shù)提升7%,浮點(diǎn)提升36.8%。畢竟萬(wàn)丈高樓平地起,期待龍芯能不斷提升LCC編譯效率。
8、微結(jié)構(gòu)和主頻
CPU性能(單核)=主頻*IPC(這個(gè)公式必須是同指令集才能成立,不同指令集不可比較)
主頻就是CPU工作的時(shí)鐘頻率,同一款CPU在一個(gè)時(shí)鐘周期內(nèi)完成的指令數(shù)量是固定的,因此主頻越高,完成一個(gè)時(shí)鐘周期所消耗的時(shí)間越短,CPU的運(yùn)行速度就越快。
IPC是單位時(shí)間內(nèi)調(diào)用的指令集數(shù)量,微結(jié)構(gòu)設(shè)計(jì)得越好,單位時(shí)間內(nèi)能調(diào)用的指令集數(shù)量越多,CPU的性能就越好。
微結(jié)構(gòu)好壞取決于前端設(shè)計(jì)水平,主頻的高低一方面受微結(jié)構(gòu)流水線級(jí)數(shù)的影響,但更多的是取決于后端的設(shè)計(jì)水平。
再往細(xì)的方面說(shuō),前端設(shè)計(jì)主要指芯片的執(zhí)行結(jié)構(gòu)、數(shù)字邏輯層設(shè)計(jì)、執(zhí)行狀態(tài)仿真等方面,后端設(shè)計(jì)主要指物理層電路的具體優(yōu)化,包括單元布局、時(shí)序優(yōu)化等方面。
微結(jié)構(gòu)研發(fā)不僅技術(shù)門檻高,而且費(fèi)時(shí)費(fèi)錢,一個(gè)微結(jié)構(gòu)從研發(fā)到產(chǎn)品一般需要3年,而所需資金更是難以計(jì)數(shù)。
龍芯自2001年以來(lái),共研發(fā)GS132、GS232、GS264、GS464、GS464V、GS464E共6個(gè)微結(jié)構(gòu),以龍芯及其有限的人力和財(cái)力,實(shí)現(xiàn)了以平均2.33年更新一個(gè)微結(jié)構(gòu)的發(fā)展速度,相較于國(guó)家非常有限的扶持,龍芯拿出了遠(yuǎn)遠(yuǎn)超過(guò)投入的產(chǎn)出。
龍芯在2015年8月發(fā)布的GS464E微結(jié)構(gòu)測(cè)試參數(shù)非常亮眼。根據(jù)中電集團(tuán)的測(cè)試報(bào)告,GS464E的SPEC2000使用GCC4.8編譯器跑分為:整數(shù)768/G、浮點(diǎn)1153/G,使用LCC編譯器跑分為:整數(shù)828/G、浮點(diǎn)1578/G,微結(jié)構(gòu)的效率在整數(shù)性能方面基本追平了AMD目前最好的微結(jié)構(gòu),在浮點(diǎn)性能方面接近Intel在2013年發(fā)布的Ivy,分支預(yù)測(cè)和訪存帶寬更是能直接與Ivy比肩(Intel公司2013年的Ivy和2015年的Skylake差距很小)。
現(xiàn)在,龍芯和國(guó)外巨頭在微結(jié)構(gòu)方面的差距已經(jīng)比較小了,差距主要在主頻方面和制程工藝方面。
在主頻方面,2015年發(fā)布的龍芯3A2000的主頻只有1G,而代碼已凍結(jié),即將流片的龍芯3A3000的也只有1.6-1.8G的主頻。相比之下,Intel的CPU主頻大多在3G以上,部分CPU主頻接近4G;在制程工藝方面,受限于中芯國(guó)際的代工水平,龍芯能使用的最好的制程為28nm,而市面上出售的Intel芯片制程大多為22nm,Intel最新的產(chǎn)品普遍采用14nm制程工藝。
9、 龍芯產(chǎn)品。
目前,龍芯有龍芯1、龍芯2、龍芯3三個(gè)系列。
龍芯1系列芯片的微結(jié)構(gòu)為GS232(部分型號(hào)是GS132),龍芯1A、1B、1C是龍芯根據(jù)市場(chǎng)需求研發(fā)的低功耗嵌入式芯片。
武漢數(shù)字工程研究院研發(fā)了基于龍芯1A的可信移動(dòng)終端。龍芯1B多用于工業(yè)應(yīng)用,有工業(yè)以太網(wǎng)交換機(jī)、網(wǎng)絡(luò)稅控機(jī)、北斗車載終端和嵌入式數(shù)據(jù)采集器等產(chǎn)品。龍芯1C是針對(duì)民用市場(chǎng)定義的芯片,被用于智能指紋鎖、3d打印機(jī)、開(kāi)源主板、考務(wù)終端、考勤/門禁等產(chǎn)品。龍芯1D、1E、1F是直接根據(jù)特地客戶提出的需求定制的,龍芯1D是超聲波熱表、水表和氣表測(cè)量專用芯片;龍芯1E和1F是宇航級(jí)芯片,被用于北斗衛(wèi)星。
龍芯2系列芯片的微結(jié)構(gòu)為GS264,龍芯2F被用于上網(wǎng)本和一體機(jī)等產(chǎn)品。
中國(guó)兵器工業(yè)集團(tuán)研發(fā)了基于龍芯2F+1A的四余度火控計(jì)算機(jī)系統(tǒng)。龍芯2H被用于上網(wǎng)本、防火墻、交換機(jī)、車載計(jì)算機(jī)平臺(tái)等產(chǎn)品。龍芯2K是工控芯片,用于數(shù)控機(jī)床。龍芯2J是按軍方需求定制,該芯片被用戶單位總師評(píng)價(jià)為,“已知范圍內(nèi)性能最高,設(shè)計(jì)最復(fù)雜的軍品CPU。”
龍芯3A1000微結(jié)構(gòu)為GS464被用于筆記本。
(搭載龍芯的加固平板電腦)
龍芯3B1000和3B1500微結(jié)構(gòu)是GS464V,3B1000被用于高性能計(jì)算機(jī)KD-90和超算曙光6000,KD-90集成了10片3B1000處理器,理論峰值計(jì)算能力達(dá)到每秒1萬(wàn)億次。曙光6000超算使用了2500片3B1000,另外曙光還出品了3B1500的服務(wù)器和堡壘機(jī)。
中電十四所用GS464V微結(jié)構(gòu)研發(fā)了華睿2號(hào)(DSP),華睿2號(hào)能將雷達(dá)信號(hào)處理算法提煉成FFT、FIR、相關(guān)、矩陣求逆等17種基本計(jì)算構(gòu)件,較好地解決了雷達(dá)系統(tǒng)大帶寬、高吞吐的應(yīng)用需求。龍芯3A2000和龍芯3B2000的微結(jié)構(gòu)是GS464E,龍芯3A2000有臺(tái)式機(jī)和筆記本產(chǎn)品,龍芯3B2000將被用于服務(wù)器。
10、BIOS、操作系統(tǒng)和軟件生態(tài)
在BIOS方面,龍芯聯(lián)合中電科技集團(tuán)開(kāi)發(fā)的全中文龍芯安全bios----昆侖固件。昆侖固件支持龍芯、飛騰、申威等國(guó)產(chǎn)芯片。
在操作系統(tǒng)方面,龍芯在2015年8月發(fā)布基于linux的社區(qū)版操作系統(tǒng)loongnix。此外,龍芯還支持國(guó)產(chǎn)中標(biāo)麒麟操作系統(tǒng)以及Reworks嵌入式操作系統(tǒng)。
在軟件方面,龍芯支持金山WPS文字處理,JAVA和Flash,火狐瀏覽器和Chrome瀏覽器,達(dá)夢(mèng)、金倉(cāng)、神州通用數(shù)據(jù)庫(kù),東方通、金蝶、中創(chuàng)中間件,中軟政務(wù)處理系統(tǒng)等,主要針對(duì)有信息安全要求的黨、政、軍、國(guó)企、事業(yè)單位辦公電腦和服務(wù)器市場(chǎng)。
在軟件中有很多核心代碼,針對(duì)X86和ARM的芯片都是用匯編優(yōu)化過(guò)的,而針對(duì)其它結(jié)構(gòu)是用C語(yǔ)言寫的普通功能性代碼,有著很大的優(yōu)化提升空間。
例如某單位的指揮系統(tǒng)剛移植到龍芯CPU時(shí),開(kāi)機(jī)就需要50分鐘,但經(jīng)過(guò)兩個(gè)月的磨合優(yōu)化,開(kāi)機(jī)時(shí)間降低到了30秒。又如有一個(gè)數(shù)據(jù)庫(kù),剛開(kāi)始啟動(dòng)需要10分鐘,后來(lái)降到10秒。因此,龍芯目前軟件生態(tài)的重點(diǎn)是對(duì)編譯器、C庫(kù)、JAVA、數(shù)據(jù)庫(kù)、中間件進(jìn)行優(yōu)化,以及對(duì)一些專業(yè)應(yīng)用,比如軍用的GIS應(yīng)用加速、網(wǎng)絡(luò)安全的協(xié)議棧等。
對(duì)于普通消費(fèi)者常用的軟件,因龍芯電腦的市場(chǎng)占有率過(guò)于渺小,加上龍芯人力、物力、財(cái)力都非常有限,在這方面實(shí)在是心有余而力不足,這也是民用PC市場(chǎng)基本看不到龍芯電腦的主要原因。
11、龍芯產(chǎn)業(yè)聯(lián)盟構(gòu)建
龍芯想要市場(chǎng)化運(yùn)營(yíng)就離不開(kāi)一個(gè)強(qiáng)大的產(chǎn)業(yè)聯(lián)盟的支持。目前,龍芯的合作伙伴主要有中國(guó)電子科技集團(tuán)、中航工業(yè)集團(tuán)、中國(guó)核工業(yè)集團(tuán)、中船重工、中國(guó)船舶工業(yè)集團(tuán)、中國(guó)航天科技集團(tuán)、中國(guó)核建、中國(guó)工業(yè)兵器集團(tuán)、曙光、浪潮、中科夢(mèng)蘭、銳捷網(wǎng)絡(luò)、東軟集團(tuán)、神州數(shù)碼、研華科技、中興、西安華芯、清華同方、眾達(dá)精電等。
到2014年底,龍芯下游已有兩三百家合作伙伴企業(yè),下游里僅僅是圍繞龍芯做研發(fā)的技術(shù)人員已有上萬(wàn)人。
12、 Tick—Tock發(fā)展戰(zhàn)略
龍芯將設(shè)計(jì)團(tuán)隊(duì)一分為二,一個(gè)團(tuán)隊(duì)負(fù)責(zé)前端設(shè)計(jì),任務(wù)是提升微結(jié)構(gòu),一個(gè)團(tuán)隊(duì)負(fù)責(zé)后端設(shè)計(jì),任務(wù)是提升主頻。
龍芯2015年發(fā)布的3A2000是Tock,是微結(jié)構(gòu)的提高,明年發(fā)布的3A3000是Tick,提升主頻和制程工藝。兩只設(shè)計(jì)團(tuán)隊(duì)交替進(jìn)行,猶如鐘表“滴答滴答”(Tick—Tock原意是鐘表聲“滴答”)。采用Tick—Tock發(fā)展戰(zhàn)略,不僅降低了科研人員的工作強(qiáng)度,還使產(chǎn)品更新頻率也從原來(lái)的2.3年一次更新縮短到18個(gè)月一次更新,提升了產(chǎn)品研發(fā)的效率。
13、 龍芯的名譽(yù)
龍芯的名譽(yù)毀于媒體和網(wǎng)絡(luò)。
可能是國(guó)內(nèi)部分傳統(tǒng)媒體的記者們因缺乏基本的硬件知識(shí),無(wú)法理解設(shè)計(jì)師的話語(yǔ),導(dǎo)致寫出來(lái)的文章不僅空洞無(wú)物,還詞不達(dá)意。
八股式報(bào)道模式總是一副趕英超美的科技大躍進(jìn)的口吻,將龍芯高高捧起,而現(xiàn)實(shí)卻無(wú)情的一次又一次的打臉,當(dāng)宣傳和現(xiàn)實(shí)多次沖突后,造成很多不明真相的群眾感覺(jué)龍芯就是一個(gè)大忽悠。
而國(guó)內(nèi)很多網(wǎng)媒,總是喜歡取非常聳人聽(tīng)聞的標(biāo)題,一副語(yǔ)不驚人死不休的模樣。一會(huì)兒龍芯“秒天秒地秒月球”,一會(huì)兒又把龍芯黑成奧巴馬,而一些連龍芯和漢芯都分不清的網(wǎng)民又參與其中,人人一副我比政治局更聰明的樣子,大言不慚地指點(diǎn)江山,在彼此間的網(wǎng)絡(luò)互動(dòng)中把原本應(yīng)該理性、祥和的網(wǎng)絡(luò)環(huán)境變得充斥著虐氣,使真正理性的聲音淹沒(méi)在嘈雜的奇談怪論中。
14、龍芯的性能
根據(jù)中電集團(tuán)的測(cè)試報(bào)告:
GS464E的SPEC2000使用GCC4.8編譯器跑分為:整數(shù)768/G、浮點(diǎn)1153/G,使用LCC編譯器跑分為:整數(shù)828/G、浮點(diǎn)1578/G,
用Intel的芯片對(duì)標(biāo)的話,以即將流片,也是龍芯目前性能最強(qiáng)的3A3000為例。它的整數(shù)性能相當(dāng)于Q8200,浮點(diǎn)性能相接近主頻降到1.6-1.8G的3代I5。
事實(shí)上,單純比較CPU的性能對(duì)我們普通消費(fèi)者而言意義不大。因?yàn)橛绊懹脩羰褂皿w驗(yàn)的是整機(jī)性能,CPU性能僅僅是整機(jī)性能的一方面。CPU、編譯器、操作系統(tǒng)與CPU的磨合,應(yīng)用軟件針對(duì)CPU的優(yōu)化都會(huì)對(duì)整機(jī)性能和用戶體驗(yàn)產(chǎn)生很大的影響,而后者才是龍芯目前的短板。因此,龍芯把越來(lái)越多的資源向軟件傾斜。
15、龍芯的定位
龍芯課題組成立之初是著眼于解決國(guó)防和信息安全領(lǐng)域無(wú)芯可用的困境。所有工作都是圍繞著國(guó)防和信息安全需要開(kāi)展,開(kāi)發(fā)嵌入式芯片也是為了從民用市場(chǎng)中賺錢,有了穩(wěn)定的資金來(lái)源后更好的支持用于國(guó)防和信息安全領(lǐng)域的高性能芯片研發(fā)。
對(duì)于目前的龍芯來(lái)說(shuō),PC和服務(wù)器產(chǎn)品在整機(jī)性能上和國(guó)外產(chǎn)品的差距依然很大。對(duì)于在家用PC市場(chǎng)和國(guó)外產(chǎn)品競(jìng)爭(zhēng),龍芯電腦在整機(jī)性能、價(jià)格、軟件生態(tài)方面處于絕對(duì)劣勢(shì)。以龍芯及其產(chǎn)業(yè)聯(lián)盟的實(shí)力要在商業(yè)上打敗微軟和Intel構(gòu)建的體系確實(shí)是癡人說(shuō)夢(mèng)。
未來(lái)5年內(nèi),龍芯在PC市場(chǎng)的目標(biāo)僅僅是在硬件性能穩(wěn)步提升的同時(shí),通過(guò)不斷加強(qiáng)編譯器的優(yōu)化、軟件和硬件的磨合,使龍芯電腦和服務(wù)器的整機(jī)性能和軟件生態(tài)能夠滿足黨政機(jī)關(guān)的辦公需求。
至于國(guó)內(nèi)家用PC市場(chǎng),只有等龍芯的軟件生態(tài)足夠豐富、產(chǎn)業(yè)聯(lián)盟足夠強(qiáng)大之后,龍芯的產(chǎn)品才會(huì)有競(jìng)爭(zhēng)力。
16、關(guān)于自主可控
自主,顧名思義,是自主知識(shí)產(chǎn)權(quán),不需要給國(guó)外繳納專利費(fèi),可以自由選擇發(fā)展方向和技術(shù)路線。
以龍芯為例,龍芯可以自由擴(kuò)展指令集,比如龍芯擴(kuò)展了1014條向量指令,使龍芯微結(jié)構(gòu)的浮點(diǎn)性能大幅提升,以至于都能客串DSP;
從國(guó)外購(gòu)買指令集授權(quán)的話,不僅要支付一筆授權(quán)費(fèi),而且授權(quán)到期要再購(gòu)買一次,外商每一次更新指令集還要再購(gòu)買一次。另外,還會(huì)受到很多限制,比如不具備發(fā)展權(quán),不能擴(kuò)展指令集,只能按照國(guó)外巨頭的劃定路線圖走,跟在身后亦步亦趨。
可控,指的是芯片安全可控。無(wú)論是自主指令集還是購(gòu)買國(guó)外指令集,只要是獨(dú)立自主設(shè)計(jì)微結(jié)構(gòu),就不存在安全問(wèn)題。
但如果是購(gòu)買國(guó)外微結(jié)構(gòu)授權(quán)或者仿制國(guó)外CPU則存在安全隱患。因?yàn)橘I到的微結(jié)構(gòu)若不是開(kāi)源的,對(duì)于國(guó)內(nèi)廠商來(lái)說(shuō)就是一個(gè)黑箱;即使是開(kāi)源的,光指令系統(tǒng)里的源碼至少一兩千萬(wàn)行,在完全吃透技術(shù)以前,根本沒(méi)法保證里面沒(méi)有安全隱患;仿制國(guó)外CPU很容易陷入知其然,不知其所以然的情況,無(wú)法識(shí)別CPU里的到底有沒(méi)有后門電路。
因此,要做到真正自主可控就至少要有自己的指令集和微結(jié)構(gòu),目前國(guó)內(nèi)符合條件的只有龍芯和申威。
購(gòu)買國(guó)外廠商指令集授權(quán),比如ARM指令授權(quán),自己設(shè)計(jì)微結(jié)構(gòu),雖然無(wú)法自主選擇發(fā)展路線,但是在硬件方面安全可控,而且依附于AA體系后,雖然會(huì)造成受制于人的情況。但可以不需要研發(fā)自己的編譯器,可以兼容AA體系的軟件生態(tài),大幅降低研發(fā)的技術(shù)門檻、時(shí)間成本和資金成本。在沒(méi)有自己的體系可以依托或沒(méi)有資本和技術(shù)自建體系的情況下,依附于國(guó)外體系,有利于市場(chǎng)化運(yùn)營(yíng)。
購(gòu)買國(guó)外微結(jié)構(gòu),比如ARM的A53或A57,集成自己的SOC,這種做法雖然能依附于AA體系,有利于市場(chǎng)化運(yùn)營(yíng),能賺快錢,但既不自主,也不可控,而且在利潤(rùn)方面也被外商控制。因?yàn)樵谫?gòu)買微結(jié)構(gòu)要支付授權(quán)費(fèi),每生產(chǎn)一片芯片還要支付專利費(fèi)。
而且每個(gè)環(huán)節(jié)做什么,有多少利潤(rùn),在AA體系中已經(jīng)形成潛規(guī)則,國(guó)內(nèi)IC設(shè)計(jì)公司依附于AA體系基本上淪為外商的馬仔,這也是國(guó)內(nèi)ARM陣營(yíng)IC設(shè)計(jì)公司雖然營(yíng)業(yè)收入不低,但利潤(rùn)普遍不高的原因之一。
即使是國(guó)內(nèi)IC設(shè)計(jì)公司營(yíng)業(yè)收入排行第一的海思,在有母公司輸血的情況下也曾經(jīng)連年虧損,利潤(rùn)主要依靠華為搭載海思芯片產(chǎn)品的高溢價(jià),而非在市場(chǎng)上直接出售芯片。
17、總結(jié)
龍芯課題組成立14年來(lái),忍受著社會(huì)上的冷嘲熱諷,用少得可憐的人力和財(cái)力研發(fā)了自己的loongISA,設(shè)計(jì)了6個(gè)微結(jié)構(gòu),研發(fā)了自己的LCC編譯器,開(kāi)發(fā)了自己的社區(qū)操作系統(tǒng)loongnix。推出了幾十款產(chǎn)品,涵蓋軍用芯片、宇航級(jí)芯片、服務(wù)器芯片,桌面芯片,嵌入式芯片以及這些芯片配套的軟件生態(tài)。構(gòu)建了一個(gè)涵蓋兩三百家企業(yè),上萬(wàn)名技術(shù)人員的產(chǎn)業(yè)聯(lián)盟。而這一切都是一支只有400余人的研發(fā)團(tuán)隊(duì)完成的。
相對(duì)于國(guó)內(nèi)依附于Wintel體系、AA體系的IC設(shè)計(jì)公司在技術(shù)上和利潤(rùn)上都受制于人。龍芯可以自主擴(kuò)展指令集,在發(fā)展方向上可以自主選擇;在安全可控方面,可以實(shí)現(xiàn)從軟件和硬件上同時(shí)實(shí)現(xiàn)安全可控;在利潤(rùn)方面,可以實(shí)現(xiàn)所有利潤(rùn)都留在龍芯構(gòu)建的產(chǎn)業(yè)聯(lián)盟內(nèi),國(guó)外廠商除非加入龍芯的產(chǎn)業(yè)聯(lián)盟,給龍芯當(dāng)馬仔,否則無(wú)法分走一分一毫利潤(rùn)。
下一步,龍芯將以“loongISA+LCC+GS464E等自主研發(fā)的微結(jié)構(gòu)+社區(qū)操作系統(tǒng)loongnix+軟件生態(tài)+產(chǎn)業(yè)聯(lián)盟”為基礎(chǔ),力爭(zhēng)打造自己的體系。若能成功構(gòu)建自己的體系,該體系將成為繼Wintel體系,arm+安卓體系之后的第三極,雖然弱小,但星星之火,可以燎原。