億歐推出“芯片帝國”系列分析稿件,從芯片的核心架構、應用場景、國內外主要玩家和下游晶圓代工廠等方面呈現芯片業的產業圖景。當前AI芯片主要分為GPU、FPGA、ASIC及類腦芯片等。以下為第一篇架構篇,從通用芯片CPU及它的創始者英特爾說起,梳理AI浪潮下不同的芯片架構,及它們所構筑的科技帝國。
英特爾和CPU:開山鼻祖,集成通用芯片、PC界老大
芯片中,最令人熟悉的恐怕是中央處理器CPU了。作為一種超大規模的集成通用芯片,CPU可完成多種不同種類的任務,在PC世界里起著大腦的作用。而CPU的誕生也開始了PC時代的巨頭——英特爾的輝煌歷史。
英特爾是主要以研制CPU處理器的巨頭,全球最大的個人計算機零件和CPU制造商,1971年,英特爾推出了全球第一個微處理器,它引發的微處理器所帶來的計算機和互聯網革命,可以說改變了整個世界。
但CPU雖統治了PC時代,隨著人工智能興起,傳統的CPU算力不足這一問題便越來越突出,尤其基于CPU的傳統計算架構無法滿足人工智能并行計算的需求。AI所需的深度學習需要很高的內在并行度、大量浮點計算能力以及矩陣運算,因此在通用芯片之下,需發展適合人工智能架構的專屬芯片。這也帶來了英特爾地位的下降。
不過在更早時候,即移動互聯網大潮襲來時,CPU巨頭英特爾的劣勢就已開始顯現了。英特爾在移動端不敵來自生產ARM芯片(與英特爾X86平級的CPU架構,但采用精簡指令集計算機,主打低成本、低功耗和高效率)的ARM公司,目前世界超過95%的智能手機和平板電腦都采用ARM架構。
再加上英偉達GPU在數據中心業務的競爭,2010年還占據整個半導體芯片市場80%多份額(據IHS的報告數據)的英特爾,到2016年第二季度,僅占14.7%。
為了在人工智能時代不落后其他科技公司,英特爾近年來通過收購一批在FPGA、ASIC等芯片領域的頭部企業。在云端,2015年,英特爾收購全球第二大FPGA廠商Altera;在終端,2016年收購了研發高性能視覺處理芯片的Movidius;另外,英特爾2017年還收購了汽車領域的Mobileye,以此對抗英特爾在汽車領域的地位。
不過,今年7月,英特爾交出的財報顯示,其Q2營收為169.62億美元,凈利潤50.06億美元,同比增長78%。雖然營收、凈利潤增速不錯,但基于CPU、FPGA的數據業務并未達到之前的預期,英特爾股價還是跌了。
當然,英偉達雖然目前已有頹勢,但CPU卻也沒有到馬上要被替代的地步。
CPU雖然計算能力稍差,但它是通用計算機的處理核心,處理各式各樣的指令要求,所有部件也都要通過它互聯互通,其有著復雜的邏輯控制單元和獨特的指令翻譯結構,這是其他芯片目前難以替代的。
并且,ARM架構的CPU芯片在手機和智能音箱等領域也是不可或缺的。所以唱衰CPU,還是為時過早的。
英偉達和GPU:先發制人的“十項全能”選手,目前應用最廣泛AI芯片
CPU的計算能力漸漸落后,也催生了崛起的圖像處理器GPU及新的巨頭英偉達。1999年,英偉達發明了GPU,這極大地推動了PC游戲市場的發展,重新定義了現代計算機圖形技術,并徹底改變了并行計算。
相比CPU,GPU由于更適合執行復雜的數學和幾何計算(尤其是并行運算),剛好與包含大量的并行運算的人工智能深度學習算法相匹配,因此在人工智能時代剛好被賦予了新的使命,成為AI硬件首選,在云端作為AI“訓練”的主力芯片,在終端的安防、汽車等領域,GPU也率先落地,是目前應用范圍最廣、靈活度最高的AI硬件。
而英偉達也因此幾乎成為AI浪潮中的最大受益者,在加速深度學習算法芯片市場幾乎占壟斷地位。英偉達2016年第一個推出專為深度學習優化的Pascal GPU,2017年推出了性能更優的新GPU架構Volta,及神經網絡推理加速器TensorRT 3。目前占據全球GPU行業的市場份額超過70%,GPU作為其核心產品占據84%的收入份額。
另外,由于英偉達發布的針對開發者提供的并行計算平臺CUDA,被廣泛認可和普及,積累了良好的編程環境,目前應用在人工智能領域,可進行通用計算的GPU市場基本被英偉達壟斷。
不過英偉達在PC端和數據中心業務上,也面臨著老二AMD的挑戰。
在PC處理器市場,AMD正在英特爾主導的市場“搶食”。從2017年3月至今年4月,AMD推出了銳龍7、銳龍5、銳龍3、銳龍Threadripper、銳龍2000等處理器。數據顯示,在銳龍處理器推出后,AMD的桌面處理器市場份額已從8%增至12%;而英特爾的份額則下跌1.9%,至87.8%。
雖然,英特爾在數據中心處理器市場也占有絕對的領先地位,擁有99%的市場份額,不過野村證券稱英特爾正在試圖阻止將15-20%的數據中心處理器份額讓給AMD。
目前GPU和英偉達,在人工智能浪潮下,可以說是風頭正勁,不過在頂著“應用最廣泛AI芯片”的光環,英偉達也還面臨FPGA和ASIC等專用化程度更高、計算力更強的芯片的挑戰。
賽靈思和FPGA:“變形金剛”,算法未定型前的階段性最佳選擇
同樣能滿足更高的計算需求,并可進行編程,1984年,賽靈思(Xilinx)發明了現場可編程門陣列FPGA,FPGA作為半定制化的ASIC(專用集成電路),順應了計算機需求更專業的趨勢,成為神經網絡算法中的主流芯片。
FPGA可算是芯片界的“變形金剛”,在寫入軟件前它有勝于CPU的通用性,寫入軟件后它有類似于ASIC的表現,是算法未定型前的階段性最佳選擇。FPGA相比GPU具有低功耗優勢,同時相比ASIC具有開發周期快,更加靈活編程等特點。
在現階段云端數據中心業務中,FPGA以其靈活性和可深度優化的特點,有望繼GPU之后在該市場爆發;在目前的終端智能安防領域,也有廠商采用FPGA方案實現AI硬件加速。
FPGA市場的最大玩家是其創始者賽靈思,除了“通過系統集成和先進的‘軟件定義’開發環境所擴展的新用戶群體的服務”外,賽靈思在金融、制造業、娛樂、公共安全以及電信等傳統行業,以及在自動駕駛汽車、無人機、智能監控等新興行業都有布局。
在數據中心方面,全球七大超大規模云服務公司,已有3家采用了賽靈思FPGA,其中的百度于今年10月宣布,其已設計出賽靈思UltraScale?FPGA池。另外,賽靈思在車用電腦視覺處理市場占有率排名第二,僅次于Mobileye(2017年被英特爾收購),不過其與Mobileye間還存在著巨大差距。
賽靈思今年還收購了我國的人工智能創企深鑒科技,深鑒基于賽靈思的FPGA開發AI芯片,此前已和大華股份、東方網力等安防廠商展開合作,推出基于Xilinx FPGA的DPU產品。
不過老大賽靈思在回復如何看待阿爾特拉被英特爾收購時,傲嬌的表示:“我們依舊是第一,只是尾巴丟了”。
但由于FPGA要保證編程的靈活性,電路上會有大量冗余,因此成本上不能像ASIC做到最優,工作頻率也不能太高。因而,在ASIC還并不成熟,同時GPU功耗和成本較高的現階段發展較好。
谷歌和ASIC:“專精職業選手”,專一決定效率,AI芯片未來
隨著專用化需求的進一步發展,芯片界又誕生了ASIC。ASIC(Application Specific Integrated Circuit)即專用集成電路,本文中特指專門為AI應用設計、專屬架構的處理器芯片。
近年來涌現的類似TPU、NPU、VPU、BPU等,本質上都屬于ASIC。無論是從性能、面積、功耗等各方面,AISC都優于GPU和FPGA,長期來看,ASIC代表AI芯片的未來。
ASIC架構典型的代表,是谷歌的張量處理器TPU,其采用了脈動陣列的組織方式。2016年,谷歌TPU在AlphaGo與李世石一役中橫空出世,使AlphaGo“思考”棋招和預判局勢,處理速度比GPU和CPU快上幾十倍。令人驚艷的的TPU,也一度被認為是AI芯片業內新的攪局者。不過TPU的資歷也沒比以上幾位年輕,哈佛大學孔祥重教授在1970 s就提出了TPU的脈動陣列組織方式。
今年2月,谷歌也以Beta測試的形式開放了一直只是自用的TPU,服務的名稱為Cloud TPUs(云端TPUs),用于云端服務器。今年5月Google云端芯還發布了TPU 3.0,8月谷歌又推出一款為邊緣計算定制的Edge TPU。
不過TPU目前并不對外發售,并且要想進入更多市場,它的通用性仍需檢驗。但谷歌TPU的推出,以及測試版對中小企業的開放,還是會對英偉達帶來一定威脅。
而ASIC芯片領域,也有一大批追趕者。以我國的初創企業而言,2017年9月,華為發售的AI芯片麒麟970上的NPU(屬ASIC架構)集成了初創芯片企業寒武紀的1A處理器作為其核心人工智能處理單元。
2017年1月,地平線攜手英特爾發布基于BPU(屬ASIC架構)架構的最新高級輔助駕駛系統,12月,地平線機器人發布“旭日”和“征程”兩款嵌入式AI芯片,面向智能駕駛和智能攝像頭。
2016年,英特爾收購的視覺處理芯片企業Movidius,其研發的VPU也是ASIC芯片。
在AI算法尚處于蓬勃發展、快速迭代的今天,ASIC存在開發周期較長、需要底層硬件編程、靈活性較低等劣勢,因此目前發展速度還不及GPU和FPGA。但長期來看,ASIC是AI芯片的未來。
IBM和類腦芯片:另辟蹊徑,顛覆傳統計算架構,仍在研發
另外,在傳統架構之外,還有一類“不走尋常路”的芯片,這就是“類腦芯片”。“類腦芯片”顛覆傳統計算架構,將數字處理器當作神經元,把內存作為突觸,內存、CPU和通信部件完全集成在一起,采用模擬人腦神經元結構來提升計算能力。
“類腦芯片”以IBM TrueNorth芯片為代表,但由于技術和底層硬件的限制,其尚處于前期研發階段,目前不具備大規模商業應用的可能性。從技術成熟度和商業可行性兩個角度,使用AI專屬硬件進行加速運算是今后五年及以上的市場主流。
我國初創企業西井科技也在研發類腦芯片,其宣稱“芯片用電路模擬神經,成品有100億規模的仿真神經元,可用于基因測序、模擬大腦放電等領域”。
不過,類腦芯片的商用并不樂觀,西井目前也從研究類腦芯片轉向自動駕駛領域。
總結:諸侯混戰,同賽道糾纏,不同架構競爭
從CPU、GPU、FPGA,到ASIC及類腦芯片,從英特爾、英偉達、賽靈思、谷歌再到IBM,可以看出芯片業最近50年可謂風起云涌,而人工智能芯片的興起只是最近的一次浪潮。
GPU、FPGA、ASIC及類腦芯片等可用于AI的芯片,也只是目前登場的芯片中的一小部分,其商用場景還未完全展開。而當前的AI芯片中,應用還是以GPU領先,FPGA可能成為下一個爆點,ASIC目前是被看好、但不成熟的新星。
再看芯片巨頭的斗爭,英特爾與ARM在CPU市場、英偉達和AMD在GPU市場、賽靈思和阿爾特拉在FPGA市場上,及谷歌和一些創企在ASIC市場的競爭……而在AI浪潮下引導的芯片革新上,英特爾與英偉達,賽靈思以及谷歌又在不同芯片架構及應用場景間進行斗爭。
可以說這確實是一場“諸侯混戰”,而身處變革中的每一個巨頭,都不想在戰爭中先倒下。