計算芯片迎來新一輪創新熱潮
人工智能等創新應用基于海量數據分析發展而來,對計算芯片提出更高要求。除數據洪流催生計算芯片處理能力提升的普遍訴求外,以人工智能為典型代表的強算力消耗型應用創新更是極大提升了對計算芯片的需求。據統計,自2012年以來,人工智能訓練任務使用的計算能力每3.5個月提升一倍,隨著深度學習網絡模型日益復雜、數據樣本持續擴大,其對計算能力的需求和消耗與日俱增,對計算芯片提出更高要求。
計算芯片體系不斷擴展,由通用計算向專用計算延伸。在通用計算芯片領域,CPU、GPU、FPGA是三大主流架構,其中CPU適用于處理復雜性強、重復性低的串行任務;GPU適合通用并行處理,應用領域由早期圖像處理逐步拓展至通用加速;FPGA具備可重構特性,可根據客戶需求靈活定制計算架構,適合于航空航天、車載、工業等細分行業。在專用計算領域,滿足人工智能應用計算需求的專用計算芯片成為創新的焦點所在,現已吸引科研機構、互聯網企業、中小創新企業等加速布局,搶占市場發展先機和生態戰略高地。
三大主流通用計算芯片持續升級。一方面持續挖掘傳統架構技術潛力。CPU不斷優化現有架構技術能力,采用亂序執行、超標量流水線、多級緩存等技術提升整體性能表現;GPU持續探索高效的圖形處理單元、流處理單元和訪存存取體系等;FPGA不斷強化應用功能和軟件開發工具的豐富完善,降低開發者門檻。另一方面均通過引入專用計算能力迎合人工智能等新興領域的計算需求。CPU圍繞深度學習計算需求增加專用計算指令,如ARMCortex-A76芯片通過優化縮減深度學習常見的乘法累加運算周期等,實現邊緣側人工智能計算性能近4倍的提升;GPU持續優化針對人工智能計算的專用邏輯運算單元,英偉達圖靈架構GPU芯片中內置全新張量計算核心,利用深度學習算法消除低分辨率渲染問題;FPGA提升異構計算能力,以實現邊緣智能等更多場景的規模應用。
結合應用場景個性需求定向優化,面向人工智能的專用計算芯片差異化創新加速。現階段以深度學習為主的人工智能專用計算主要包括訓練和推理兩部分。其中,模型訓練需實現高性能、高精度、通用化的計算能力,目前英偉達GPU芯片占據應用規模優勢,據統計,全球有超過3000家企業采用其產品進行深度學習項目研發。推理階段則因應用場景的不同而各具差異,云端推理芯片需實現高通量、低延時、通用化的計算能力,目前GPU、FPGA及專用計算芯片均有應用;端側推理芯片則需滿足低時延或低功耗等差異化場景需求,智能手機、安防監控、自動駕駛等成為首輪爆發焦點,參與者不僅包括高通、英特爾、英偉達等傳統芯片巨頭,也包括谷歌、百度、寒武紀、地平線等新進入者。