然而,越是繁榮的表象,整個(gè)產(chǎn)業(yè)界越需要保持客觀與冷靜。眾所周知,作為人工智能產(chǎn)業(yè)鏈的關(guān)鍵環(huán)節(jié)和硬件基礎(chǔ),AI芯片有著極高的技術(shù)研發(fā)和創(chuàng)新的壁壘。從芯片發(fā)展的趨勢(shì)來(lái)看,我們現(xiàn)在仍處于AI芯片發(fā)展的初級(jí)階段。未來(lái)將是AI芯片發(fā)展的重要階段,無(wú)論是架構(gòu)還是設(shè)計(jì)理念都存在著巨大的創(chuàng)新空間。那么,當(dāng)前AI芯片的發(fā)展現(xiàn)狀究竟如何?下一輪的爆發(fā)點(diǎn)又將在哪里出現(xiàn)呢?
AI芯片的前生今世
經(jīng)過長(zhǎng)期的發(fā)展和探索,人工智能在近幾年取得了突破性進(jìn)展。人工智能系統(tǒng)在語(yǔ)音識(shí)別、圖像識(shí)別、圍棋、德州撲克等諸多領(lǐng)域取得了超越人的能力的成果。究其原因,業(yè)界普遍認(rèn)為,深度學(xué)習(xí)算法、海量的數(shù)據(jù)和充足的計(jì)算力這三大要素合力促成了這次突破。
其中,得益于摩爾定律在最近二十年的發(fā)展,充足的算力使得在可以接受的價(jià)格、功耗和時(shí)間內(nèi)提供人工智能算法所需的計(jì)算性能。根據(jù)英特爾的處理器芯片能力和零售價(jià)格對(duì)比測(cè)算,單位價(jià)格可以購(gòu)買到的計(jì)算力提升了1.5萬(wàn)倍,從而使“通用中央處理器”(CPU)可以支持各種人工智能任務(wù)。可以說,通過芯片技術(shù)來(lái)大幅增強(qiáng)人工智能研發(fā)的時(shí)機(jī)已經(jīng)非常成熟。然而,由于CPU要面對(duì)成百上千種工作任務(wù)來(lái)進(jìn)行設(shè)計(jì)和優(yōu)化,因此不可能犧牲靈活性來(lái)專門為某一類應(yīng)用做優(yōu)化,因此未必針對(duì)所有AI算法都是最優(yōu)的選擇。為此,出現(xiàn)了多種CPU加專用芯片的異構(gòu)計(jì)算方案,以解決計(jì)算資源和內(nèi)存訪問瓶頸的研究。此外,與“腦啟發(fā)式”(brain-inspired)的深度神經(jīng)網(wǎng)絡(luò)不同的“類腦”(brain-like)計(jì)算研究也推出了先進(jìn)的神經(jīng)擬態(tài)芯片來(lái)支持超高能效比的自然學(xué)習(xí)方式。
綜合來(lái)看,如果以設(shè)計(jì)理念進(jìn)行劃分的話,AI芯片大致可分為兩大類別。
第一類是“AI加速芯片”,它是確定性地加速某類特定的算法或任務(wù),從而達(dá)到目標(biāo)應(yīng)用領(lǐng)域?qū)λ俣取⒐摹?nèi)存占用和部署成本等方面的要求。目前,AI加速芯片的研發(fā)有兩種主要的方式:一種是利用已有的GPU、眾核處理器、DSP、FPGA芯片來(lái)做軟硬件優(yōu)化;另一種是設(shè)計(jì)專用的芯片,也就是ASIC。第二類是“智能芯片”,它讓芯片像人一樣能使用不同的AI算法進(jìn)行學(xué)習(xí)和推導(dǎo),處理包含感知、理解、分析、決策和行動(dòng)的一系列任務(wù),并且具有適應(yīng)場(chǎng)景變化的能力。目前,面向綜合、自適應(yīng)能力的智能芯片研究有兩類設(shè)計(jì)方法,一種是基于類腦計(jì)算的“神經(jīng)擬態(tài)芯片”;另一種是基于可重構(gòu)計(jì)算的“軟件定義芯片”。
圍繞這兩大方向,全球各大芯片公司都積極在人工智能領(lǐng)域進(jìn)行布局,英特爾也是如此。而英特爾的獨(dú)特之處,在于能夠提供全面的、多元化的解決方案。我們既提供多種芯片類型的產(chǎn)品,又覆蓋了從終端到數(shù)據(jù)中心的使用場(chǎng)景。在終端領(lǐng)域,可以使用Movidius、Mobileye的ASIC芯片。在邊緣計(jì)算中,可以使用ASIC芯片和FPGA芯片;在數(shù)據(jù)中心領(lǐng)域,可以靈活選擇至強(qiáng)可擴(kuò)展處理器、眾核處理器和NNP等芯片方案。此外,英特爾還通過神經(jīng)擬態(tài)芯片Loihi積極探索新的計(jì)算模式。
AI芯片的未來(lái)之路
目前,AI芯片雖然在某些具體任務(wù)上可以大幅超越人的能力,但在通用性、適應(yīng)性上相較于人類智能還有很大差距,大多數(shù)仍處于對(duì)特定算法的加速階段。從短期來(lái)看,以異構(gòu)計(jì)算(多種組合方式)為主來(lái)加速各類應(yīng)用算法的落地(看重能效比、性價(jià)比、可靠性);從中期來(lái)看,要發(fā)展自重構(gòu)、自學(xué)習(xí)、自適應(yīng)的芯片來(lái)支持算法的演進(jìn)和類人的自然智能;從長(zhǎng)期來(lái)看,則是朝著通用AI芯片的方面發(fā)展。
在我看來(lái),“通用AI芯片”是AI芯片皇冠上的明珠。它最理想化的方式是淡化人工干預(yù)(如限定領(lǐng)域、設(shè)計(jì)模型、挑選訓(xùn)練樣本、人工標(biāo)注等)的通用智能芯片,必須具備可編程性、架構(gòu)的動(dòng)態(tài)可變性、高效的架構(gòu)變換能力或自學(xué)習(xí)能力、高計(jì)算效率、高能量效率、應(yīng)用開發(fā)簡(jiǎn)潔、低成本和體積小等特點(diǎn)。就目前而言,實(shí)現(xiàn)通用AI的主要直面兩大挑戰(zhàn):一是通用性(算法和架構(gòu)),二是實(shí)現(xiàn)的復(fù)雜度。通用AI芯片的復(fù)雜度來(lái)自于任務(wù)的多樣性和對(duì)自學(xué)習(xí)、自適應(yīng)能力的支持。因此,我們認(rèn)為通用AI芯片的發(fā)展方向不會(huì)是一蹴而就地采用某一種芯片來(lái)解決問題,因?yàn)槔碚撃P秃退惴ㄉ形赐晟啤W钣行У姆绞绞窍扔靡粋€(gè)多種芯片設(shè)計(jì)思路組合的靈活的異構(gòu)系統(tǒng)來(lái)支持,各取所長(zhǎng),取長(zhǎng)補(bǔ)短。一旦架構(gòu)成熟,就可以考慮設(shè)計(jì)SoC來(lái)在一個(gè)芯片上支持通用AI。
從短期來(lái)看,我們很難期待出現(xiàn)像CPU那樣的AI通用算法芯片,AI殺手級(jí)應(yīng)用還沒出現(xiàn),未來(lái)還有很長(zhǎng)一段路要走。但必須承認(rèn)的是,AI芯片是人工智能技術(shù)發(fā)展過程中不可逾越的關(guān)鍵階段。無(wú)論哪種AI算法,最終的應(yīng)用必然通過芯片來(lái)實(shí)現(xiàn)。目前,AI算法都有各自長(zhǎng)處和短板,必須給它們?cè)O(shè)定一個(gè)合適的應(yīng)用邊界,才能最好地發(fā)揮它們的作用。因此,確定應(yīng)用領(lǐng)域就成為了發(fā)展AI芯片的重要前提。
在應(yīng)用方面,“無(wú)行業(yè)不AI”似乎正在成為主旋律,無(wú)論是人臉識(shí)別、語(yǔ)音識(shí)別、機(jī)器翻譯、視頻監(jiān)控,還是交通規(guī)劃、無(wú)人駕駛、智能陪伴、輿情監(jiān)控、智慧農(nóng)業(yè)等,人工智能似乎涵蓋了人類生產(chǎn)生活的方方面面。然而,是所有的應(yīng)用都需要人工智能嗎?我們希望人工智能解決哪些實(shí)際的問題?什么才是AI的“殺手級(jí)”應(yīng)用?這些問題目前依然等待答案。但對(duì)于芯片從業(yè)者而言,我們的當(dāng)務(wù)之急是研究芯片架構(gòu)問題。從感知、傳輸?shù)教幚恚俚絺鬏敗?zhí)行,這是AI芯片的一個(gè)基本邏輯。研究者需要利用軟件系統(tǒng)、處理器等去模仿。軟件是實(shí)現(xiàn)智能的核心,芯片是支撐智能的基礎(chǔ)。
從芯片發(fā)展的大趨勢(shì)來(lái)看,目前尚處于AI芯片發(fā)展的初級(jí)階段,無(wú)論是科研還是產(chǎn)業(yè)應(yīng)用都有巨大的創(chuàng)新空間。從確定算法、領(lǐng)域的AI加速芯片向具備更高靈活性、適應(yīng)性的智能芯片發(fā)展是科研發(fā)展的必然方向。神經(jīng)擬態(tài)芯片技術(shù)和可重構(gòu)計(jì)算芯片技術(shù)允許硬件架構(gòu)和功能隨軟件變化而變化,實(shí)現(xiàn)以高能效比支持多種智能任務(wù),在實(shí)現(xiàn)AI功能時(shí)具有獨(dú)到的優(yōu)勢(shì),具備廣闊的前景。我們相信,未來(lái)十年將是AI芯片發(fā)展的重要時(shí)期,有望在架構(gòu)和設(shè)計(jì)理念取得巨大的突破。