初始階段,由于不需考慮功耗等原因,人工智能的芯片可以追求高算力、高并發(fā)、高吞吐量,現(xiàn)階段的解決方案一般是以“GPU+CPU”的異構(gòu)模式來完成。同時,這種方案主要面向各大AI企業(yè)及實驗室的訓(xùn)練環(huán)節(jié),目前市場中由于AMD在此方面的長期缺失,導(dǎo)致深度學(xué)習(xí)GPU加速市場由NVIDIA一家獨大。
但隨著人工智能逐漸在云端展開應(yīng)用,對AI芯片則提出了更多要求,在兼顧高性能的同時,還需要兼顧功耗及反應(yīng)時間。而作為半定制的專用集成電路FPGA(現(xiàn)場可編程門陣列)恰好能夠滿足要求,其特點是能耗低,同時具有低延時、高吞吐的特性,可以滿足人工智能在云端運行的需求。目前,F(xiàn)PGA市場Xilinx和Altera兩家占據(jù)絕對壟斷地位,市場份額接近90%。
未來,人工智能技術(shù)注定要進(jìn)一步下放至終端設(shè)備,由于物理原因受限,因此芯片的功耗、面積、成本都需要進(jìn)一步優(yōu)化。主要解決方案為獨立ASIC與SoC+IP兩種;獨立ASIC可以通過定制化的設(shè)計來實現(xiàn)性能更加優(yōu)越、保密性更強的芯片,但缺點是開發(fā)周期較長,投入成本巨大,一般公司難以承受。SoC+IP在ASIC的開發(fā)弊端上具有很大的優(yōu)勢,但缺點是功能拓展性較弱,此前華為發(fā)布的昇騰系列AI芯片便按照此種方案開發(fā)。
雖然ASIC有種種開發(fā)上的困難,但是作為專用集成電路,其性能與功耗的優(yōu)勢卻是顯而易見的。在人工智能神經(jīng)網(wǎng)絡(luò)計算中,與傳統(tǒng)計算有一定的區(qū)別,導(dǎo)致進(jìn)行神經(jīng)網(wǎng)絡(luò)計算時,CPU、DSP、GPU都有算力、性能、能效等方面的不足,所以產(chǎn)生了專為神經(jīng)網(wǎng)絡(luò)計算而設(shè)計處理器或加速器的需求。由于ASIC屬于定制類的芯片,涉及重新設(shè)計電路,因此生產(chǎn)的困難性頗大,目前市場中人工智能ASIC領(lǐng)域龍頭當(dāng)屬Google TPU,其今年5月份發(fā)布的第三代TPU處理器本身的功能為第二代的兩倍。
以手機(jī)為例,在智能手機(jī)這類設(shè)備之中一般都有GPU及CPU,可以為人工智能提供相應(yīng)的運算能力支持,那為何還要專門開發(fā)AI芯片來進(jìn)行這項工作呢?這里舉一個簡單的例子,去普通飯店吃飯時可以選擇各種菜系,可能會比較美味,但若想要品嘗正宗的菜肴,要去專門的飯店才有可能吃到。
AI芯片也是如此,雖然手機(jī)也會有GPU及CPU,但功耗低、重量輕、厚度薄才是其追求的方向。專用的AI芯片能夠?qū)崿F(xiàn)最高效率及能力,并且只占用很小的空間及更低的功耗。同時不會占用CPU及GPU太多的資源,可以保證手機(jī)在運行人工智能的同時還能進(jìn)行其他操作。
當(dāng)然AI芯片的重要性不止于此。以Google TPU1為例,其擁有256X256尺寸的脈動陣列,約為700MHz,擁有64K個乘法單元,每個單元單次可執(zhí)行一個乘法及加法,即128K個操作。那么TPU1每秒的巔峰計算次數(shù)為約90Tops,當(dāng)然這里只是理論數(shù)值,由于數(shù)據(jù)傳輸、存儲、提取等原因,往往達(dá)不到峰值速率。
但是,相較于普通GPU及CPU方案來進(jìn)行訓(xùn)練時,尤其目前神經(jīng)網(wǎng)絡(luò)尺寸越發(fā)龐大,參數(shù)更加繁雜,通常大型NN模型的訓(xùn)練時間長達(dá)幾周甚至數(shù)月,而期間出現(xiàn)各種意外情況也會影響到訓(xùn)練的進(jìn)度,如停電等。而采用了TPU1則可以在一頓飯的時間內(nèi)完成,其效率大大提升。
而AI芯片雖然被冠以AI之名,但其本質(zhì)還是一枚芯片。在經(jīng)歷中美貿(mào)易戰(zhàn)初期的交鋒后,國內(nèi)企業(yè)已經(jīng)紛紛醒悟過來若沒有自己的核心技術(shù),即使做到再強也不過一堆沙灘上的雕塑而已,浪潮一來即可覆滅。
在面對CPU及GPU被國外企業(yè)壟斷的格局下,AI芯片成為了國內(nèi)廠商新的突破點。目前來看,人工智能技術(shù)中美兩國基本處于同一起跑線上,因此對于AI芯片的開發(fā)更加有利。但是芯片的設(shè)計并非一朝一夕之功,加之我國的芯片制造能力也非常薄弱,需要投入大量人力財力才可能得出有效的產(chǎn)品。國內(nèi)目前對AI芯片投入研究的企業(yè)有寒武紀(jì)、華為海思、中興微電子、阿里平頭哥等,還有許多小型企業(yè)也紛紛跟風(fēng)進(jìn)入AI芯片領(lǐng)域中。
這是由于AI芯片制作并不同傳統(tǒng)芯片一般,不需要花費精力制作IP內(nèi)核,直接采用其他IP再加上架構(gòu)層面的優(yōu)化,針對業(yè)務(wù)需求對IP進(jìn)行整合,因此制作的門檻大大降低,如上述提到的SoC+IP方案。華為昇騰系列的推出為AI國產(chǎn)芯片注入了一針強心劑,極大地振奮了國產(chǎn)AI芯片相關(guān)制造企業(yè)。
但值得注意的是,雖然華為推出了AI芯片,但其在手機(jī)端的應(yīng)用依然有許多局限性,大多只應(yīng)用于圖片識別上。不僅華為如此,蘋果及聯(lián)發(fā)科也是如此,如何拓展未來AI的更多應(yīng)用,成為了下一步將要邁出的關(guān)鍵。