邊緣計算新興市場
人工智能芯片市場第一個得到關注的是云端服務器市場,Nvidia的GPU以其強勁的算力掌握了大部分市場。隨著人工智能的鋪開,邊緣計算(edge computing)的概念也得到了越來越多的認可。
邊緣計算相對于云計算有幾點優勢,首先是延遲較小,在云端和終端通常有幾十毫秒到幾百毫秒不等的網絡延遲,對于工業應用等對延遲有高要求的應用來說云端部署人工智能無法滿足其對于延遲的需求;其次是數據隱私,有些應用不希望把數據傳輸到云端,一方面擔心云端數據被云運營商看到,另一方面擔心數據傳輸過程中被黑客劫持;最后是可靠性,如果把人工智能部署在云端那么一旦網絡斷了在終端的人工智能程序就無法工作了,這對于要求高可靠性的應用來說難以滿足要求,但是如果把人工智能部署在邊緣就沒有這個問題。
邊緣人工智能計算中其實還包含了多個層次,一種是終端設備(如手機)上的人工智能計算,這樣的規劃把人工智能計算直接放到終端設備上,可以實現最低的延遲。然而,由于終端設備的電池容量有限或者對于散熱容忍度較低,因此在終端設備上做人工智能計算對于AI芯片的能效比提出了極高的要求,同時這樣也并非唯一的邊緣計算形態。
除了終端設備上的直接做計算之外,還可以把終端的數據放到離終端比較近的本地服務器去計算。例如,對于工業應用這樣的對于穩定性和延遲有要求但是又可以做集群化計算的應用,除了把計算直接放到終端設備之外另一種方法就是就近設立邊緣服務器讓計算放到邊緣服務器上去做然后快速返回給終端設備。邊緣服務器對于芯片功耗的要求相比在終端設備上直接計算就會寬松許多,因此非常適合于這種可以集群化計算的應用。
邊緣計算的兩種市場目前都已經在起飛。而相關AI芯片也得到了許多關注。標志性事件是華為的兩次芯片發布會。去年秋天發布的麒麟970芯片附帶NPU,可以說是人工智能部署在手機的一次重要嘗試。今年秋天又發布了Ascend系列芯片,其中Ascend 310芯片也是針對邊緣服務器市場并且華為已經開發了基于Ascend 310的邊緣計算服務器準備部署在自動駕駛領域。因此我們可以預計在未來無論是相關應用還是相關芯片都將有更多公司大手筆投入,從而推動AI進一步發展。
邊緣服務器的芯片形態與競爭格局
邊緣服務器的市場現在來看將是人工智能最早落地的應用之一(甚至比手機里的人工智能還要早且成熟),因為目前中國的智能攝像頭產品已經在安防、人臉識別等領域真正落地,而邊緣服務器是很適合智能攝像頭的產品形態,一方面在不少此類應用中對于可靠性有很強的需求,因此部署在邊緣端的人工智能更適合;另一方面智能攝像頭的計算可以集群化操作,因此一個邊緣服務器處理多路智能攝像頭的形式是非常經濟的方式。除了智能攝像頭之外,無人駕駛也是邊緣服務器的一個例子,因為在無人車里面需要做傳感器融合做大量計算,相當于在無人車上部署了一個邊緣服務器。
邊緣服務器市場通常對于通用性有一定需求,因此比較合適的方案是處理器加上通用型深度學習加速芯片,而深度學習加速芯片最常見的形式是以PCIe加速卡的形式插到主板上,并與主處理器協同工作。值得注意的是,由于邊緣服務器對于人工智能算法精度有一定要求,因此往往使用的是類似半精度浮點數的運算方式,很多邊緣終端芯片上常見的INT-4甚至INT-2等激進的低精度整數運算由于損失精度過多因此在邊緣服務器不太適合。
我們認為邊緣服務器市場尚屬于新興市場,加入戰場的公司并不多,目前僅有Nvidia,華為,比特大陸等, 而且不同的公司可以主打不同的細分市場,因此市場競爭遠未飽和。我們不妨來分析一下Nvidia,華為和比特大陸三家公司的競爭格局。Nvidia的產品是Xavier芯片,峰值算力30TOPS,功耗30W,主要針對的是自動駕駛市場,因此芯片上還集成了雙目視覺、光流等,模組售價2499美元,顯然是針對高端自動駕駛市場,而對于智能攝像頭等對于部署成本有要求的場合并不合適。
華為的Ascend 310定位中高端,其8W/8TFlops的性能下可覆蓋智能攝像頭市場,上可進擊自動駕駛市場(華為已經與奧迪合作,發布了基于Ascend 310芯片的自動駕駛邊緣服務器MDC600)。而比特大陸則是主打性價比路線,BM1682自帶視頻解碼和后處理操作且集成了CPU,因此客戶需要加速智能機器視覺相關應用時理論上只需要BM1682即可,無需再去購入額外的CPU,這也降低了成本。
目前在中國市場,最主要的市場還是安防等應用的智能攝像頭,因此產品定位決定了主要是華為和比特大陸之間的競爭,那么比特大陸和華為之間的競爭格局會如何呢?
我們認為,首先這個市場很大,華為和比特大陸的主打方向也不相同(華為主打性能而比特大陸走性價比路線),因此并不存在勢不兩立的激烈競爭。另一方面,其實華為和比特大陸的共同競爭對手是海康威視這樣的智能攝像頭系統廠商,一旦海康威視也開始自研芯片且在自己的安全攝像頭系統中以各種方式推廣自研邊緣服務器,那么華為和比特大 陸的壓力將會很大。不過我們預計到那個時候智能攝像頭以外的市場也會變得成熟,從而給華為和比特大陸等芯片公司提供新的機會,而不用被迫在智能攝像頭領域與巨頭系統廠商競爭。
邊緣終端市場的芯片形態與競爭格局
邊緣終端市場是指直接在終端設備上做計算的AI芯片,對于功耗和能效比有很強的要求。目前來看,邊緣終端市場有兩種形態的芯片產品,一種是針對特定應用的SoC,一種是通用加速器做獨立芯片。SoC面向專用市場,在芯片中深度學習加速計算事實上只是一小部分,而其他大部分芯片面積則交給了主控處理器、視頻解碼等等模塊。SoC集成度高,一般的技術路線是用新的SoC代替原有的不支持深度學習加速的SoC做更新換代。
一個典型的例子就是華為麒麟系列SoC加入寒武紀的NPU,就屬于SoC自己的更新換代。專注于AI芯片的廠商進入SoC市場的策略往往是提供IP授權,以發揮自己的強項(如寒武紀給華為提供NPU IP)。對于SoC往往針對的是一個特定市場,因為其中的模塊都是針對該應用而設計,如果用在其他應用中則顯得浪費,例如麒麟SoC最適合的場景是手機,其中包含的GPU、ISP、Modem等都是為了手機場景打造,如果是用在工業場景則這些模組都閑置了,因此也就引出了另一個終端通用型深度學習加速器芯片市場。該市場相對于SoC市場來說允許較低的集成度,即可以在主控芯片之外再搭配額外的芯片以支持相應功能。
在終端SoC市場,事實上競爭已經白熱化,華為、高通等公司都紛紛推出專屬的SoC搭載 AI加速模組,而AI加速模組IP的提供商也有ARM,Cadence,CEVA等傳統IP提供商以及寒武紀這樣的初創公司。不少傳統SoC芯片公司都紛紛在自家SoC中加入自研或授權的人工智能模塊。對于人工智能終端SoC市場,我們的分析是該市場雖然最早得到關注但是很可能近幾年還是被原來的SoC公司占領市場,因為目前終端人工智能市場尚未真正落地收獲真金白銀,因此SoC中加入人工智能還只是錦上添花之舉。
在IP授權方面,Cadence和ARM入局意味著小公司面臨巨大壓力,因為IP市場存在一定的頭部效應,且Cadence和ARM可以通過與其他的優勢IP做捆綁銷售來推銷其人工智能IP,在人工智能并非最關鍵SoC模組的市場現狀下,小公司想要與Cadence和ARM等巨頭競爭只能走差異化,例如超低功耗或模擬計算等路線。
終端通用深度學習加速器芯片市場的應用則剛起步,之前Movidius推出的神經計算加速棒并未引起巨大反響。但是這并不代表這個市場不存在,而是還處于幼年期,需要培養,因此許多公司在這個市場布局主要一是培養開發者生態,另一方面也探索研究哪個市場最有潛力,預計在市場成熟之后再收縮戰線,針對幾個重要的應用推出相應的優化芯片,從而占領最合適的市場。因此,目前對于這個市場最合適的策略是推出開發板和插件式加速硬件(如USB加速棒)這樣簡單易用的產品,這樣廠商和客戶可以一起探索市場需求,決定最佳產品形態。 我們看到比特大陸就是在這個市場跟隨Movidius推出了BM1880芯片,并配套推出了開發板、芯片模組以及USB加速棒等多種硬件形態供客戶挑選,我們相信在近期將會看到通用型終端人工智能加速器的更多應用。
未來發展預期
如之前的分析,我們預計在人工智能邊緣計算會成為未來最重要的人工智能硬件市場之一。在邊緣計算領域,邊緣服務器芯片市場非常重要但是目前廠商不多,我們預期會有不少公司入局,包括從芯片領域提出超高性能的初創公司,以及海康威視這樣的系統廠商開始自研芯片,而如華為、比特大陸等已經提前入場的公司也會繼續加大投入。
在終端邊緣計算市場,SoC芯片(AI加速器IP)領域競爭已經非常激烈,未來恐怕會有一波洗牌的過程,最后只會剩下幾家能在不同細分市場牢牢把握住客戶的公司。在通用終端加速器芯片領域我們則可望看到更多應用出現,在未來幾年內我們能看到的邊緣終端加速器應用實際上將會很大程度上決定這個市場的具體規模。
最后,我們必須看到邊緣計算等人工智能芯片應用目前最大的市場其實在中國。這是因為中國的人工智能落地情況遠好于美國。在政府的支持下,曠視、商湯、依圖等初創企業紛紛推出優秀的產品并在市場上站住了腳跟,這一方面加速了基于人工智能的應用成熟,另一方面也給人工智能芯片帶來了市場,從而為人工智能的完整產業鏈的成熟帶來了機會。我們可以肯定地說,人工智能芯片的未來還得要看中國!