隨著物聯(lián)網(wǎng)時代的到來,智能設(shè)備的實時決策能力受到廣大科技廠商的關(guān)注。本月,華為、蘋果接連發(fā)布搭載神經(jīng)網(wǎng)絡模塊的手機芯片,提振了移動端AI芯片的市場預期。利用神經(jīng)網(wǎng)絡增強設(shè)備的本地化智能,將AI從數(shù)據(jù)中心后臺送入用戶的口袋,或成為AI芯片的下一個目標。
跨國企業(yè)積極布局
蘋果一推出用于iPhone的A系列處理器和M系列動態(tài)處理器,科技廠商就對面向設(shè)備的AI芯片躍躍欲試。寒武紀創(chuàng)始人陳天石表示,自主開發(fā)核心AI指令集是發(fā)展AI生態(tài)的根本之策。ARM與寒武紀英雄所見略同,在最新發(fā)布的多核微架構(gòu)DynamIQ中加入了機器學習和人工智能的原生指令集,并宣稱在3~5年內(nèi)將Cortex-A73的AI性能提升50倍。DynamIQ可在單個集群實現(xiàn)對最多8枚異構(gòu)內(nèi)核的細粒度管理,單個內(nèi)核可以有不同的性能和功耗,帶給人工智能應用更加靈活的解決方案,首款基于DynamIQ的嵌入式處理器Cortex-A75將面向智能手機、智能家電、單板機等終端設(shè)備。
ARM產(chǎn)品經(jīng)理Govind Wathan指出,CPU算力的提升將降低設(shè)備對云端網(wǎng)絡的依賴,提升智慧駕駛等延時敏感場景下的決策響應速度,并優(yōu)化數(shù)據(jù)安全。
微軟也將在下一代HoloLens的全息處理單元集成一枚自主設(shè)計的AI芯片。該芯片利用神經(jīng)網(wǎng)絡模塊,基于設(shè)備本身處理頭部追蹤器、紅外攝像機生成的視覺數(shù)據(jù),避免數(shù)據(jù)上傳云端導致的延時抖動并降低隱私泄露風險。就像ARM標榜DynamIQ是“下一個時代的計算技術(shù)”,微軟HoloLens技術(shù)總監(jiān)Marc Pollefeys認為混合現(xiàn)實和人工智能代表計算力的未來,微軟用AI打造智能化MR設(shè)備的嘗試正加速它的到來。
將TPU以云服務方式供應的谷歌也意識到設(shè)備數(shù)據(jù)回傳遠程服務器的延時問題,并在最新發(fā)布的安卓穿戴設(shè)備上搭載了谷歌首個完全面向終端的機器學習技術(shù)。安卓副總工程師Dave Burke透露,谷歌還將發(fā)布手機版人工智能學習系統(tǒng)TensorFlow Lite,允許開發(fā)者運用谷歌機器學習開發(fā)手機App,而且谷歌和Facebook都在推進神經(jīng)網(wǎng)絡在手機和虛擬現(xiàn)實頭盔中的應用。
華為略微“搶跑”
據(jù)悉,微軟AI芯片將隨著下一代HoloLens在2019年登場,ARM DynamIQ尚需3~5年的提升周期,谷歌安卓穿戴設(shè)備的機器學習功能暫只面向智能簡訊系統(tǒng)。而采用麒麟970處理器的華為已“搶跑”成功,率先發(fā)布全球首個集成獨立AI專用NPU(神經(jīng)網(wǎng)絡處理單元)的移動芯片。
華為消費者BG CEO余承東強調(diào),華為的AI戰(zhàn)略是Mobile AI=On Device AI+Cloud AI。說明華為將終端智能與云端智能做出區(qū)分,兩者并重。據(jù)了解,華為NPU支持運動追蹤、人臉識別、夜拍優(yōu)化,峰值運算達到1.92TFP、16OPS。在內(nèi)部測試中,三星S8每分鐘識別圖片95張,蘋果CPU+GPU的A10處理器每分鐘識別487張,搭載CPU、GPU、NPU的麒麟970每分鐘識別2005張。與Kirin960的四核Cortex-A73相比,性能提升25倍,效能提升50倍。
緊接著麒麟970,蘋果公布搭載神經(jīng)網(wǎng)絡引擎的A11仿生芯片,這款雙核仿生神經(jīng)網(wǎng)絡引擎專為機器學習算法開發(fā),能優(yōu)化面部特征提取、Animoji、增強現(xiàn)實功能,每秒運算次數(shù)最高達6000億次。
與微軟的考慮類似,發(fā)布了增強現(xiàn)實平臺ARKit的蘋果需動用手機攝像頭、動作傳感器、陀螺儀實現(xiàn)場景追蹤、光學估算等AR功能,靠云端處理多個傳感器的數(shù)據(jù)將占用內(nèi)存、加劇延時抖動和數(shù)據(jù)外流風險,神經(jīng)網(wǎng)絡引擎將支持終端在不聯(lián)網(wǎng)狀態(tài)下處理AI相關(guān)任務。
“麒麟970的神經(jīng)網(wǎng)絡功能模塊和A11的神經(jīng)運算模型是一種積極的嘗試,未來雙方的神經(jīng)網(wǎng)絡模塊會更完善,集成更多CPU、GPU的軟核與模組單元來支持設(shè)備本身的智能應用。”賽迪顧問電子信息行業(yè)分析師向陽在接受《中國電子報》專訪時說。
具有先發(fā)優(yōu)勢的華為、蘋果并非高枕無憂,老對手高通在終端市場蓄力已久。先是發(fā)布驍龍NPE(神經(jīng)處理引擎)軟件開發(fā)包,支持開發(fā)者基于NPE兼容的Caffe、Caffe2、Tensorflow深度學習框架,利用驍龍600系列和800系列處理器為App搭載AI功能,實現(xiàn)攝像頭、汽車、智能手機、無人機的本地化AI應用。繼而在上個月收購荷蘭深度學習初創(chuàng)公司Scyfer,為高通的AI終端化戰(zhàn)略提供技術(shù)支持。
高通研發(fā)團隊認為,將AI算法集成到終端而非云端有利于及時響應、保護隱私、提升性能比和帶寬利用效率。高通執(zhí)行副總裁Matt Grob指出,高通將為手機、智能車等終端搭載機器視覺、自然語言處理能力,并探索AI在無線連接、能源管理和圖像方面的應用。
“蘋果和華為搭載神經(jīng)網(wǎng)絡單元的芯片有很強的定制色彩,會有優(yōu)秀的應用性和專業(yè)性,但在通用性層面還不能與高通比肩。如果兩家企業(yè)能推出更多的通用性解決方案,會讓各自的AI芯片煥發(fā)更大價值。”賽迪智庫軟件產(chǎn)業(yè)所研究員蒲松濤告訴《中國電子報》記者。Scorch AI軟件發(fā)展負責人Vadim Budarv指出,AI應賦予終端設(shè)備積累、學習用戶習慣的本地化智能,深入貼合用戶喜好,支持智能駕駛、智能監(jiān)控場景下的實時決策,將人工智能真正送進用戶的口袋。