目前除了不少AI創(chuàng)業(yè)公司如商湯、曠視等開始選擇切入手機的系統(tǒng)與應(yīng)用市場,手機巨頭如蘋果、華為更是直接用上了AI芯片。前兩天,三星還在官網(wǎng)低調(diào)上線了一款手機芯片新品Exynos 9610,其中就包括了一款專門用于圖像處理的神經(jīng)網(wǎng)絡(luò)引擎。對于各大手機品牌商而言,面對日趨同質(zhì)化的紅海競爭,AI則是個品牌升級、競爭力升級的有利機遇。
根據(jù)今年2月IDC發(fā)布的2017年全球智能手機出貨量排名報告顯示,2017年全球智能手機共出貨14.7億臺,排名前三三大手機巨頭三星、蘋果、華為合計出貨量超過6.8億臺,占了全球市場的半壁江山。本文將重點解讀三星、蘋果、華為的AI生態(tài)建設(shè),主要集中在AI芯片能力、AI應(yīng)用場景構(gòu)建、以及AI合作生態(tài)構(gòu)建這三類,對應(yīng)了AI的計算力、應(yīng)用場景、以及軟件生態(tài)。
華為:AI芯片先行 HiAI生態(tài)跟上
我們先從華為說起,2017年9月,華為發(fā)布了世界首款手機AI芯片麒麟970,打響了AI芯片入侵手機的第一槍。10月,搭載這塊AI芯片的華為Mate 10和Mate 10 Pro正式面世。
此外,華為的手機AI整套方案在Mate 10系列上首次應(yīng)用后,正往其全系列中高端產(chǎn)品中普及,去年底發(fā)布的榮耀V10新品,今天在法國巴黎即將發(fā)布的華為P20都將搭載這套從芯片到系統(tǒng)到應(yīng)用生態(tài)一體的手機終端側(cè)AI整體方案。
這款麒麟970 AI芯片中搭載了一個專門用于處理AI的模塊——NPU(神經(jīng)網(wǎng)絡(luò)處理單元)。這塊NPU的計算速度比CPU快了25倍,同時還將能耗效率提高了50倍。
如果以用戶體驗角度,則主要以拍照物品能力、人像美顏、機器翻譯、語音降噪、以及人工智能助手等AI體驗為主。此外,華為Mate 10還有一個特殊的AI應(yīng)用,那就是通過分析本地數(shù)據(jù),嘗試理解用戶的個人的習(xí)慣,進而在保證用戶體驗盡可能不被影響的情況下,把后臺一些無效應(yīng)用給關(guān)閉掉。
與此同時,讓一個AI應(yīng)用能夠真正運行得好,不是NPU單一硬件組件的問題,而是系統(tǒng)軟硬件調(diào)配的過程。舉個例子Mate 10系列搭載華為EMUI 8.0系統(tǒng),支持最新版本的安卓8.0,該版本本身對AI進行了優(yōu)化,Mate 10需要對此進行適配兼容。
此外,配合NPU的還有面向第三方開發(fā)者的HiAI平臺(全稱HiAI移動計算平臺),向開發(fā)者提供人工智能計算庫及其API,更容易編寫移動設(shè)備上的AI應(yīng)用,目前華為開發(fā)者聯(lián)盟網(wǎng)站已經(jīng)上線了AI全套業(yè)務(wù)。
對于自己擁有AI開發(fā)能力的、使用TensorFlow或者Caffee等架構(gòu)的APP開發(fā)者來說,在不改變自己訓(xùn)練模型的情況下,HiAI會給他們提供相應(yīng)的工具,讓開發(fā)者可以快速遷移已有的模型到HiAI平臺。而對于普通APP開發(fā)者來說,HiAI將會提供已經(jīng)封裝好的語音識別、圖像識別等技術(shù),開發(fā)者們不需要自己做基礎(chǔ)AI研發(fā),可以調(diào)用HiAI中封裝好的AI技術(shù)直接應(yīng)用。
舉個例子,HiAI平臺中的人臉檢測API可以檢測圖片中的人臉,返回高精度人臉矩形框坐標,用于各類人臉識別場景,如人臉解鎖、人臉聚類、美顏等場景中,并通過對人臉特征及位置的定位,實現(xiàn)對人臉特定位置的美化修飾。而圖片分類API可以識別圖片中物體、場景、行為等信息,返回對應(yīng)標簽信息,如:花、鳥、魚、蟲、汽車、建筑等等,可用于圖庫照片自動分類整理、社交圖片識別分享等。
據(jù)智東西了解,目前已經(jīng)有不少第三方應(yīng)用已經(jīng)接入了HiAI平臺的AI能力,比如我們熟知的快手、抖音、京東、美團、Prisma等,它們有的采用視頻處理優(yōu)化技術(shù)、有的采用圖像識別掛鉤電商技術(shù)、有的則采用濾鏡美化類技術(shù),圖像處理速度最高能達到原來安卓機器性能的10倍。
蘋果:十年潛伏布局 狂買數(shù)十家公司
去年,恰好就在麒麟970發(fā)布的短短兩周后,9月13日,蘋果發(fā)布十周年紀念款iPhone X,搭載自研的AI芯片A11,采用了臺積電10nm工藝制造,CPU采用2大核4小核設(shè)計,GPU為自研3核心。蘋果這次也在自家的A11芯片上搭載了一個專用于機器學(xué)習(xí)的硬件——“神經(jīng)網(wǎng)絡(luò)引擎(neural engine)”,它采用雙核設(shè)計,每秒運算次數(shù)最高可達6000億次,相當于0.6TFlops,以幫助加速人工智能任務(wù)。
而說起這塊AI芯片的打造,蘋果豪氣的“買買買”功不可沒。從2008年開始,蘋果就沒有停止過收購相關(guān)創(chuàng)企的步伐,范圍涉及芯片制造廠、面部識別AI創(chuàng)企、表情追蹤AI創(chuàng)企、AR引擎巨頭等等。
舉個例子,早在2008年,蘋果就以2.78億美元收購了2003年成立加州的高性能低功耗處理器制造商PA Semi。
2010年,蘋果以2900萬美元收購瑞典面部識別創(chuàng)企Polar Rose,他們開發(fā)的面部識別程序可以可以為用戶自動圈出照片中的人臉。
2015年11月,蘋果收購《星球大戰(zhàn)》背后的動作捕捉技術(shù)公司Faceshift,這家蘇黎世的創(chuàng)業(yè)公司開發(fā)了實時追蹤人臉表情,然后再用動畫表現(xiàn)出來的技術(shù)。該技術(shù)還可以實現(xiàn)面部識別……
迄今為止,蘋果已經(jīng)陸續(xù)收購了四五十家創(chuàng)企,范圍涵蓋芯片、語音識別、圖像/面部識別、計算機視覺、AR、數(shù)據(jù)挖掘、機器學(xué)習(xí)、地圖、定位等等,最終不僅打造出了A11芯片,還圍繞著iPhone定義了FaceID、Animoji、人像攝影、Siri等眾多標志性AI應(yīng)用場景。
比如,在A11芯片的加成下,iPhone X前頭“劉海兒”實現(xiàn)的臉部追蹤技術(shù)還可以用于個人定制化表情Animoji(能捕捉并分析 50 多種不同的肌肉運動)、AR濾鏡等,新的互動的方式有望提高用戶的參與度和粘性,提高AR社交平臺的經(jīng)濟價值,而3D視覺所提供的景深信息和建模能力是現(xiàn)有普通攝像頭無法比擬的。
最后,在AI生態(tài)打造方面,蘋果在去年WWDC開發(fā)者大會上推出了Core ML,這是一款新型機器學(xué)習(xí)框架,能讓開發(fā)者更方便地將機器學(xué)習(xí)技術(shù)整合到自己的App中。Core ML支持所有主要的神經(jīng)網(wǎng)絡(luò),如DNN、RNN、CNN等,開發(fā)者可以把訓(xùn)練完成的機器學(xué)習(xí)模型封裝進App之中。
相對而言,三星智能手機端的AI布局在三大巨頭當中屬于最不激進的一方。先拿芯片為例,在今年CES 2018上,三星發(fā)布了最新旗艦處理器Exynos 9810,采用三星二代10nm工藝打造的芯片,ARM 8核架構(gòu)。不過,這塊芯片并沒有像業(yè)內(nèi)傳言般“搭載了專用AI模塊”。
前兩天,三星官網(wǎng)低調(diào)地上線了一款新型10nm手機芯片——Exynos 9610,其介紹語的開頭一段話赫然把AI放在了最顯眼的位置。不過智東西仔細研究后發(fā)現(xiàn),這款芯片搭載了一個視覺處理器模塊(vision image processing unit),里面由一個DSP數(shù)字信號處理器硬件和一個神經(jīng)網(wǎng)絡(luò)引擎軟件組成,依舊采用的是DSP+AI引擎打法。
三星比較特殊,其高端旗艦手機會同時用高通處理器和三星處理器,這兩類處理器采用的是GPU+DSP+AI引擎的方式。拿三星新旗艦Galaxy S9/S9+來說,國內(nèi)版配置了驍龍845處理器、海外版則配置了三星Exynos 9810。
將AI作為一個單獨的計算模塊放在芯片里,能夠?qū)I功耗做到最低的同時,性能做到最大化,優(yōu)勢非常明顯。但由于AI仍舊是一個非常新鮮的技術(shù),一旦涉及到硬件固化,就需要權(quán)衡芯片成本相關(guān)問題,需要考慮客戶市場需求。因而高通的GPU+DSP+AI引擎的這套打法相對較為保守,而華為與蘋果的手機芯片屬于集團內(nèi)部項目,只為自己手機品牌采用,因而能夠更加大膽地下決定。
不過,采用AI引擎提升AI能力的做法只是一個過渡階段,未來三星依舊會推出搭載獨立AI模塊的芯片。此前韓國媒體也曾報道,三星也正在研究幾種專門的AI處理芯片。在今年秋季發(fā)布的三星Note 9中,可能會搭載專用AI芯片。在此之前,三星還曾經(jīng)在2016年10月參與投資了英國AI芯片創(chuàng)企Graphcore的3000萬美元A輪融資、在2017年10月參與了中國AI芯片創(chuàng)企深鑒科技的4000萬美元A+輪融資。
在AI應(yīng)用方面,三星打造集中在以Bixby為入口的語音、視覺、提醒、主頁等AI應(yīng)用方面。2016年10月7日,三星以2.15億美元的價格收購了AI虛擬助手創(chuàng)企Viv Labs,它就是Bixby的前身。當時Viv Labs展示出能基于語音輸入提供信息的能力,該系統(tǒng)也可集成第三方服務(wù)如Hotels.com、Uber等。值得一提的是,Viv Labs的團隊曾作為核心研發(fā)人員參與開發(fā)了蘋果的Siri虛擬助手。
而在三星Galaxy S9/S9+發(fā)布會上,三星除了展示Bixby的語音控制能力外,還將Bixby視覺迭代到了2.0,可以實時識別取景框中的物體,而與AR功能配合,它還能夠?qū)ξ淖诌M行實時的翻譯,并且,在圖像中將文字替換為目標語言。與此同時,S9會根據(jù)光線條件判斷是啟用人臉識別解鎖還是虹膜解鎖,減少因復(fù)雜光線造成的解鎖失敗問題。以及,三星和騰訊聯(lián)合打造了AI游戲引擎,能夠?qū)W習(xí)用戶的使用習(xí)慣,動態(tài)分配計算資源。
總的來說,三星在手機AI應(yīng)用生態(tài)打造方面相對不太激進,其圍繞智能手機所構(gòu)建的生態(tài)主要是以內(nèi)容、資源整合為主,并沒有集中打造一個可供開發(fā)者接入的AI平臺。不過近期也有媒體報道,三星正計劃向第三方制造商開放其人工智能平臺。同時,三星在去年的三星開發(fā)者大會上曾宣布,將公開Bixby生態(tài)系統(tǒng),并將很快開放Bixby的源代碼和其他的源代碼。
從目前而言,全球前三大智能手機公司都具備自有手機芯片打造能力,此能力已經(jīng)成為劃分手機廠商技術(shù)實力的重要門檻。而在AI向手機終端普及浪潮來臨的當下,三家公司都開始圍繞著AI芯片而展開手機AI應(yīng)用的布局和生態(tài)構(gòu)建。目前各家所取得的成績和發(fā)展的階段還是有很大差異。
作為排在份額第二和第三的手機巨頭,蘋果和華為打造的生態(tài)帝國更加完整、穩(wěn)固。尤其是蘋果,在手機應(yīng)用打造、手機芯片打造、AI應(yīng)用場景定義、AI應(yīng)用生態(tài)構(gòu)建四大方面,已經(jīng)成為行業(yè)標桿。華為,作為國內(nèi)第一大手機巨頭,在AI芯片的打造上跟蘋果站到了同一起跑線,現(xiàn)在在AI應(yīng)用場景定義、AI應(yīng)用生態(tài)構(gòu)建上勢頭很猛,將華為自身的研發(fā)能力與云能力借助這一機會充分發(fā)揮了出來。這時,作為全球智能手機老大的三星,雖然一直在致力于手機端AI應(yīng)用場景的落地打造,但在AI芯片構(gòu)建和AI應(yīng)用生態(tài)構(gòu)建上不免稍顯落后。