“融資”與“造芯”成為 AI 創(chuàng)業(yè)公司兩大主軸議題,思必馳在 2018 年完成 D 輪融資后,即透露與某芯片巨頭進(jìn)行 AI 芯片的研發(fā),如今答案揭曉,思必馳旗下的芯片設(shè)計(jì)公司“深聰”獲得“國(guó)家隊(duì)”中芯國(guó)際旗下的股權(quán)管理公司中芯聚源投資,同時(shí)中芯國(guó)際也為深聰打造第一顆 AI 語(yǔ)音芯片。
“百箱大戰(zhàn)”時(shí)代開(kāi)啟, AI 語(yǔ)音芯片熱度火到“互撕”?
基于深度學(xué)習(xí)(Deep Learning)的語(yǔ)音識(shí)別技術(shù)很快成為 AI 創(chuàng)業(yè)界的流量擔(dān)當(dāng),尤其 2017 年 Amazon 一口氣推出多款 Echo 系列產(chǎn)品,開(kāi)始了國(guó)內(nèi)“百箱大戰(zhàn)”的年代,更讓相關(guān) AI 語(yǔ)音企業(yè)迎來(lái)一陣小高潮,不少同性質(zhì)公司更是明爭(zhēng)暗斗陷入“互撕”局面,反映該市場(chǎng)的火熱程度。
根據(jù) Canalys 估計(jì),2017 年全球智能音箱出貨量突破 3000 萬(wàn)臺(tái),2018 年出貨量預(yù)計(jì)是超過(guò) 5600 萬(wàn)臺(tái),全球前四大品牌廠為 Google、Amazon、天貓、小米。再者,2017 年全球智能音箱用戶量排名前五名是美國(guó)、英國(guó)、德國(guó)、中國(guó)、加拿大,但 2018 年中國(guó)可望躍居第二名。
除了音箱之外,智能家居、汽車市場(chǎng)很多應(yīng)用場(chǎng)景的硬件也會(huì)陸續(xù)加入語(yǔ)音智能化的功能,讓 AI 語(yǔ)音技術(shù)的應(yīng)用場(chǎng)景增添無(wú)限想像空間。
光是 2018 年就有三家 AI 語(yǔ)音創(chuàng)業(yè)公司發(fā)表相關(guān)芯片,包括云知聲發(fā)表面向 AIoT 市場(chǎng)的 UniOne 芯片、出門(mén)問(wèn)問(wèn)的 AI 語(yǔ)音芯片模組“問(wèn)芯”Mobvoi A1、 Rokid 的 AI 語(yǔ)音芯片 KAMINO 18,思必馳透露要進(jìn)入自制芯片領(lǐng)域已有一段時(shí)間,4 日才正式對(duì)外揭露具體戰(zhàn)略細(xì)節(jié)。
中芯國(guó)際助陣,思必馳“造芯”如虎添翼
不同于云知聲、Rokid 進(jìn)入芯片自制領(lǐng)域,都是在公司內(nèi)部成立獨(dú)立部門(mén)進(jìn)行研發(fā),思必馳 2018 年初成立子公司“深聰”,2019 年初推出的第一顆產(chǎn)品是 AI 語(yǔ)音芯片深聰 TAIHANG 芯片。
思必馳扶植的深聰之所以引起業(yè)界注意,是因?yàn)樗急伛Y的“造芯”之路找來(lái)國(guó)內(nèi)半導(dǎo)體巨頭中芯國(guó)際助力,旗下的投資公司中芯聚源加入成為創(chuàng)始股東之一。再者,思必馳對(duì)深聰?shù)某止杀戎爻^(guò) 50%。
思必馳自制的首顆 AI 語(yǔ)音芯片,就是由中芯國(guó)際操刀,以 40 納米工藝打造,約莫是 2017 年中啟動(dòng)該芯片項(xiàng)目后,在 2018 年 8 月進(jìn)行流片,11 月芯片出來(lái)后,現(xiàn)在處于采集樣本階段,預(yù)計(jì) 2019 年中將進(jìn)入風(fēng)險(xiǎn)試產(chǎn),該顆芯片拔劍出鞘的速度十分快,幾乎把需要 6 個(gè)季度的工作,縮短為 3 個(gè)季度完成。
深聰 TAIHANG 芯片面向智能家居、智能終端、車載、手機(jī)、可穿戴設(shè)備等各類終端設(shè)備,基于雙 DSP 架構(gòu),內(nèi)部集成 codec 編解碼器,以及大容量的內(nèi)置存儲(chǔ)單元,再者,該芯片也采用了指令集擴(kuò)展和算法硬件加速的手段,相較于傳統(tǒng)通用芯片具有 10X 以上的效率提升。
深聰聯(lián)合創(chuàng)始人吳耿源表示,在芯片戰(zhàn)略上是兩步走,因?yàn)楸澈髲?qiáng)大的需求力道驅(qū)動(dòng),第一顆芯片不單是求快,講求 time-to-market,也專注低功耗、單向反饋、實(shí)現(xiàn)算法加硬件融合優(yōu)化的想法。
同時(shí),深聰內(nèi)部已經(jīng)開(kāi)始第二顆芯片的規(guī)劃,是專用芯片加特定架購(gòu),雙向溝通更能達(dá)到軟硬件融合、深度優(yōu)化的功效提升,以軟件需求來(lái)定義芯片架構(gòu),再用架構(gòu)去反饋算法,同時(shí),算法也會(huì)優(yōu)化硬體架構(gòu),等于是彼此做到雙向溝通。預(yù)計(jì)該顆芯片將在 2019 年下半年流片,2020 年量產(chǎn)。
從“通用”到“專用”,這是一條怎么樣的心路歷程?
從通用芯片到量身打造專用芯片的過(guò)程,想必有一番思考、摸索與探尋,吳耿源接受 DT 君專訪時(shí)娓娓道來(lái)。
吳耿源分析,思必馳是一家滿十歲的企業(yè),這幾年趕上 AI 崛起的浪潮,過(guò)去多年的技術(shù)積累獲得發(fā)力的機(jī)會(huì),目標(biāo)戰(zhàn)場(chǎng)是物聯(lián)網(wǎng),第一個(gè)應(yīng)用場(chǎng)景是智能音箱,一切有了很美好的揭幕,但坦白說(shuō),智能音箱終究“me too”產(chǎn)品,Amazon 已經(jīng)在前開(kāi)路。
思必馳的智能音箱初期用過(guò)很多家芯片大廠的通用芯片,但隨著產(chǎn)品線逐漸成長(zhǎng)茁壯后,許多問(wèn)題逐一浮現(xiàn) 。畢竟,通用芯片功能再怎么強(qiáng)大,落地到 AI 場(chǎng)景上會(huì)有削足適履之感,加上很多目標(biāo)市場(chǎng)越來(lái)越明確、消費(fèi)者群聚效應(yīng)展現(xiàn)后,特制化芯片的需求因此誕生 。
AI 芯片在市場(chǎng)上有兩路的提供者,早幾年都是通用芯片的天下,像是高通、聯(lián)發(fā)科等,這些巨頭在芯片戰(zhàn)略上,較為著眼于商業(yè)利益價(jià)值,但是,很多 AI 應(yīng)用場(chǎng)景都屬于細(xì)分賽道,要通用芯片巨頭“削足適履”,會(huì)比較不切實(shí)際。
這些芯片巨頭當(dāng)然也會(huì)想要“染指”AI 市場(chǎng),但這個(gè)市場(chǎng)和他們過(guò)去擅長(zhǎng)的游戲規(guī)則有落差,以前是巨頭們?cè)O(shè)計(jì)出什么樣的芯片,客戶就要乖乖接受,但 AI 市場(chǎng)是反其道而行,要透過(guò)使用者來(lái)定義產(chǎn)品,再由把需求反饋給算法,靠算法實(shí)現(xiàn) 。
但是,傳統(tǒng)芯片巨頭無(wú)法緊密地直接觸碰市場(chǎng)需求,或是內(nèi)部沒(méi)有強(qiáng)大的算法團(tuán)隊(duì)或數(shù)據(jù)(Data)做后援,在 AI 領(lǐng)域要成功,算法、數(shù)據(jù)、正確地定義市場(chǎng)都是關(guān)鍵。
因此,近幾年起算法公司開(kāi)始切入“造芯”運(yùn)動(dòng),也提供給算法公司實(shí)現(xiàn)垂直整合布局的機(jī)會(huì),更重要的是,通過(guò)“造芯”來(lái)確保產(chǎn)品的差異化和核心價(jià)值凸顯出來(lái)。
吳耿源表示,思必馳從算法公司跨入產(chǎn)品,再垂直整合成一個(gè)平臺(tái),上下串連系統(tǒng),在云端(Cloud)、邊緣(Edge)兩端都有布局,關(guān)鍵就是欠缺一個(gè)硬件芯片去擔(dān)任執(zhí)行的角色,而 AI 領(lǐng)域是軟件定義芯片,初期用市面上通用芯片時(shí),也發(fā)現(xiàn)算法與芯片對(duì)接的過(guò)程,有很多文化融合的問(wèn)題。
舉個(gè)例子,當(dāng)算法遇到芯片,發(fā)生的第一個(gè)沖突是算法的改朝換代速度遠(yuǎn)快于芯片的工藝技術(shù)。
一般而言,從定義產(chǎn)品到芯片誕生于世,大概要“懷胎”兩年(24 個(gè)月),中間經(jīng)歷設(shè)計(jì)、流片、試產(chǎn)、改版、升級(jí)、量產(chǎn),每一個(gè)階段慢慢磨練,中間經(jīng)歷的循環(huán)以“季度”為單位來(lái)計(jì)算。
反觀在算法的世界里,每周都在改,循環(huán)可能是以“周”作為單位,若將算法與芯片擺在同一家企業(yè)中,彼此步伐不一致的問(wèn)題會(huì)產(chǎn)生明顯的內(nèi)部矛盾與沖突。
思必馳從算法、產(chǎn)品、平臺(tái)、系統(tǒng)整合布局到整個(gè)生態(tài)系統(tǒng),現(xiàn)在加入深聰自制 AI 語(yǔ)音芯片,布局齊全后,將跨出智能音箱這個(gè)“me too”市場(chǎng),進(jìn)入AIoT領(lǐng)域,包括 TV 盒子、白色家電、智慧家庭、故事機(jī)等。當(dāng)物聯(lián)網(wǎng)遇上 AI,商機(jī)無(wú)可限量。
多模式人機(jī)交互是理想桃花源
吳耿源進(jìn)一步指出,光是語(yǔ)音 AI 技術(shù)就還有很大的精進(jìn)空間,現(xiàn)在的智能音箱的溝通仍需經(jīng)過(guò)“喚醒”的程序,其實(shí)是“人工弱智”,要做到自然人機(jī)交互,當(dāng)中的技術(shù)突破就需要算法的大幅增進(jìn),其中一個(gè)關(guān)鍵的元素是聲紋。
市面上的智能音箱只能識(shí)別出說(shuō)話的內(nèi)容,再針對(duì)問(wèn)題給出反饋信息,這樣的交互方式是智能化的,但交流方式卻不夠聰明,因?yàn)楸仨氁诿鞔_對(duì)象的情況下進(jìn)行,唯有做到“聞聲即可識(shí)人”,不需要“喚醒”這個(gè)多余的動(dòng)作,這才是真正的 “ SMART ” 。
吳耿源進(jìn)一步解釋,AI 語(yǔ)音芯片在應(yīng)用場(chǎng)景的廣度上,絕對(duì)不單是音箱領(lǐng)域,還包括物聯(lián)網(wǎng)、智慧家庭、車載市場(chǎng)等,更進(jìn)一步場(chǎng)景是多模生態(tài),當(dāng)下 AI 是最好的時(shí)代,天時(shí)、地利、人和,AI 時(shí)代正在騰飛、國(guó)家關(guān)注造芯、加上軟件、硬件、人和的融合。
現(xiàn)在的 AI 技術(shù)場(chǎng)景分別在語(yǔ)音、視覺(jué)兩大領(lǐng)域有不錯(cuò)的起步和成功的場(chǎng)景落地,但卻都是各自表現(xiàn),所謂的多模生態(tài)是指聲覺(jué)、視覺(jué)、五官、手勢(shì)、觸摸等獨(dú)立的功能融合在一起,實(shí)現(xiàn)自然的多模式人機(jī)交互。
AI 技術(shù)領(lǐng)域的前方是無(wú)人區(qū),只能摸著石頭過(guò)河,每一步都是挑戰(zhàn),但也處處是驚喜。
更重要的是,這是一個(gè)國(guó)內(nèi)最有機(jī)會(huì)與美國(guó)科技先驅(qū)并行的領(lǐng)域,AI 技術(shù)的“ 造芯 ”運(yùn)動(dòng)是日正當(dāng)中,想想海思追趕高通也花了超過(guò)十年,才造就今日的江湖地位,國(guó)內(nèi)發(fā)展 AI 技術(shù)有應(yīng)用場(chǎng)景做后盾,要打造出一家巨星級(jí)的企業(yè),這一劍肯定不用磨到十年!