2015年之前,在中國(guó)很多人都不知道AI。但是在過(guò)去 3 年里,AI突然變成了一個(gè)全民熱議的話題。尤其是 Google 阿爾法狗機(jī)器人打敗世界圍棋冠軍這件事,給整個(gè)社會(huì)帶來(lái)了巨大的震撼。
雖然AI技術(shù)在突飛猛進(jìn)地發(fā)展,但是如何實(shí)現(xiàn)AI技術(shù)的商業(yè)化,仍然是今天全世界AI企業(yè)面臨的最大的難題。
我以前在美國(guó)讀書,博士畢業(yè)之后本來(lái)是要去搞科研的,結(jié)果反而去了谷歌美國(guó)總部做科學(xué)家,后來(lái)又回國(guó)創(chuàng)建了AI公司“出門問(wèn)問(wèn)”。
從一個(gè)純粹的科研人員,到一個(gè)商業(yè)化的技術(shù)研究者,這是一個(gè)很大的轉(zhuǎn)變。在創(chuàng)業(yè)的過(guò)程中,我對(duì)于AI技術(shù)如何落地和商業(yè)化的問(wèn)題,有了很多的思考和想法,今天和大家一起分享。
Google AI為什么要自己做硬件產(chǎn)品?
AI商業(yè)化的關(guān)鍵有兩點(diǎn):場(chǎng)景和可掌控。
如果把AI的算法比作成靈魂,那這個(gè)場(chǎng)景就是身體,靈魂是需要身體才有意義的。AI技術(shù)去尋找場(chǎng)景的過(guò)程,就是一個(gè)靈魂附體的過(guò)程。
尋找可以掌控的場(chǎng)景,這就是 Google AI 一定要自己去做硬件產(chǎn)品的原因。
Google的安卓操作系統(tǒng)非常成功,占有了全球 70%-80% 的市場(chǎng)份額。安卓的戰(zhàn)略是以平臺(tái)為主,爆品為輔。而現(xiàn)在Google在AI層面的戰(zhàn)略則反過(guò)來(lái)了,平臺(tái)為輔,爆品為主,把自己的產(chǎn)品當(dāng)作一個(gè)爆品去做,而不只是追求 demo (示范)效應(yīng)。
(Google的AI硬件產(chǎn)品)
這其中的原因是:
第一,在 2007 年安卓剛剛起來(lái)的時(shí)候,多數(shù)硬件廠商并沒(méi)有做軟件的能力。
再加上iPhone的成功來(lái)得太快,很多手機(jī)廠商沒(méi)有反制之力,就很愿意把自己的場(chǎng)景讓 Google 的操作系統(tǒng)裝進(jìn)去。而現(xiàn)在大部分硬件廠商都有研發(fā)軟件的能力,并不愿意把自己的場(chǎng)景交給你。
第二,安卓是一個(gè)系統(tǒng)級(jí)別的軟件,它是可靠的,可以預(yù)測(cè)的。而AI技術(shù)是概率性的,存在特別多的不確定性。
比如語(yǔ)音識(shí)別的時(shí)候,有時(shí)候能識(shí)別對(duì),有時(shí)候識(shí)別不對(duì);在某一個(gè)場(chǎng)景下可以識(shí)別對(duì),在另一個(gè)場(chǎng)景下卻錯(cuò)了。這就對(duì)硬件產(chǎn)品有更高的要求,很多硬件廠商達(dá)不到這樣的要求。
在這種情況下,Google想要以安卓的方式去推動(dòng)AI的應(yīng)用,就會(huì)非常困難。谷歌做硬件的主要目的,就是要使自己的很多高科技、黑科技直接放到自己研發(fā)的設(shè)備里,讓AI技術(shù)有一個(gè)可控的場(chǎng)景。
AI商業(yè)化的路徑:建立技術(shù)、產(chǎn)品、商業(yè)的閉環(huán)
一個(gè)獨(dú)立的AI企業(yè)要想存活下來(lái),就應(yīng)該在算法的基礎(chǔ)上,盡早找到可以掌控的場(chǎng)景,建立技術(shù)、產(chǎn)品、商業(yè)的閉環(huán),然后在更大的規(guī)模上循環(huán)、迭代。
核心技術(shù):你會(huì)做的,別人也可以做出來(lái)
如果你是一家AI公司,想要把AI應(yīng)用到某一個(gè)場(chǎng)景里面去,你首先得有一套非常核心的技術(shù)。而且這個(gè)核心技術(shù)必須要有一定的難度,形成一定的壁壘,這樣才能擋住 95% 的競(jìng)爭(zhēng)者。
比如說(shuō)語(yǔ)音交互、語(yǔ)音識(shí)別這樣的技術(shù),在今天中國(guó)加起來(lái)不超過(guò) 10 家,絕大部分企業(yè)是無(wú)法進(jìn)入的,因?yàn)樗募夹g(shù)難度非常高。
但技術(shù)的領(lǐng)先頂多只能保持 8-12 個(gè)月,不能構(gòu)成絕對(duì)的壁壘。
深度學(xué)習(xí)在語(yǔ)音識(shí)別中的應(yīng)用,首先是在2012年由微軟研究院的華人科學(xué)家鄧力搞出來(lái)的。但是第一個(gè)做成大規(guī)模系統(tǒng)的反而不是微軟,而是Google。
因?yàn)榭蒲械娜ψ邮菦](méi)有秘密的,你做出一個(gè)東西之后,很快就會(huì)有另外一批人把它做出來(lái),甚至比你做得還好。
只有不斷迭代,持續(xù)性保持領(lǐng)先,才能形成真正的壁壘。也就是說(shuō),你得永遠(yuǎn)比競(jìng)爭(zhēng)者領(lǐng)先 8 個(gè)月。
你 8 個(gè)月前做的事情,可能現(xiàn)在有人已經(jīng)學(xué)會(huì)了。但這時(shí)候你已經(jīng)在做另外的事情,大家看到以后,又得再等 8 個(gè)月才能學(xué)會(huì)。
這是一個(gè)最好的正向循環(huán),Google正是靠這樣正向迭代的方式,使得它永遠(yuǎn)能夠在競(jìng)爭(zhēng)者面前保持幾個(gè)月的領(lǐng)先優(yōu)勢(shì)。
產(chǎn)品:算法只占整個(gè)產(chǎn)品開(kāi)發(fā)的30%
商業(yè)和科研的本質(zhì)是不一樣的。很多技術(shù)創(chuàng)業(yè)者都走不出技術(shù)或者算法這個(gè)階段,他們不知道什么叫產(chǎn)品,什么叫解決方案,把創(chuàng)業(yè)當(dāng)作科研在做,結(jié)果很快就失敗了。
光有算法是不夠的,還必須快速圍繞著算法在一個(gè)具體的場(chǎng)景里做出一個(gè)端到端的產(chǎn)品(To C),或者一個(gè)解決方案(To B)。
比如我研發(fā)出了一個(gè)語(yǔ)音識(shí)別的系統(tǒng),但是這個(gè)算法不是一個(gè)通用的算法,它可能剛好在我訓(xùn)練的相對(duì)安靜的環(huán)境下可以使用,在給投資人做 demo 的時(shí)候是ok的,因?yàn)榇蠹颐鎸?duì)的是黑乎乎的屏幕,沒(méi)有任何用戶體驗(yàn)可言。
但是如果這種算法應(yīng)用在 APP 上,在環(huán)境相對(duì)嘈雜的地鐵、公交或者街道上使用的時(shí)候,用戶體驗(yàn)就會(huì)非常糟糕。
所以,要做成一個(gè)產(chǎn)品,除了有基本的算法和系統(tǒng)之外,還必須有具體的應(yīng)用場(chǎng)景,讓用戶有一個(gè)良好的使用體驗(yàn),并在此基礎(chǔ)上不斷優(yōu)化。
出門問(wèn)問(wèn)現(xiàn)在應(yīng)用的場(chǎng)景有智能手表、智能音箱、智能車載等,每應(yīng)用于一個(gè)新的場(chǎng)景、新的設(shè)備的時(shí)候,我們的算法本身就要去做很多迭代和優(yōu)化。
算法只是一個(gè)起點(diǎn),它離一個(gè)真正的產(chǎn)品還有非常遠(yuǎn)的距離。
當(dāng)你基于語(yǔ)音算法做出一個(gè)產(chǎn)品的時(shí)候,可能這個(gè)算法本身只占你整個(gè)開(kāi)發(fā)的30%都不到,另外 70% 都跟這個(gè)算法沒(méi)有什么關(guān)系。
規(guī)模化:能夠支撐自身研發(fā)和未來(lái)競(jìng)爭(zhēng)
做出產(chǎn)品或者解決方案還遠(yuǎn)遠(yuǎn)不夠,商業(yè)上看的,是你到底有多少用戶,以及這個(gè)用戶帶來(lái)多少營(yíng)收和商業(yè)價(jià)值,能不能形成一定的規(guī)模化。
這種規(guī)模化要能夠做到:
第一,能夠支撐自身研發(fā)的迭代;
第二,可以通過(guò)這種迭代和規(guī)模,抵抗未來(lái)的競(jìng)爭(zhēng)。只有這樣,才能對(duì)所應(yīng)用的場(chǎng)景有一定的控制力。
這個(gè)時(shí)候就需要深度思考。所謂深度思考,就是說(shuō)你腦海里要有一個(gè)模型,能夠把一段話或者一個(gè)事情量化。比如10萬(wàn)規(guī)模的時(shí)候是什么樣子,50萬(wàn)的時(shí)候是什么樣子,100萬(wàn)的時(shí)候是什么樣子。
以價(jià)值 1000 元的智能手表為例,如果做出了 10 萬(wàn)臺(tái)的規(guī)模的話,就可以cover(覆蓋)一些材料、模具成本和基本的研發(fā)費(fèi)用。
如果要想cover(覆蓋)成本的話,就需要達(dá)到 50 萬(wàn)臺(tái)的規(guī)模。
而如果做到了 100 萬(wàn)臺(tái)的話,那就可以形成足夠高的壁壘。尤其是面對(duì)華為、小米、三星這樣的競(jìng)爭(zhēng)對(duì)手,你對(duì)所在的場(chǎng)景是有一定掌控力的。
但是如果有 BAT 或者谷歌這樣的超級(jí)巨頭想闖入這個(gè)領(lǐng)域的話,那么 100 萬(wàn)臺(tái)的規(guī)模就沒(méi)有任何意義,原先可控的場(chǎng)景又變得不可控了。
因?yàn)榫揞^們不靠硬件賺錢,他們可以進(jìn)來(lái)之后先扔“炸彈”,把市場(chǎng)搞亂,把量做上去之后,再通過(guò)后面的軟件服務(wù)去變現(xiàn)。
所以,規(guī)模化的程度取決于你處于什么樣的市場(chǎng),以及你自己處于什么樣的階段。
“出門問(wèn)問(wèn)”的AI商業(yè)化實(shí)踐:形成商業(yè)閉環(huán)
2012年我剛回國(guó)的時(shí)候,主要精力投入算法的研發(fā)。因?yàn)槲乙郧笆亲鲎匀徽Z(yǔ)言處理和機(jī)器翻譯的,對(duì)非常復(fù)雜的算法很了解,所以花了 8 個(gè)月就做到了端到端的語(yǔ)音交互,完成了AI技術(shù)積累。
為了盡快實(shí)現(xiàn)商業(yè)化,2013年出門問(wèn)問(wèn)用研發(fā)出來(lái)的語(yǔ)音交互算法做了微信公眾號(hào),也做了手機(jī)上面的語(yǔ)音助手。但是這些東西沒(méi)有形成閉環(huán),因?yàn)闆](méi)有用戶量,也沒(méi)有任何營(yíng)收。
2015年,出門問(wèn)問(wèn)開(kāi)始去做智能手表。我們當(dāng)時(shí)沒(méi)有去做機(jī)器人或者車載,是因?yàn)樵诋?dāng)時(shí)的人員規(guī)模和市場(chǎng)規(guī)模下,做機(jī)器人或者車載達(dá)不到閉環(huán)的效果。智能手表推出后,起到了良好的市場(chǎng)效果,銷量達(dá)到了 30 萬(wàn)臺(tái),占據(jù)了 30% 的市場(chǎng)份額,第一次實(shí)現(xiàn)了技術(shù)、產(chǎn)品、商業(yè)的閉環(huán)。
2016年,在出門問(wèn)問(wèn)的軟件能力、硬件能力、供應(yīng)鏈的能力、商業(yè)推廣能力、營(yíng)銷能力都達(dá)到一定的階段之后,我們又開(kāi)始開(kāi)拓更多可掌控的場(chǎng)景,去做車載、家居、耳機(jī)等等,因?yàn)槲覀冃枰诟蟮囊?guī)模上循環(huán)迭代。
(出門問(wèn)問(wèn)的正向循環(huán))
到現(xiàn)在為止,出門問(wèn)問(wèn)實(shí)現(xiàn)了各種智能設(shè)備上的語(yǔ)音交互,從手機(jī)、音箱、車載、耳機(jī),凡是你能想到的語(yǔ)音交互比較有用的地方,我們都做過(guò)一個(gè)應(yīng)用。
小結(jié):
在AI領(lǐng)域創(chuàng)業(yè),并不會(huì)輕易死掉。因?yàn)锳I公司同O2O公司不同,不需要每天花那么多錢補(bǔ)貼用戶,它的主要成本是人工成本。當(dāng)公司盈利情況并沒(méi)有那么好的時(shí)候,只要少招點(diǎn)人就可以存活。
但是在我看來(lái),如果一個(gè)創(chuàng)業(yè)公司沒(méi)有增長(zhǎng),跟死亡是一樣的。
如果一個(gè)公司第一年100人,第二年100人,第三年還是100人,營(yíng)收也沒(méi)有任何變化。那么這種公司的價(jià)值是不大的。
對(duì)于“出門問(wèn)問(wèn)”來(lái)說(shuō),我們每天都在逼著自己跨越舒適區(qū),去思考如何找到更多的機(jī)會(huì),如何有更多可控并且規(guī)模化的應(yīng)用場(chǎng)景,如何在激烈的競(jìng)爭(zhēng)中存活下來(lái)。
只有這樣,當(dāng)BAT這樣的巨頭進(jìn)入的時(shí)候,我們才能夠更加從容地去面對(duì),完成一個(gè)初創(chuàng)AI公司的成人禮。