乘客上車后要是改變路線,他更習慣打開地圖后直接用語音輸入指令,而且在周圍認識的同行里,大家現在也都很習慣用這種操作方式。
這僅僅是語音交互場景的普通一種。
“中國對話式人工智能市場已經開始爆發,速度比我們想象的快很多。”百度智能生活事業群組(SLG)總經理景鯤在第二屆AI開發者大會上說,“拿一個數字舉例,今年1 月份DuerOS(對話式人工智能操作系統)的智能設備激活量超過5000萬個,截止到6月,后臺激活量已經超過9000萬了,月活設備超過2500萬,無論是合作伙伴數量、落地主控設備、還是開發者數量均為國內市場第一。”
景鯤,曾任微軟首席研發總監負責微軟必應搜索業務,他是微軟小冰的創造者。
2014年他加入百度主要負責搜索,包括語音、圖像以及對話式搜索。兩年后,他接手了度秘(語音助手app)團隊,負責度秘和DuerOS業務。
百度對該部門的重視程度非同一般,坊間傳聞景鯤是當年陸奇最喜歡的員工之一。
2017年2月度秘團隊升級為度秘事業部,并迅速被公司推到一線位置,成為和另一大自動駕駛開放平臺 Apollo(阿波羅)并行的重要業務線。
百度智能生活事業群組(SLG)總經理景鯤
DuerOS是一種對話式人工智能操作系統,依托百度算法、計算、數據上,用戶可以在搭載該系統的設備體驗到自然語言對話的交互方式, 可以用在手機、電視、音箱、汽車、機器人等多種硬件設備上。
內容涉影音娛樂、信息查詢、生活服務、出行路況等10大類目的250多項功能的操作。
早在2016年,景鯤團隊試圖把AI能力賦予智能硬件上,讓他印象深刻的就是跟國安廣視(電視機頂盒的公司)和小魚在家(陪伴機器人)合作,他們發現這種應用產品在國內有巨大市場潛力,找到硬件商結合百度的技術優勢是一個不錯的想法。
2017年美國CES展會上DuerOS系統首次亮相,一年內DuerOS發布了升級版2.0版,在近日召開的百度AI開發者大會上,官方發布了DuerOS 3.0版,對比去年推廣初期,景鯤還會擔心用戶能否接受在酒店、車里和家里以及路上跟智能設備對話。
經過一年發展后,他認為當時他有些想多了,原因其一是合作伙伴需求很多,倒逼團隊不斷快速優化升級。
操作系統背后的核心要素有交互、應用和商業閉環三種要素,按照百度的理念,DuerOS不止是產品,它更是一個生態。
現在,在VIVO NEX、華為P20、OPPO FIND X等國產智能手機,創維、TCL電視已搭載了DuerOS系統,另外他們也與5家汽車廠商進行合作。
新版DuerOS系統中包含了新版情感語音播放、聲紋識別、支持免喚醒多輪對話等功能,新增有屏設備和藍牙設備解決方案,方便了沒有能力做硬件產品的中小企業。而且還發布了開發者分成計劃,即前6個月收益將100%回饋給開發者。
為了吸引更多開發者,這也是很拼的。
據百度內部人士透露,且不談變現,今年團隊強調的是用戶量、硬件激活量、開發者數量,這是內部KPI考核指標。
體驗做好并不簡單
同樣是開放平臺,國外科技巨頭出手略早,在2015年亞馬遜推出Echo智能音箱,內置Alexa智能語音助手, 據公開資料顯示,亞馬遜 Alexa 平臺的技能數量已經達到3萬個。
另外一個巨頭是谷歌,在今年5月召開的開發者大會他們發布了新版Google Assistant并展示了人工智能客服等產品,雖然這被業內人士看來漂亮的Demo可以提前做好,但一定程度上,呈現了谷歌未來的重點發展方向。
智能語音交互技術可以用在方方面面,有趣的是,這些科技巨頭都先盯上了酒店這個應用場景。
今年6月,亞馬遜宣布與萬豪國際酒店集團達成合作,通過亞馬遜Echo智能音箱,利用Alexa語音助手來控制酒店內的智能設備,而在本次大會上,百度也邀請到了合作方洲際酒店集團代表,DuerOS為洲際酒店量身定制了一套對話式人工智能的硬件設備和云端服務。
可以預見,科技巨頭們希望通過語音交互方式賦予智能硬件產品以此掌握用戶智能家居系統,通過巧妙地方式構建自己的生態,讓語音交互技術擁有額外價值。
再來看國內,去年國內也有很多不同背景的公司在推進自己的開放平臺,比如阿里云、小米IoT、思必馳DUI等。
最近,思必馳剛剛獲得5億元D輪融資,CMO龍夢竹對品途表示,不論谷歌、亞馬遜有多強,對于中文操作來說,全世界做得最好的還得是國內企業,因為中文是最難的語言。
國外擅長做從“0到1”開源工具,而國內更擅長將“1到100”,如果關注國外語音、圖像一線技術比賽,可以發現國內企業在很多領域都能拿到國賽大獎。
然而,這些合作企業利用平臺把用戶體驗做到極致卻并不簡單。
“有時候我們做的技術接口,跟平臺方并不適配,他們做的標準跟我們也對不齊,這就是一個問題。”一位參加開發者大會的技術提供商對品途說。
的確,相比過去互聯網公司做一款App來說,現在對于生態平臺團隊的挑戰會更大。
景鯤曾接受媒體采訪時說,“原來做一款產品很容易,了解你自己的能力+了解用戶,將這兩個結合在一起做一個 App 就能做出比較好的效果。但是,真正做一個生態,尤其是在 AI 時代里,許多(案例)是軟硬結合的。”
正如他所言,AI時代的開放式平臺會接觸的各種合作伙伴:硬件、芯片、系統集成方案商、開發者還有內容方。
在這里面如何整合所有角色訴求,讓各個企業發揮出自己最擅長的能力,最考驗團隊能力,因為這里面整合產業各個方面,難度復雜度都是可想而知的。
那么,這些中小企業合作方如何把握機會,與大平臺配合做好自身業務?
埃微手環創始人埃微老祝(網名)把國內主要幾個平臺做了簡要的對比分析,相比小公司,DuerOS擅長的是出行、地圖、搜索等語音庫、語義庫、知識圖譜。
百度做開放平臺,小公司結合自己的優勢,只需要調用這些數據并且做好細化應用即可。
阿里有阿里云LoT,也有基于語音的系統,但缺乏百度豐富的搜索數據庫。
訊飛在語音識別方面號稱國內第一,從語音準確率方面沒有問題,但是語義方面只有基礎數據,沒有類似阿里的商品數據也沒有百度的搜索和地圖數據。
這幾家平臺各有優勢,以后還會不斷強化,誰也取代不了誰。畢竟,在語義和知識圖譜方面,每家都不一樣。
消費端市場仍需培養
“現在還屬于一個市場的早期和教育期,雖然中國市場總量不是很多,不過用戶還是比較愿意用。另外,還需要剛需場景,有時候技術還沒有準備好,但是場景控制好,還是有剛需的。”景鯤說。
在去年團隊比較擔心沒有那么大市場和合作伙伴,而在一年后,對他們來說,如何把培育市場的時間縮短,讓用戶更快接受這種新興交互體驗重要。
無論是鼠標、鍵盤與電腦的交互還是觸屏、語音對話交互,每一個時代每個階段都有自身特點。
如果把人機交互的迭代方式分類匯總的話,第一代可以是以鼠標和鍵盤為代表的傳統交互方式,而iPhone的出現讓觸屏手機取代了傳統按鍵功能,交互方式再次升級,第三代交互方式可以理解為解放用戶雙手,實現人機對話的方式。
對于這個新興交互方式,家庭和車以及在路上為主的應用場景被各家企業看中已是不爭的事實。
思必馳CMO龍夢竹認為,這里分為兩個類型,一個是重依賴型:車載、家居、機器人及客服,另外一種輕應用:醫療、教育、投顧等,算錦上添花的應用。
車和家庭兩個場景現在產品體驗度和用戶接受度都非常好,從發展角度來看,并不是我們同國外技術差距有多大,而是在同一個技術水平下,現在要看誰能做好細分行業應用。
不難發覺,擺在開發者尤其是中國開發者面前的,是中國獨特的市場空間,在這塊肥沃土壤中未來五到十年,有機會生長出彎道超車的巨頭,移動時代的iOS、安卓或許將成為過去。
在AI時代,百度DuerOS、亞馬遜Alexa、谷歌 Assistant們如何攪動市場還真有些看頭。
品途聊天室
AI時代即將到來,
留言說說,
你對未來AI融入生活有什么期待?