3月20日,思必馳在2018中國人工智能應用與生態峰會上榮獲中國領先語音智能廠商的殊榮后,中國軟件網獨家專訪到了思必馳CMO龍夢竹,就智能語音的發展、思必馳的應對策略以及備受關注的DUI開放平臺等內容展開了對話。
語音是IOT時代的人機交互方式,發展潛力巨大
火爆的人工智能市場中,機器視覺和智能語音一直是最受關注的發展方向之一。機器視覺的廠商無論從融資額還是市場估值普遍都高于智能語音廠商。最直接的原因就是機器視覺已經找到了相對成熟的商業落地模式,在安防、醫療等領域能更為明顯而直接的帶來效率的提升。
語音與視覺不同,語音是富信息,語音交互中帶有音色、音量、速度、節奏等信息,不同的語境與語調會帶來無限的可能。人類經歷著從PC互聯時代、移動互聯網時代到現在IoT時代的發展,交互方式也從傳統的按鍵、觸摸等交互方式向語音交互方向發展。產業鏈正在迎來變革,AI及AI+的專業分化進程加速。龍夢竹表示,語音交互成為IoT時代最重要的交互方式之一,將會迎來更廣闊的發展前景。
由于語言本身的多樣性,智能語音技術難度和壁壘較高
隨著阿里天貓精靈、聯想智能音箱、小米互聯網音箱的火爆,在背后提供語音交互技術支持的思必馳也逐漸在公眾面前露出。不知從何時起,“人工智障”這個詞成為了大家戲謔和調侃的口頭禪。談到語音交互的現狀,與大家將“人工智障”歸結于技術問題的認知不同,龍夢竹認為目前語音智能的技術水平已經比較成熟,但也存在幾個方面的問題與瓶頸有待突破,其中語音交互場景中不確定因素多、單點智能到整體智能路徑的瓶頸、性價比和內容知識圖譜建立不完善等問題,都對語音交互體驗有所影響。
首先,語言本身包含的內容非常豐富。比如:“嘿,等著我”既可能是夕陽下少男少女口中的呢喃,也可能是打架斗毆后撂下的狠話。另一方面,大家對語音交互的測試挑戰早已超出了正常對話狀況,畢竟沒有人在對話的時候突然冒出一句“**放個屁”“***,天王蓋地虎”,但這種挑戰人工智能的對話,對智能硬件來說早已習以為常了。其次,人們已經習慣了在場景下的不同反應,但對于人工智能而言,交互是一個全鏈路的過程,不僅僅是語音識別,還有語義理解、語音合成等一系列環節,單點智能到整體智能的路徑依然沒有打通。知識圖譜作為人工智能的底層技術之一,其技術成熟度也在制約著人性化的交互方式的進展。
專注語音技術的場景化落地,以DUI開放平臺構建AI生態
那么,專注于人性化智能語音交互技術的思必馳,在智能語音的瓶頸突破方面又將如何破局呢?
龍夢竹介紹到,思必馳專注于打造人性化的語音交互技術,對于立足于技術的思必馳來說,技術是根本,但并不是瓶頸,如何將技術應用到現實的場景中,用戶體驗和技術同等重要:一方面,思必馳與內容資源方合作積極擴展第三方內容資源,為用戶提供更多的內容服務;另一方面,思必馳將繼續在專注細分領域的同時著力構建開放平臺,賦能更多智能硬件,助力傳統企業轉型。在生態方面,思必馳于2016年成立馳星創投,得到了元禾資本、富士康、清華控股等LP的支持,旗下擁有兩支基金,分別為2億元天使基金和10億元成長基金,專注投資人工智能和智能交互產業早期項目。思必馳在AI領域全面布局,加速在物聯網領域的深入和拓展,打造AI生態,賦能萬物。
硬件廠商與語音交互技術公司的傳統合作模式中雙方的溝通成本較高,,在自定義產品功能、系統迭代、內容升級等方面往往會存在延遲,造成了開發周期長、更新迭代慢等問題。此外,智能語音交互技術的整個鏈條較長,涉及到前端信號處理、喚醒、識別、語義、對話、問答等諸多核心技術,對于開發者來說比較復雜,有一定的技術門檻。因此,向開發者開放語音交互技術、讓用戶自定義產品、大規模定制開發成為必然方向,思必馳DUI開放平臺也應運而生。
出于好奇,筆者也注冊了一個DUI平臺賬號,快速體驗了一把平臺上的“技能包”。只要在左側輸入內容,右側同步輸出代碼。作為“代碼盲”,從未感覺到原來技術可以離我們如此之近。當技術做到如此貼近開發者的時候,技術與行業場景、整體智能的融合還會遠么?
與龍夢竹的交談中,總是能深深的感覺到她對DUI平臺的篤信與自豪,或許這種自信源于專注領域的成功和對技術的信仰吧。伴隨著人工智能與物聯網的融合, DUI+IOT的智能產業生態構建。思必馳還將帶來哪些驚喜,我們拭目以待。