智能網絡的終點,是語音掌控萬物嗎?
三年前,當Gartner在Gartner Symposium/ITxpo 2013大會上提出“萬物互聯”概念時,這個世界就注定變得與以往不同。我們正從今天的“物聯網”(IoT:internet of things)走入“萬物互聯”(IoE:internet of Everything)的時代。
人們不斷追求將萬事萬物連接起來,從智能手機到智能家居,再到汽車的智能系統,發展日新月異。然而,這并不是萬物互聯的全部內涵。通過手機操控一個電插頭并不是人類的終極未來——那只是一個簡單的連接,更智慧的互動將被應用。在物聯網之后,萬物互聯的下一個熱點在哪里?筆者認為是語音技術。
在百度語音最近舉辦的語音技術媒體溝通會上,筆者看到,無論是汽車還是機器人,語音帶來了真正的智能化體驗。對著汽車說,”帶我到最近的加油站“,汽車導航就會自動搜索距離你最近的加油站,甚至未來可以開啟自動駕駛功能,幫助主人實現目標。而對著小度機器人說,“聽一段懸疑小說”,小度就會為你聲色并茂地朗讀一段懸疑小說,先進的語音合成技術幾乎完美地模擬出真人的音聲、音調與情緒的起伏,令人沉浸其中。而更加令人激動的是,即便是用方言說,“想看《新白娘子傳奇》”,或者以自定義的昵稱“小樂”喚醒你的手機,百度語音技術也能準確識別、理解用戶的需求,并啟動終端設備與之互動。在會上,百度語音還免費開放了喚醒與自定義語義兩項功能,將進一步推動多終端一體“音入口”普及、終端語音識別率提升。
為什么說語音技術將是智能網絡的未來呢?因為目前的智能網絡存在顯著瓶頸。一方面,人機交互界面主要以文字、圖片為主,對操作者的IT素養要求很高。在自動提款機上,想要取出一張一百元鈔票,需要用戶至少準確無誤地按下十來個按鍵才能完成操作。另外一方面,人機交互的過程往往只是單向、非閉環、非全自動化的。比如在醫院、高速收費口或地鐵口,取卡與讀卡的效率甚至還不如人工。這些種種的瓶頸,導致智能網絡的操作門檻與成本都居高不下。
解決上述問題,并不能單獨從操作邏輯的優化、網絡或硬件的改進等入手,而需要從界面和大腦兩個層次入手。首先,從互動方式看,要遵循人性。人類最天然的交流方式并非文字,而是語言。即便是嬰兒,也會在呱呱落地時哇哇大哭,引發父母的關注,其一哼一哈,均蘊含著豐富的意義,慈悲的父母,總能準確地感知。因此,在交流方式上,未來的智能網絡勢必從現有的文字為主的書面溝通方式,進一步升級為更加人性化的語音交流。因為在交流方式上,人們最快的方式是說話,而不是書面化的人機交互。
其次,未來的智能網絡,通過云能力的布置,每個設備都可以擁有一個影子“大腦”。現在的智能設備之所以不夠智能,是因為沒有最強大腦??照{太干燥了,不知道啟動加濕器;電飯煲啟動了,自動炒鍋卻笨到不會啟動,需要人工投料、啟動。這是因為他們只能接受簡單的輸入,沒有理解和輸出能力,所以又笨又啞。而伴隨著百度大腦這樣的技術平臺不斷開放,語音技術中的語音識別、語音理解、語音合成等能力就完全可以賦予給一切終端,令他們通過“云”的蟲洞,瞬間免費擁有影子“最強大腦”,從而變得智能可交互,創造無限可能。
如此一來,所有的物,不論是人、設備、軟件,都將會獲得語境感知,增強的處理能力和更好的感應能力。智能網絡的終極追求,應該是語音即可掌控萬物。那么,相比目前的互聯網,這樣的智能網絡規模將得到以萬倍計算的增長,并且智能程度大幅提升——因為目前接入互聯網的“物”,還只占到全部數量的1%,而且大多數“物”均沉默無語。
1980年,以太網的發明者梅特卡夫提出,網絡的價值V與其用戶數量n的平方成正比,這就是大名鼎鼎的梅特卡夫定律(Metcalfe’s Law)。我們可以相信,梅特卡夫定律依然將作用于萬物互聯時代。
2016年,百度創始人李彥宏指出,互聯網即將迎來發展下一幕,推動其發展的核心動力,是人工智能。而人工智能的第一領域是語音識別?;蛟S,我們可以將之稱為李彥宏法則——無智能,不未來,無語音,不智能。
將梅特卡夫定律與李彥宏法則疊加,我們不難看到萬物互聯的未來,一個集合十億甚至萬億連接的龐大網絡將會出現,并且每個連接其中的“物”都能聽會說?;蛟S,這才是孔老夫子“君子動口不動手”的本意?
音聲世界,見所未見!