企業網D1Net&運營與增值D1Com聯合報道
導語:蘋果語音處理芯片提供商Audience和Siri語音助手技術提供商Nuance,互聯網豪強阿里、百度、高德如今都成為中興的座上客,共謀以“聲控方式”,開啟智能手機交互體驗的新時代。
由中興倡導的智慧語音聯盟各方成員簽署聯盟成立倡議書
后蘋果時代
如今,手機界創新已顯乏力。Zealer王自如在去年iPhone5s評測時就能將iPhone6可能推出的光學防抖、更大屏幕、64位應用、可穿戴設備幾項新增能力,猜了個八九不離十。是神預測嗎?筆者認為,王自如的觀察功力確實不凡,同時,智能手機的可發展空間已經極度清晰化也是不爭事實。所以,王自如能夠如此神準預測iPhone6功能并不意外。
這里我們就要問一個問題,以iPhone6為代表的智能手機的未來演化路線是什么?是在性能之路上無止盡的攀升嗎?是致力于達到切菜刀一般“鋒利”的機身厚度嗎?還是重新攀登可穿戴設備的科技樹?其實,回溯智能手機發展史,我們會發現這樣一條規律:
每隔一段時間,手機會產生革命性的提升。此時,試圖走優化之路往往行不通。用戶需要的是全新的刺激和手機操控體驗。
中興曾學忠在智慧語音聯盟成立發布會上曾介紹說,手機經歷了如下幾個演化過程:
1、Motorola時代:滿足我的時代。
Motorola,作為蜂窩電話的發明者,開啟了移動電話的時代。這個時代,它滿足了人們對移動通話的需求。
2、Nokia:吸引我的時代。
Nokia,偉大的芬蘭巨人,是功能手機時代的真正王者。它讓人們意識到,手機不僅可以用于通話,還可以很(za)好(he)玩(tao)。
3、Apple:改變我的時代。
Apple,暴君&天才的結合體喬布斯,用他心中的完美,重新定義了手機的交互規則。讓觸摸操控成為智能手機的標準配置,讓尊重用戶體驗成為智能手機甚至整個消費電子業的黃金定律。在這個時代,Apple為人們帶來了此前絕對料想不到的手機使用體驗。
可惜,以上皆是過去。
此刻,眼看著由蘋果領軍的,以觸摸交互為代表智能手機進入創新遲緩期,我們不禁要問,下一代能給予用戶極大驚喜的智能手機會是怎樣?
可穿戴設備是一個方向,手機整合智能家居是一個方向,手機與車載應用整合也是一個方向。而筆者在這里將展示的是,一條并不為人重視卻極具潛力的方向——賦予手機語音交互能力和人工智能的“智慧語音”。
它,可能成為手機未來的發展方向嗎?
一只活的手機
哇,抓到一只活的手機——它并不是被變形金剛里的火種賦予了生命。卻能人性化地與你語音交互并執行指令。可能嗎?眼見為實(無法觀看視頻的讀者點擊這里):
視頻中展現的可以與你語音對話的手機很酷,很智能,有沒有?
你想不想讓你的手機、你家的電器設備都能像你的朋友一樣聽懂你的需求,并按照你的指示作出正確的反應,那該是多么美妙的體驗。
顯然,在科幻電影中常見的腦電波交流實現之前,沒有比語音更合適的人機交互方式了。因為語言溝通是我們最熟悉,也是最自然的交流方式。這也是如今語音識別科學炙手可熱的原因——哪怕視線跟蹤,手勢識別這一類前沿技術亦不可與前者同日而語。
當然,人機交互自計算機誕生以來都不是件容易的事情。回溯當年,從最早的計算機早期的面板開關,顯示燈和穿孔紙帶等交互裝置,到80、90年代的命令行、窗口圖形界面,再到蘋果手機率先推出觸摸屏,人類始終在不斷尋找簡化人機交互難度的工具。但是自始至終,都是人類在適應工具,而非機器智能化地響應人類的需求。
不過在2006年,神經網絡技術獲得突破性進展之后,阻礙人機語音交互的最后一塊屏障破碎了,此時,前方坦途一片。
智慧語音之春
神經網絡技術是語音交互和人工智能的最核心技術。
自神經網絡算法1940年提出以來,曾一度舉步維艱。此后數十年中,也只是在1968年獲得一定進展。好在經過漫長的發展,到了2006年,神經網絡算法終于獲得突破性進展。此時,它第一次具備了優質的特征學習能力。如同呱呱墜地的嬰兒,開始了它快速成長的旅途。
此后,在各基于神經網絡技術的實踐項目中相繼傳出一些喜訊:
2012年,基于神經網絡技術構建的Google“谷歌大腦”在沒有獲得任何知識的前提下從一千多萬Youtube照片中正確識別出“貓”這個物種。
2013年,中興在自由品牌手機中推出的“語音駕駛助手”應用,實現了90%的正確語音識別率。
2014年,Facebook“深度臉”項目,在比對兩張人臉是否是一個人的實驗中,實現了99%的精度突破,與之相比,人類僅有97.5%的平均識別率。
2014年,微軟推出的人工智能小冰,基于狗類照片實現了99%的品種識別率。
不可否認,作為一種通用技術,神經網絡技術正在改變我們的生活。也許不遠的未來,能夠突破圖靈測試挑戰(圖靈測試源自計算機先驅圖靈,其內容是,如果電腦能在5分鐘內回答由人類測試者提出一系列問題,且其超過30%的回答讓測試者誤認為是人類所答,則電腦通過測試)的人工智能即將批量面世。
此時,對于智慧語音而言,技術已經不是問題。在可以預見的未來,人機語音交互的識別率將不斷提高,機器將具備人的情感,與我們進行人性化地溝通,并利用各類智能引擎,幫助我們解決難題。
前文視頻中提到的智慧語音應用將全然不成問題,甚至其能力將超乎我們想像。正如我們確信機器智能終將超越人類一般,手機,也將真正成為“口袋里的老爺爺(網絡小說常見梗,指主角幸運遇到的,無所不知、無所不能,并能隱藏在主角身邊不被察覺的強力幫手,其身份往往是老爺爺)”那樣強力的助手。
中興的布局
此時,我們再看中興對智慧語音聯盟的布局就非常清晰。
Audience,國際領先的語音處理芯片提供商。Nuance,國際領先的語音識別解決方案提供商。有意思的是,兩者同樣是(或曾經是)蘋果語音降噪及Siri技術提供商。
在兩者協助下,中興將會把其品牌手機中現有的“語音助手”和“駕駛助手”兩款應用的語音識別能力進一步升級,直至發展出真正的智慧語音。論之詳情,我們可以看看中興對智慧語音發展的計劃表:
2013年9月,中興首次推出了可以基于語音交互技術的“駕駛助手”。
2014年4月,中興推出了系統級語音方案,與此同時,“星星1號”手機用戶已經可以享受全新的“語音喚醒”的體驗。
2015年6月,中興計劃將語音操控能力延伸至整個系統。此時,用戶將可以使用語音指令完成一切常用手機操作和控制。
2015年12月,中興將推出“智慧語音”系統,此時,手機或將不僅是個能與用戶對話,簡單執行指令的“助手”,而成為具備一定人工智能能力的小伙伴。
需要注意的是,百度、阿里、高德等互聯網巨頭企業同樣加入了本次智慧語音聯盟。如本次活動中百度發言人所言,“隨著智慧語音技術的發展,語音將成為更便捷的移動互聯網(輸入)入口。如此先機不得不察。”
于是,從第一流智慧語音芯片和技術提供商,到全球Top5手機終端制造商,再到國內最強的互聯網公司組成的強悍團隊,在此抱團并將開啟它們在智慧語音領域的探索之旅。
它們能改變未來嗎?
它們能顛覆喬布斯定義的手機“觸摸交互”時代,并開啟手機“聲控交互”的新紀元嗎?
結語:
盡管未來依然充滿變數,但是可以肯定的是,智慧語音聯盟各方將從中受益無窮。基于神經網絡技術的語音識別能力發展需要大量樣本訓練方可愈發成熟,Nuance將從中受益,并進一步加強在中國市場的影響力。Audience攜手中興這樣的千萬量級手機制造商,將有望進一步提升性能,降低語音芯片成本和能耗。百度、阿里、高德,則提前預定了移動互聯網的下一個潛在入口。至于中興,則有望成為下一個蘋果,為智能手機市場帶來預見未來的顛覆式產品。