互聯網技術正在深度融入人們的工作與生活,從一開始的電腦、手機、平板逐步被智能化以后,到現在幾乎所有的家電設備都面臨著一場大規模的智能化改造。因此,一個被業內稱為萬億級的智能家居市場正處在爆發的前夜,眾多企業都在以獨特的切入點努力打開智能家居的突破口,以便盡可能多的切下這個巨大市場的其中一塊蛋糕。
毫無疑問,智能家居黃金產業鏈中,電子設備的人機交互成為一個重要門檻,它很大程度上決定了智能家居產品是否具有方便、易用、智能的用戶體驗。智能家居的人機交互包括了指令及內容的輸入與輸出,內容輸出相對比較簡單,主要是顯示屏輸出及語音輸出。
而家電的指令輸入有按鈕、遙控、鍵盤、觸摸屏、語音、體感等多種方式,目前主流的控制方式依然是按鈕及遙控器,比如電視、空調、冰箱、燈光等等。隨著智能電視的爆發性增長,類似鍵盤、飛鼠及體感攝像頭等新型控制設備也在逐步流行,以適應智能電視集觀看、運動娛樂及購物等多種功能。
但是從人們期待的智能生活看來,目前的物理控制方式還是顯得累贅繁瑣,人們希望晚上回家,燈光自動打開,音響里自動播放喜歡的音樂,電視可以語音控制打開需要的頻道,早上起床鬧鐘響起自動語音播報今天天氣狀況。總之,家電設備的控制與內容輸出盡可能簡單自然,真正解放人的雙手。
可是,愿望總是美好的,現實總是殘酷的。智能語音技術盡管近幾年來取得了突飛猛進的發展,但是離人們期待的隨心所欲的控制家里的一切還有相當遠的距離。其中,語音識別率低是最大的障礙。即使是依靠口音相對統一的英語輸入為主的蘋果siri,其識別率也很難達到90%以上的程度。
對于中國這樣有著56個民族,有幾百上千種方言的人口大國,各種口音、腔調混雜其中,即使是普通話各個地方也有巨大的口音差異。因此,基于漢語為基礎的語音識別技術將面臨比英語更加巨大的技術挑戰,語音識別準確率會因人而異而變得非常明顯。識別率的低下將會導致語音控制技術在智能家居應用中用戶體驗難以達到用戶預期,甚至成為一種可有可無的擺設。
智能語音技術除了需要提高用戶語音輸入的識別準確率,還需要提高語義理解能力。即使是蘋果siri、谷歌Now這樣世界級的語音助手工具,其輸出能力還處在十分初級的狀態,以致很難黏住用戶。調查數據顯示,Siri可以理解83%的問題,但回答正確率只有62%。
總之,無論是國外科技巨頭,還是國內智能語音領域的先鋒企業,要想真正讓智能語音技術進入千家萬戶融入人們的生活,真正為人們所用,那么必然離不開識別技術的提高及后端龐大的語音知識庫,目前階段將智能語音技術稱為入口還為時太早。