互聯(lián)網(wǎng)技術(shù)正在深度融入人們的工作與生活,從一開始的電腦、手機、平板逐步被智能化以后,到現(xiàn)在幾乎所有的家電設備都面臨著一場大規(guī)模的智能化改造。因此,一個被業(yè)內(nèi)稱為萬億級的智能家居市場正處在爆發(fā)的前夜,眾多企業(yè)都在以獨特的切入點努力打開智能家居的突破口,以便盡可能多的切下這個巨大市場的其中一塊蛋糕。
作為國內(nèi)唯一的語音技術(shù)上市公司,科大訊飛近半年來在智能家居方面頻頻布局,不但與TCL、長虹、海爾、海信、康佳、創(chuàng)維等智能電視廠商合作推廣電視語音控制,而且還推出自主研發(fā)的訊飛智能音箱,通過將此前多年積累的智能語音技術(shù)植入進家電設備中,讓家電控制更加智能化、更加人性化。
毫無疑問,智能家居黃金產(chǎn)業(yè)鏈中,電子設備的人機交互成為一個重要門檻,它很大程度上決定了智能家居產(chǎn)品是否具有方便、易用、智能的用戶體驗。智能家居的人機交互包括了指令及內(nèi)容的輸入與輸出,內(nèi)容輸出相對比較簡單,主要是顯示屏輸出及語音輸出。
而家電的指令輸入有按鈕、遙控、鍵盤、觸摸屏、語音、體感等多種方式,目前主流的控制方式依然是按鈕及遙控器,比如電視、空調(diào)、冰箱、燈光等等。隨著智能電視的爆發(fā)性增長,類似鍵盤、飛鼠及體感攝像頭等新型控制設備也在逐步流行,以適應智能電視集觀看、運動娛樂及購物等多種功能。
但是從人們期待的智能生活看來,目前的物理控制方式還是顯得累贅繁瑣,人們希望晚上回家,燈光自動打開,音響里自動播放喜歡的音樂,電視可以語音控制打開需要的頻道,早上起床鬧鐘響起自動語音播報今天天氣狀況。總之,家電設備的控制與內(nèi)容輸出盡可能簡單自然,真正解放人的雙手。
可是,愿望總是美好的,現(xiàn)實總是殘酷的。智能語音技術(shù)盡管近幾年來取得了突飛猛進的發(fā)展,但是離人們期待的隨心所欲的控制家里的一切還有相當遠的距離。其中,語音識別率低是最大的障礙。即使是依靠口音相對統(tǒng)一的英語輸入為主的蘋果siri,其識別率也很難達到90%以上的程度。
對于中國這樣有著56個民族,有幾百上千種方言的人口大國,各種口音、腔調(diào)混雜其中,即使是普通話各個地方也有巨大的口音差異。因此,基于漢語為基礎的語音識別技術(shù)將面臨比英語更加巨大的技術(shù)挑戰(zhàn),語音識別準確率會因人而異而變得非常明顯。識別率的低下將會導致語音控制技術(shù)在智能家居應用中用戶體驗難以達到用戶預期,甚至成為一種可有可無的擺設。
智能語音技術(shù)除了需要提高用戶語音輸入的識別準確率,還需要提高語義理解能力。即使是蘋果siri、谷歌Now這樣世界級的語音助手工具,其輸出能力還處在十分初級的狀態(tài),以致很難黏住用戶。調(diào)查數(shù)據(jù)顯示,Siri可以理解83%的問題,但回答正確率只有62%。
總之,無論是國外科技巨頭,還是國內(nèi)智能語音領域的先鋒企業(yè),要想真正讓智能語音技術(shù)進入千家萬戶融入人們的生活,真正為人們所用,那么必然離不開識別技術(shù)的提高及后端龐大的語音知識庫,目前階段將智能語音技術(shù)稱為入口還為時太早。