作為代表未來科技發(fā)展趨勢的物聯網,隨著產業(yè)鏈的不斷完善,落地應用越來越多,尤其是面向消費者市場的智能家居,已成為物聯網時代的風口,全球智能家居市場高達萬億。
智能家居產品最早從智能電視開始,當時的廠商嘗試將語音交互功能嵌入到電視或機頂盒里。經過幾年的發(fā)展,到現在,語音功能已逐漸成為電視的標配。
從2017年開始,以智能音箱為代表的家居單品開始爆發(fā)式增長,智能音箱更是百箱大戰(zhàn),亞馬遜、Google、百度、阿里、騰訊、小米、訊飛、聯想等一大批企業(yè)都參與其中,智能音箱可以與用戶交流、播放音樂甚至網購。隨著各類智能家居產品的增多,亞馬遜、百度等人工智能巨頭紛紛在搭建統(tǒng)一平臺,以語音為入口,連接各種智能家居設備。
傳統(tǒng)電器廠商也開始在傳統(tǒng)電器上賦予人工智能,智能空調、智能油煙機、智能冰箱、智能臺燈都在如火如荼的研制。
針對龐大的兒童消費市場,智能手表、故事機、機器人等兒童智能產品也越來越受歡迎。
可以說,智能家居產品應用已經進入跑馬圈地、深入千家萬戶的階段,它以超前的生活理念逐步影響著我們每一個人。
智能家居產品的技術挑戰(zhàn)
智能家居產品最主要的特點是語音交互,解放用戶的雙手,通過最自然的語音進行交互。可以說,語音識別技術是智能家居產品的直接推動者。
在智能家居產品以前,語音識別技術主要用于手機。那么手機和智能家居產品里的語音識別技術有什么差異嗎?
普通話語音識別在手機上已取得了很高的準確率,但在從手機過渡到智能家居產品的過程中,原有語音識別技術的準確率有顯著下降。
首先,說話人離智能家居產品的距離比使用手機時更遠,會帶來遠場語音問題,包括噪音、混響等。
其次,智能家居產品的用戶有相當一部分比例是兒童,不像手機用戶以成人為主。兒童和成人的聲音有明顯差異,導致兒童的語音識別率偏低。
然后,聽歌看片時因為有大量英文歌曲和人名,用戶說話會有中英夾雜的情況。比起純中文來說,中英夾雜的語音識別率更低。
以上都會對智能家居產品帶來語音識別上的困難。解決這些困難,背后需要更有針對性的大量語音數據來供計算機學習。