智能家居市場 語音識別這一密鑰何時才能被激活?
說到智能語音就不能不提智能家居。在當下的智能家居行業,語音基于其交互的自然性,被認為是未來人與家居交互的主要入口路徑,以致業內普遍認為,“以語音為入口連接各種服務,構建智家生態”。
作為人工智能應用最成熟的技術之一,目前語音交互的核心環節也取得重大突破,語音識別環節突破了單點能力,從遠場識別,到語音分析和語義理解有了重大突破,呈現一種整體的交互方案。自動語音識別(ASR)和前端語音處理的最新發展已使得語音控制相當成熟和有效。ASR引擎可以理解多種語言和口音,而語音生物辨識可用于辨識系統中預先登錄的特定用戶,以在智能家居環境中提供不同的權限。
不過,雖然大多數家居可以用語音開啟導航,進行信息查詢,實現一些諸如空調、開燈等功能控制,但距離“以語音為入口連接各種服務,構建智家生態”的理想仍然較遠。目前的技術仍然限制在5公尺的范圍內,并且難以在多人同時交談或吵雜的環境中操作。
影響語音控制技術進入到智能家居或其他應用領域的原因很多,包括使用者的習慣是否被建立、是否提供更多“控制”功能以外的附加價值、是否有更“特別”的應用出現,以及安全性的問題。其中,安全性可說是消費者最為關注的部分。
就像著名電影《蜘蛛俠》中的那句臺詞:“力量越大,責任越重。”語音識別能量越大,就越需要安全閥門。首先是聲紋的采集。不管是人工識別,還是依靠深度學習算法進行自動化識別,聲紋庫的建立都是進行一切行動的前提。當前,公安的聲紋鑒別庫最全,但如果是企業要想研究聲紋識別,從公安處入手顯然不可能,因而,企業智能自行收集聲紋并建立聲紋庫,這是一項十分艱巨的任務。更重要的是,企業還要注意如何保障聲紋不被非法利用。
其次,我們都聽說過“無用輸入,無用輸出”的說法,但你想過這句話同樣適用于負責業務的語音識別嗎?企業是否有建立污染數據安全策略(它能確保攻擊者不會利用篡改過的數據欺騙人工智能并讓它推薦錯誤的決策)嗎? 如果設備根據錯誤的數據做出了錯誤的決策,那么,企業需要多長時間才能發現?數據污染已經是網絡安全世界中的一個關注點。 例如,反惡意軟件根據多重來源提交的標記和樣本進行工作,而反惡意軟件供應商必須保持警惕,防止攻擊者愚弄這一系統。
盡管如此,與其他生物特征相比,聲紋識別的應用仍然具有特殊優勢,比如聲紋提取可在不知不覺中完成,因此使用者的接受程度也相對較高目前,聲紋識別在全球市場中的占有率達到15.8%,僅次于指紋和掌紋識別,并呈現出不斷上升的趨勢,因此,我們有理由相信,聲紋識別或將成為語音交互的下一個風口。
結語:在今天這個快節奏的社會中,語音識別技術的誕生,可以說是一次偉大的技術變革。隨著高質量數據的不斷積累、技術的不斷突破及硬件平臺算力的提升,語音識別正在向我們期待的方向快速發展。