通過利用機器學習技術進行自然語言的的深度理解,一直是工業和學術界關注的焦點。在人工智能的各項領域中,自然語言處理是最為成熟的技術,由此引來各大企業紛紛進軍布局。在未來3年內,成熟化的語音產品將通過云平臺和智能硬件平臺快速實現商業化部署,前景十分廣闊。
目前,語音交互賽道已匯集了互聯網巨頭、知名硬件企業、電商平臺、傳統家電廠商以及各類人工智能初創公司,特別是近幾年以智能音箱為代表的語音交互產品在國內外的火爆,極大地激發了語音交互技術的應用和發展。
語音識別應用領域不斷擴展
在汽車及互聯網領域,語音交互功能已經很普及。福特的SYNC系統專為手機和數字媒體播放器配備的福特車載多媒體通信娛樂系統,是目前車載系統中采用語音交互技術的成功的案例,已經廣泛應用在福特多個系列汽車中?;ヂ摼W巨頭蘋果在其iPhone 4S中推出智能語音助理應用Siri后,Google公司也在其安卓智能手機操作系統中推出了GoogleNow智能語音搜索及問答服務,微軟公司也將語音技術應用于WindowsPhone。
在智能家居領域,不管是智能家電還是機器人,語音識別技術都是必備的基本功能之一。在控制方式上,除了部分智能家電之外,語音控制已經成為了市場的主流,而這就是語音識別市場的商機。未來,作為人機自然交互的前提之一,語音識別必然是智能家居的發展趨勢,只有語音識別的準確率接近完美,人機的自然交互才能繼續開展。在智能家居市場的推動下,語音識別技術必將成為重點發展對象。
此外,在新零售領域,智能語音技術的應用也在不斷擴展。比如2017年12月18日,科大訊飛和紅星美凱龍發布戰略合作計劃,未來由科大訊飛研發的智能導購機器人“美美”將在全國紅星美凱龍門店上市。
時至今日,資本的涌入、政策的扶持、市場的一再擴容,使得語音技術日益成熟,全球語音市場也迎來了一個應用落地的黃金發展期。根據相關統計數據顯示,2016年智能語音產業規模直逼60億元大關,2017年將破百億,同比增長69%左右。
語音識別技術突破總是艱難而緩慢
盡管技術趨向成熟,但在實際應用中語音識別技術仍存在著這樣那樣的問題,這些短板時刻阻礙著語音技術的進一步發展與落地。在實際應用中,識別率主要受到以下幾個因素的影響:
對于漢語語音識別,方言或口音會降低識別率;
背景噪聲。公共場所的強噪聲對識別效果影響甚大,即使是在實驗室環境下,敲擊鍵盤、移動麥克風都會成為背景噪聲;
“口語”問題。它既涉及到自然語言理解,又與聲學有關。語音識別技術的最終目的是要讓用戶在“人機對話”時,能夠像進行“人與人對話”一樣自然,而一旦用戶以跟人交談的方式進行語音輸入時,口語的語法不規范和語序不正常的特點會給語義的分析和理解帶來困難。
此外,識別率還與說話人的性別、說話時間長短等有關。
科技巨頭重磅加碼
在國際巨頭紛紛布局智能語音市場時,中國制造企業也正在蠢蠢欲動。中國企業擁有完善的硬件產業鏈,而這些行業智慧化升級的訴求愈發強烈。以科大訊飛、BAT為首的互聯網巨頭都蓄謀已久,瞄準這個風口,加速布局智能開放平臺,提升產品的競爭力。
2017年,百度AI開發者大會上,百度發布DuerOS對話式人工智能系統,搭載DuerOS的設備可讓用戶以自然語言對話的方式進行人機交互;同天下午,阿里人工智能實驗室召開了新品發布會,發布第一款智能音箱產品天貓精靈 X1,這款音箱內置智能語音助手AliGenie,能夠聽懂中文普通話語音指令,并實現智能家居控制、語音購物、手機充值、音樂播放等功能。
2018年5月3日,從阿里巴巴獲悉,由于阿里對北京先聲互聯科技有限公司(以下簡稱“先聲互聯”)的全資收購,先聲互聯創始人、中科院聲學所前研究員付強博士,近日入職阿里達摩院機器智能技術實驗室,負責語音交互前端處理技術和方案的研發。
結語
毫無疑問,語音智能應用正在飛速發展。在過去的一年里有了極大的發展,從算法到模型都有了質的變化,在加上語音領域(語音合成等)的其他研究,語音技術陸續進入工業、家庭機器人、通信、車載導航等各個領域中。當有一天,機器能夠真正“理解”人類語言,并作出回應,那時我們必將迎來一個嶄新的時代。