語(yǔ)音對(duì)于人機(jī)交互的重要性毋庸置疑,自IBM的Shoebox與Worlds of Wonders的Julie Doll問(wèn)世以來(lái),語(yǔ)音識(shí)別技術(shù)已經(jīng)取得了長(zhǎng)足進(jìn)步。無(wú)論是國(guó)內(nèi)外企業(yè),都在語(yǔ)音識(shí)別的速度、準(zhǔn)確度以及多語(yǔ)種方面持續(xù)創(chuàng)新。例如,微軟呼叫中心解決方案(智能語(yǔ)音客服)比人工展開(kāi)的呼叫服務(wù)更準(zhǔn)確,更高效;我國(guó)目前已實(shí)現(xiàn)巨大的技術(shù)突破,處于國(guó)際領(lǐng)先水平,例如百度、科大訊飛等公司語(yǔ)音識(shí)別率已突破97%。
隨著技術(shù)不斷發(fā)展突破,語(yǔ)音識(shí)別在國(guó)內(nèi)外市場(chǎng)將獲得更大發(fā)展空間。拓墣產(chǎn)業(yè)研究院研究指出,全球語(yǔ)音辨識(shí)產(chǎn)值將呈現(xiàn)高速成長(zhǎng),自 2016 年的 26.13 億美元,至 2021 年成長(zhǎng)為 159.79 億美元,年復(fù)合成長(zhǎng)率達(dá) 43.64%;國(guó)內(nèi)市場(chǎng)方面,據(jù)前瞻產(chǎn)業(yè)研究院預(yù)計(jì),到2021年,中國(guó)生物識(shí)別行業(yè)的市場(chǎng)規(guī)模將突破340億元,其中語(yǔ)音識(shí)別占比將達(dá)到22.4%。
因此,語(yǔ)音識(shí)別可以說(shuō)是生物識(shí)別領(lǐng)域中技術(shù)較成熟、商業(yè)化程度較高的細(xì)分領(lǐng)域之一,語(yǔ)音識(shí)別技術(shù)憑借成本與算法復(fù)雜程度低,采集方便等優(yōu)勢(shì),在許多行業(yè)得到了應(yīng)用。人工智能時(shí)代的語(yǔ)音識(shí)別技術(shù)也給安防行業(yè)帶來(lái)了“新鮮血液”。
在監(jiān)控領(lǐng)域,隨著平安城市項(xiàng)目建設(shè)的推進(jìn),音頻監(jiān)控在城市安防系統(tǒng)中的應(yīng)用越來(lái)越多。音頻監(jiān)控作為安防行業(yè)近年來(lái)迅速發(fā)展的一個(gè)分支,目前已展現(xiàn)出前所未有的勃勃生機(jī),人們開(kāi)始從能夠看見(jiàn)和聽(tīng)見(jiàn)的需求轉(zhuǎn)向?qū)で蟾哔|(zhì)量的音視頻監(jiān)控。例如,公檢法機(jī)構(gòu)、機(jī)場(chǎng)、鐵路、銀行等領(lǐng)域的安防工程需要清晰、逼真的影音同步監(jiān)控系統(tǒng),以彌補(bǔ)視頻監(jiān)控的不足,音頻監(jiān)控的加入就使得監(jiān)控不再只是上演“無(wú)聲電影”,工作人員通過(guò)音頻監(jiān)控設(shè)備“聽(tīng)懂”周圍環(huán)境,對(duì)危險(xiǎn)事件和意外事件進(jìn)行安全防范。搭載語(yǔ)音識(shí)別技術(shù)的音頻監(jiān)控已經(jīng)成為安防行業(yè)的新亮點(diǎn)。
此外,安全部門也能夠通過(guò)語(yǔ)音識(shí)別技術(shù)對(duì)違法行為進(jìn)行打擊。例如處理電話追蹤、違法交易的電話截獲等,根據(jù)這種通過(guò)聲音識(shí)別的方式,對(duì)所受到的情報(bào)進(jìn)行一一劃分,從而汲取有效信息。
將來(lái),隨著技術(shù)的不斷深入,語(yǔ)音識(shí)別技術(shù)也將拓展出更多細(xì)分應(yīng)用場(chǎng)景。
結(jié)語(yǔ):隨著技術(shù)的成熟,語(yǔ)音交互幾乎已經(jīng)成為各類智能助理、智能攝像頭等產(chǎn)品的標(biāo)配,對(duì)于從事語(yǔ)音識(shí)別的企業(yè)來(lái)說(shuō),商業(yè)化的成功主要取決于技術(shù)成熟度和用戶基礎(chǔ)兩大因素。如果考慮到真實(shí)環(huán)境中的人機(jī)交互,語(yǔ)音識(shí)別企業(yè)要做的可能還有很多。