精品国产一级在线观看,国产成人综合久久精品亚洲,免费一级欧美大片在线观看

當(dāng)前位置:智慧城市產(chǎn)品技術(shù) → 正文

聲紋識(shí)別進(jìn)入落地階段技術(shù)仍有發(fā)展空間

責(zé)任編輯:cres 作者:張晟寧 |來源:企業(yè)網(wǎng)D1Net  2021-01-06 16:34:30 本文摘自:億歐網(wǎng)

2020年受疫情影響,消費(fèi)者需求向線上傾斜,智能客服需求量也隨之增加。因此,盡管疫情影響下中國(guó)經(jīng)濟(jì)下行,但人工智能尤其智能語音行業(yè)市場(chǎng)整體利好。激增的市場(chǎng)消費(fèi)者群體,一方面帶來了多元化的市場(chǎng)需求,另一方面,促使技術(shù)服務(wù)商不斷探索新的產(chǎn)品功能和應(yīng)用場(chǎng)景。近年來,許多智能語音技術(shù)服務(wù)商開始布局聲紋識(shí)別領(lǐng)域。隨著技術(shù)成熟與商業(yè)化落地,聲紋識(shí)別逐漸進(jìn)入大眾視野。
 
一、聲紋識(shí)別技術(shù)
 
聲紋識(shí)別是生物識(shí)別技術(shù)的一種,也是語音技術(shù)的分支,也被稱為說話人識(shí)別,包含聲紋注冊(cè)和聲紋認(rèn)證兩道程序。所謂聲紋識(shí)別就是把聲信號(hào)轉(zhuǎn)換成電信號(hào),提取特征、搭建模型,根據(jù)匹配度進(jìn)行識(shí)別判斷。
 
聲紋識(shí)別VS語音識(shí)別
 
聲紋識(shí)別相比于語音識(shí)別,近年來才逐漸進(jìn)入大眾視野,兩者同為語音前端信號(hào)處理,經(jīng)常被放在一起比較。而談及兩者的共性及區(qū)別時(shí),快商通聯(lián)合創(chuàng)始人李稀敏博士在接受億歐智庫采訪時(shí)表示:“聲紋的載體是語音,而所謂語音就是指人說的話。在人類正常的語音交互中,我們可以識(shí)別語音主體的意圖、情緒、性別、身份以及內(nèi)容等信息。而利用人工智能技術(shù)完成這一識(shí)別,則需要依靠語音及聲紋的提取與處理。語音識(shí)別和聲紋識(shí)別雖然在智能語音技術(shù)流程中都屬于對(duì)語音信號(hào)的處理,但實(shí)際的技術(shù)方向及應(yīng)用卻截然相反。”
 
“語音識(shí)別追求的是聲音的共性”,李稀敏博士表示。也就是針對(duì)不同個(gè)體對(duì)于同一句話的不同聲音、口音、語速表達(dá),可以翻譯成同樣的文字。比如在使用智能音箱時(shí),對(duì)于同樣的指令,無論發(fā)出這個(gè)指令的個(gè)體是男是女,南方抑或是北方口音,智能音箱都需要能夠?qū)φZ音輸入提取共性,并作出準(zhǔn)確的一致的應(yīng)答。
 
與之相比,“聲紋識(shí)別則追求聲音的個(gè)性”,即針對(duì)同一個(gè)體在不同情境下的不同表達(dá),可以認(rèn)證聲源來自同一個(gè)體。比如微信的語音登陸系統(tǒng),有時(shí)因外部環(huán)境,身體狀態(tài)等因素,說話人的語音輸入會(huì)出現(xiàn)語速,音高等變化,而一個(gè)完善的聲紋識(shí)別系統(tǒng),則需要能夠提取不同情境下語音輸入信號(hào)的個(gè)性,并準(zhǔn)確認(rèn)證說話人的身份以完成登陸。
 
聲紋辨認(rèn)VS聲紋確認(rèn)
 
聲紋識(shí)別主要有兩大應(yīng)用場(chǎng)景,聲紋辨認(rèn)和聲紋確認(rèn),其中:
 
聲紋辨認(rèn),也被稱作1:N識(shí)別,主要應(yīng)用于在語音庫范圍內(nèi)的語音篩查,即在海量聲紋數(shù)據(jù)庫中找到說話人的過程。比如,金融語音銷售場(chǎng)景下,可以迅速根據(jù)來訪者聲紋信息與自身聲紋數(shù)據(jù)庫對(duì)比,判斷客戶是否為初次購買,抑或是否在征信黑名單中,從而調(diào)整銷售策略。
 
聲紋確認(rèn),也稱1:1驗(yàn)證,主要應(yīng)用于安全訪問驗(yàn)證及身份認(rèn)證等場(chǎng)景,系統(tǒng)對(duì)說話人進(jìn)行語音認(rèn)證,完成”你是不是你”的身份判斷。相比起聲紋辨認(rèn),聲紋確認(rèn)對(duì)于語音輸入信息的質(zhì)量要求更為嚴(yán)苛,比如微信的語音登錄功能會(huì)要求使用者在無嘈雜環(huán)境中對(duì)固定文本進(jìn)行語音輸入。
 
聲紋識(shí)別進(jìn)入落地階段,技術(shù)仍有發(fā)展空間
 
談及聲紋識(shí)別技術(shù)成熟度,李稀敏博士表示:“聲紋識(shí)別擁有數(shù)十年的研究歷史,但由于技術(shù)的局限,近年來才逐漸進(jìn)入應(yīng)用落地階段,技術(shù)成熟度相當(dāng)于3年前的語音識(shí)別。”
 
因此語音識(shí)別所面臨的絕大部分技術(shù)痛點(diǎn),也同樣影響著聲紋的發(fā)展。因聲源采樣率、信噪比、信道、語音時(shí)長(zhǎng)、文本內(nèi)容等因素變化而造成的準(zhǔn)確率變化明顯。因此提升聲紋識(shí)別系統(tǒng)的魯棒性是聲紋識(shí)別大規(guī)模落地應(yīng)用的前提條件。
 
深入金融安防領(lǐng)域,多元語音技術(shù)融合助力場(chǎng)景落地
 
由于聲紋識(shí)別系統(tǒng)的特殊性,在進(jìn)行識(shí)別前,需要進(jìn)行聲紋注冊(cè),因而聲紋識(shí)別的應(yīng)用對(duì)于數(shù)據(jù)庫有著較強(qiáng)的依賴。另一方面,前文提到的聲紋識(shí)別技術(shù)的不成熟,也導(dǎo)致其使用體驗(yàn)無法達(dá)到預(yù)期效果。因此數(shù)據(jù)的缺乏以及技術(shù)的痛點(diǎn)導(dǎo)致聲紋識(shí)別與行業(yè)融合程度較淺,也成為聲紋識(shí)別落地傳統(tǒng)行業(yè)的主要障礙。
 
李稀敏博士表示,現(xiàn)階段聲紋識(shí)別主要應(yīng)用在公安、司法以及金融領(lǐng)域。主要是因?yàn)槁暭y識(shí)別直接的解決了這些行業(yè)的痛點(diǎn),應(yīng)用價(jià)值大,因而在行業(yè)的資本投入下,聲紋識(shí)別的行業(yè)落地獲得了快速發(fā)展。
 
除金融安防領(lǐng)域外,現(xiàn)階段聲紋識(shí)別在民生場(chǎng)景中的應(yīng)用還處于初期試水階段,如家居車載中聲紋判定系統(tǒng),硬件中的聲紋門禁等等。
 
智能語音技術(shù)的全面發(fā)展,以及智能設(shè)備的爆發(fā)式增長(zhǎng),為聲紋識(shí)別提供了更多的應(yīng)用端口,而與多元語音技術(shù)的融合也成為聲紋識(shí)別落地更多行業(yè)場(chǎng)景提供了技術(shù)保障。在未來聲紋識(shí)別將向著聲紋+智能,以及多模態(tài)識(shí)別的方向發(fā)展。
 
二、聲紋識(shí)別市場(chǎng)
 
應(yīng)用前景廣闊
 
相比為人所熟知的指紋識(shí)別、人臉識(shí)別,聲紋識(shí)別作為生物識(shí)別的另一個(gè)主要的分支,雖然剛剛從實(shí)驗(yàn)室走出進(jìn)入大眾視野,但卻擁有較強(qiáng)的適用性和較大的應(yīng)用空間。根據(jù)快商通提供的信息整理,首先,聲紋識(shí)別具有更高的采集便捷性,用戶接受度更高,被采集者無需接觸傳感器或面對(duì)鏡頭,即可完成識(shí)別。在疫情所帶來的新需求下,聲紋識(shí)別擁有極大的落地空間。
 
與此同時(shí),聲紋識(shí)別在1:1驗(yàn)證應(yīng)用下的準(zhǔn)確率高,并因聲紋的穩(wěn)定性,造假難度較高,是理想的生物識(shí)別模式。此外聲紋傳感器相對(duì)低廉的造價(jià)及部署成本也使得聲紋識(shí)別擁有可被廣泛應(yīng)用的優(yōu)勢(shì)。
 
聲紋技術(shù)難盈利,技術(shù)服務(wù)商何去何從?
 
現(xiàn)階段聲紋識(shí)別賽道的服務(wù)商普遍處于虧損狀態(tài),而剖析這一現(xiàn)象,需要從利潤(rùn)和成本兩個(gè)方向進(jìn)行考慮。
 
聲紋技術(shù)和行業(yè)早期磨合階段,滲透率較低
 
聲智科技戰(zhàn)略合伙人&COO李智勇首先表示:“聲紋識(shí)別作為一種新的技術(shù),雖然提供了更多的可能性,但是必須要和行業(yè)進(jìn)行進(jìn)一步的深度結(jié)合。然而在技術(shù)落地早期階段的磨合試探過程中,通常不會(huì)很通暢,這也導(dǎo)致了現(xiàn)階段的聲紋識(shí)別應(yīng)用勢(shì)必?zé)o法深度滲透行業(yè)。”
 
李稀敏博士也有類似的觀點(diǎn),他認(rèn)為在聲紋產(chǎn)品在沒有深度結(jié)合產(chǎn)業(yè)的情況下,產(chǎn)品過于單一,盈利的可能性很小。而另一方面聲紋技術(shù)仍不成熟,在無法達(dá)到預(yù)期使用期望的情況下,簽單量及簽單價(jià)都不理想。
 
技術(shù)紅利下,企業(yè)不斷增加研發(fā)成本
 
在投入成本方面,李智勇表示:“目前國(guó)內(nèi)企業(yè)正第一次主要進(jìn)行原創(chuàng)的技術(shù)研發(fā),技術(shù)研發(fā)本身所投入的成本相比于產(chǎn)品公司更高。此外,在技術(shù)紅利驅(qū)使下,企業(yè)也紛紛將大量的人力物力投入到科研研發(fā)中,以期望技術(shù)所帶來的未來的巨大利潤(rùn)空間。”
 
據(jù)億歐智庫調(diào)查統(tǒng)計(jì),現(xiàn)階段大部分聲紋技術(shù)服務(wù)商的研發(fā)人員占比均在50%以上,與此同時(shí),國(guó)內(nèi)相關(guān)專利公開數(shù)量也不斷提升,技術(shù)研發(fā)已然成為了服務(wù)商的發(fā)展重點(diǎn)。
 
厚積薄發(fā),多年沉淀等待破繭成蝶
 
綜合論述,較低的滲透率,及尚未成熟的技術(shù)體系導(dǎo)致聲紋識(shí)別營(yíng)收并不理想,另一方面技術(shù)紅利下,企業(yè)不斷加大自身研發(fā)成本。收支兩方面的因素導(dǎo)致現(xiàn)階段聲紋技術(shù)服務(wù)商的盈利十分艱難。然而這是一項(xiàng)新技術(shù)發(fā)展所需要經(jīng)歷的必然階段,新的技術(shù)勢(shì)必會(huì)引發(fā)新的產(chǎn)品和新的模式,而當(dāng)我們回顧2000年左右的互聯(lián)網(wǎng)市場(chǎng),會(huì)發(fā)現(xiàn)和現(xiàn)階段的語音市場(chǎng)相差無幾。整個(gè)語音市場(chǎng)是否會(huì)像互聯(lián)網(wǎng)市場(chǎng)一樣,成為一個(gè)時(shí)代的標(biāo)志,我們尚未可知,不過可以相信的是,在不久的將來,待語音技術(shù)成熟,和行業(yè)深度融合的那一天,聲紋識(shí)別業(yè)務(wù)一定會(huì)迎來屬于他們的春天。
 
聲紋市場(chǎng)風(fēng)口何時(shí)到來?
 
2017年,6月《中華人民共和國(guó)網(wǎng)絡(luò)安全法》正式施行,明確將個(gè)人生物識(shí)別信息納入個(gè)人信息范疇管理。同年12月,工信部引發(fā)《促進(jìn)新一代人工智能產(chǎn)業(yè)發(fā)展三年行動(dòng)計(jì)劃(2018-2020年)》,智能身份識(shí)別系統(tǒng)、智能語音交互系統(tǒng)被率先列入重點(diǎn)發(fā)展8大領(lǐng)域。直至2020年,相關(guān)政策紛紛出臺(tái),尤其是受年初疫情影響,無接觸,無感知的聲紋識(shí)別系統(tǒng)需求隨之增加。
 
市場(chǎng)方向,近年來全球生物識(shí)別產(chǎn)業(yè)規(guī)模不斷擴(kuò)大,聲紋識(shí)別的市場(chǎng)占比也逐年上升。而隨著技術(shù)的成熟以及在產(chǎn)業(yè)內(nèi)的不斷滲透,這一規(guī)模仍會(huì)繼續(xù)增加。市場(chǎng)參與者方向,綜合語音廠商,聲紋專業(yè)廠商,人工智能初創(chuàng)公司以及互聯(lián)網(wǎng)巨頭紛紛入駐聲紋賽道,并在各自細(xì)分領(lǐng)域不斷進(jìn)行行業(yè)融合,整體市場(chǎng)處于良性競(jìng)爭(zhēng)狀態(tài)。2016-2020年期間,聲紋識(shí)別賽道資本投資進(jìn)入加速階段,哪怕在2020年,資本市場(chǎng)整體遇冷情況下,賽道仍獲得多筆融資。
 
技術(shù)方向,李稀敏博士表示:“當(dāng)前聲紋學(xué)術(shù)領(lǐng)域,已經(jīng)在廣泛地使用最前沿的神經(jīng)網(wǎng)絡(luò)技術(shù),用于解決聲紋技術(shù)所存在的問題,比如人聲分離、遠(yuǎn)場(chǎng)識(shí)別、跨信道等。預(yù)計(jì)3年左右,這些問題將得到較好地解決,在通過一段時(shí)間的實(shí)踐,算法和工程化都將得到驗(yàn)證。總而言之,5年以內(nèi),風(fēng)口將來。”
 
綜合論述,盡管現(xiàn)階段聲紋識(shí)別的應(yīng)用仍具有局限性,但是聲紋主導(dǎo)的生物識(shí)別模式已經(jīng)進(jìn)入公眾視野,并被時(shí)代所接受。相信在未來,人臉識(shí)別大熱過后,聲紋識(shí)別一定能迎來屬于他的風(fēng)口。
 
三、聲紋識(shí)別市場(chǎng)參與者
 
企業(yè)不斷入局聲紋賽道,原因?yàn)楹危?/div>
 
近年來加入聲紋賽道的企業(yè)越來越多,包括騰訊、百度、字節(jié)跳動(dòng)、平安科技等,創(chuàng)業(yè)者也不斷入局,究其原因,我們可以從以下幾個(gè)視角進(jìn)行思考。
 
1.技術(shù)視角
 
李稀敏博士表示:“2011年前后神經(jīng)網(wǎng)絡(luò)技術(shù)在人臉識(shí)別和語音識(shí)別領(lǐng)域的廣泛應(yīng)用,帶動(dòng)了神經(jīng)網(wǎng)絡(luò)技術(shù)在聲紋技術(shù)領(lǐng)域的探索,直至2018年前后達(dá)到了一個(gè)高潮,各種算法層出不窮。所以,這個(gè)階段加入聲紋賽道,有其技術(shù)方面的因素。”在另一方面,李智勇也指出,在原創(chuàng)技術(shù)的推動(dòng)下,聲紋識(shí)別所帶來的技術(shù)紅利也是企業(yè)入局的促進(jìn)因素。
 
2.市場(chǎng)視角
 
在語音研發(fā)的道路上,服務(wù)商們逐漸發(fā)現(xiàn)了聲紋的重要性,以及潛在的市場(chǎng)需求,因而逐漸向聲紋技術(shù)發(fā)展。而隨著聲紋技術(shù)在金融、安全領(lǐng)域的探索應(yīng)用,身份認(rèn)證及聲紋反欺詐應(yīng)用不斷成熟,并引發(fā)了行業(yè)的廣泛關(guān)注。以金融、安全為引,聲紋市場(chǎng)逐漸向其他行業(yè)落地拓展,市場(chǎng)規(guī)模增長(zhǎng)的情況下,企業(yè)紛紛入局聲紋賽道。
 
3.政策視角
 
生物識(shí)別政策頻出,2018年,央行正式發(fā)布《移動(dòng)金融基于聲紋識(shí)別的安全應(yīng)用技術(shù)規(guī)范》,加深了聲紋識(shí)別在金融行業(yè)的應(yīng)用落地,大批聲紋服務(wù)商涌現(xiàn)。
 
聲紋識(shí)別服務(wù)商分類及布局
 
受市場(chǎng)、戰(zhàn)略以及技術(shù)的影響,聲紋識(shí)別技術(shù)服務(wù)商呈現(xiàn)出了多元化的趨勢(shì),業(yè)務(wù)模式、產(chǎn)品形態(tài)以及用戶群體都展現(xiàn)出了較大的差異化。現(xiàn)階段聲紋識(shí)別的市場(chǎng)參與者主要有四類,分別為綜合語音技術(shù)服務(wù)商、人工智能初創(chuàng)公司、深耕聲紋的技術(shù)服務(wù)商以及互聯(lián)網(wǎng)巨頭。
 
1.綜合語音技術(shù)服務(wù)商
 
多為傳統(tǒng)語音服務(wù)商,普遍成立于2000年左右,擁有較為成熟的技術(shù)支持及產(chǎn)品體系。整體業(yè)務(wù)以融合了多元語音技術(shù)的通用解決方案為主,客戶群體以大型客戶為主。聲紋識(shí)別作為語音的技術(shù)分支,更多作為定制化選項(xiàng)搭配語音方案進(jìn)行輸出。企業(yè)戰(zhàn)略本身就是平臺(tái)+賽道,也就是將其自身的AI平臺(tái),落地到各種賽道。典型的綜合語音技術(shù)服務(wù)商為科大訊飛,捷通華聲等。
 
2.深耕聲紋的技術(shù)服務(wù)商
 
在傳統(tǒng)語音技術(shù)服務(wù)商進(jìn)入市場(chǎng)后,一部分專注與語音細(xì)分賽道的企業(yè)相繼出現(xiàn),以得意音通、遠(yuǎn)鑒科技為代表的深耕聲紋識(shí)別的服務(wù)商進(jìn)入市場(chǎng)。整體業(yè)務(wù)以聲紋識(shí)別產(chǎn)品及方案為主,相比起綜合語音技術(shù)服務(wù)商,更加聚焦行業(yè)的特定需求,并專注于聲紋技術(shù)的落地,探索各類潛在的應(yīng)用場(chǎng)景。
 
3.人工智能初創(chuàng)公司
 
2010年開始,專注于特定行業(yè)的人工智能初創(chuàng)公司陸續(xù)進(jìn)入市場(chǎng)。因聚焦行業(yè),因此在行業(yè)圖譜及數(shù)據(jù)庫搭建上具備更大的優(yōu)勢(shì)。整體業(yè)務(wù)以特定行業(yè)的SaaS服務(wù)及落地方案為主,在行業(yè)的基礎(chǔ)上應(yīng)用聲紋技術(shù),更加深入行業(yè)需求,主要面向中小企業(yè)。典型的代表企業(yè)為快商通,聲智科技等。
 
4.互聯(lián)網(wǎng)巨頭公司
 
近年來互聯(lián)網(wǎng)巨頭公司紛紛開始布局聲紋賽道,依托自身云服務(wù)優(yōu)勢(shì)及龐大C端客戶流量進(jìn)入市場(chǎng)。業(yè)務(wù)布局較廣,擁有較大的潛在用戶群體。典型的互聯(lián)網(wǎng)巨頭為阿里云、騰訊云、百度智能云及華為云。

關(guān)鍵字:安防聲紋識(shí)別

本文摘自:億歐網(wǎng)

x 聲紋識(shí)別進(jìn)入落地階段技術(shù)仍有發(fā)展空間 掃一掃
分享本文到朋友圈
當(dāng)前位置:智慧城市產(chǎn)品技術(shù) → 正文

聲紋識(shí)別進(jìn)入落地階段技術(shù)仍有發(fā)展空間

責(zé)任編輯:cres 作者:張晟寧 |來源:企業(yè)網(wǎng)D1Net  2021-01-06 16:34:30 本文摘自:億歐網(wǎng)

2020年受疫情影響,消費(fèi)者需求向線上傾斜,智能客服需求量也隨之增加。因此,盡管疫情影響下中國(guó)經(jīng)濟(jì)下行,但人工智能尤其智能語音行業(yè)市場(chǎng)整體利好。激增的市場(chǎng)消費(fèi)者群體,一方面帶來了多元化的市場(chǎng)需求,另一方面,促使技術(shù)服務(wù)商不斷探索新的產(chǎn)品功能和應(yīng)用場(chǎng)景。近年來,許多智能語音技術(shù)服務(wù)商開始布局聲紋識(shí)別領(lǐng)域。隨著技術(shù)成熟與商業(yè)化落地,聲紋識(shí)別逐漸進(jìn)入大眾視野。
 
一、聲紋識(shí)別技術(shù)
 
聲紋識(shí)別是生物識(shí)別技術(shù)的一種,也是語音技術(shù)的分支,也被稱為說話人識(shí)別,包含聲紋注冊(cè)和聲紋認(rèn)證兩道程序。所謂聲紋識(shí)別就是把聲信號(hào)轉(zhuǎn)換成電信號(hào),提取特征、搭建模型,根據(jù)匹配度進(jìn)行識(shí)別判斷。
 
聲紋識(shí)別VS語音識(shí)別
 
聲紋識(shí)別相比于語音識(shí)別,近年來才逐漸進(jìn)入大眾視野,兩者同為語音前端信號(hào)處理,經(jīng)常被放在一起比較。而談及兩者的共性及區(qū)別時(shí),快商通聯(lián)合創(chuàng)始人李稀敏博士在接受億歐智庫采訪時(shí)表示:“聲紋的載體是語音,而所謂語音就是指人說的話。在人類正常的語音交互中,我們可以識(shí)別語音主體的意圖、情緒、性別、身份以及內(nèi)容等信息。而利用人工智能技術(shù)完成這一識(shí)別,則需要依靠語音及聲紋的提取與處理。語音識(shí)別和聲紋識(shí)別雖然在智能語音技術(shù)流程中都屬于對(duì)語音信號(hào)的處理,但實(shí)際的技術(shù)方向及應(yīng)用卻截然相反。”
 
“語音識(shí)別追求的是聲音的共性”,李稀敏博士表示。也就是針對(duì)不同個(gè)體對(duì)于同一句話的不同聲音、口音、語速表達(dá),可以翻譯成同樣的文字。比如在使用智能音箱時(shí),對(duì)于同樣的指令,無論發(fā)出這個(gè)指令的個(gè)體是男是女,南方抑或是北方口音,智能音箱都需要能夠?qū)φZ音輸入提取共性,并作出準(zhǔn)確的一致的應(yīng)答。
 
與之相比,“聲紋識(shí)別則追求聲音的個(gè)性”,即針對(duì)同一個(gè)體在不同情境下的不同表達(dá),可以認(rèn)證聲源來自同一個(gè)體。比如微信的語音登陸系統(tǒng),有時(shí)因外部環(huán)境,身體狀態(tài)等因素,說話人的語音輸入會(huì)出現(xiàn)語速,音高等變化,而一個(gè)完善的聲紋識(shí)別系統(tǒng),則需要能夠提取不同情境下語音輸入信號(hào)的個(gè)性,并準(zhǔn)確認(rèn)證說話人的身份以完成登陸。
 
聲紋辨認(rèn)VS聲紋確認(rèn)
 
聲紋識(shí)別主要有兩大應(yīng)用場(chǎng)景,聲紋辨認(rèn)和聲紋確認(rèn),其中:
 
聲紋辨認(rèn),也被稱作1:N識(shí)別,主要應(yīng)用于在語音庫范圍內(nèi)的語音篩查,即在海量聲紋數(shù)據(jù)庫中找到說話人的過程。比如,金融語音銷售場(chǎng)景下,可以迅速根據(jù)來訪者聲紋信息與自身聲紋數(shù)據(jù)庫對(duì)比,判斷客戶是否為初次購買,抑或是否在征信黑名單中,從而調(diào)整銷售策略。
 
聲紋確認(rèn),也稱1:1驗(yàn)證,主要應(yīng)用于安全訪問驗(yàn)證及身份認(rèn)證等場(chǎng)景,系統(tǒng)對(duì)說話人進(jìn)行語音認(rèn)證,完成”你是不是你”的身份判斷。相比起聲紋辨認(rèn),聲紋確認(rèn)對(duì)于語音輸入信息的質(zhì)量要求更為嚴(yán)苛,比如微信的語音登錄功能會(huì)要求使用者在無嘈雜環(huán)境中對(duì)固定文本進(jìn)行語音輸入。
 
聲紋識(shí)別進(jìn)入落地階段,技術(shù)仍有發(fā)展空間
 
談及聲紋識(shí)別技術(shù)成熟度,李稀敏博士表示:“聲紋識(shí)別擁有數(shù)十年的研究歷史,但由于技術(shù)的局限,近年來才逐漸進(jìn)入應(yīng)用落地階段,技術(shù)成熟度相當(dāng)于3年前的語音識(shí)別。”
 
因此語音識(shí)別所面臨的絕大部分技術(shù)痛點(diǎn),也同樣影響著聲紋的發(fā)展。因聲源采樣率、信噪比、信道、語音時(shí)長(zhǎng)、文本內(nèi)容等因素變化而造成的準(zhǔn)確率變化明顯。因此提升聲紋識(shí)別系統(tǒng)的魯棒性是聲紋識(shí)別大規(guī)模落地應(yīng)用的前提條件。
 
深入金融安防領(lǐng)域,多元語音技術(shù)融合助力場(chǎng)景落地
 
由于聲紋識(shí)別系統(tǒng)的特殊性,在進(jìn)行識(shí)別前,需要進(jìn)行聲紋注冊(cè),因而聲紋識(shí)別的應(yīng)用對(duì)于數(shù)據(jù)庫有著較強(qiáng)的依賴。另一方面,前文提到的聲紋識(shí)別技術(shù)的不成熟,也導(dǎo)致其使用體驗(yàn)無法達(dá)到預(yù)期效果。因此數(shù)據(jù)的缺乏以及技術(shù)的痛點(diǎn)導(dǎo)致聲紋識(shí)別與行業(yè)融合程度較淺,也成為聲紋識(shí)別落地傳統(tǒng)行業(yè)的主要障礙。
 
李稀敏博士表示,現(xiàn)階段聲紋識(shí)別主要應(yīng)用在公安、司法以及金融領(lǐng)域。主要是因?yàn)槁暭y識(shí)別直接的解決了這些行業(yè)的痛點(diǎn),應(yīng)用價(jià)值大,因而在行業(yè)的資本投入下,聲紋識(shí)別的行業(yè)落地獲得了快速發(fā)展。
 
除金融安防領(lǐng)域外,現(xiàn)階段聲紋識(shí)別在民生場(chǎng)景中的應(yīng)用還處于初期試水階段,如家居車載中聲紋判定系統(tǒng),硬件中的聲紋門禁等等。
 
智能語音技術(shù)的全面發(fā)展,以及智能設(shè)備的爆發(fā)式增長(zhǎng),為聲紋識(shí)別提供了更多的應(yīng)用端口,而與多元語音技術(shù)的融合也成為聲紋識(shí)別落地更多行業(yè)場(chǎng)景提供了技術(shù)保障。在未來聲紋識(shí)別將向著聲紋+智能,以及多模態(tài)識(shí)別的方向發(fā)展。
 
二、聲紋識(shí)別市場(chǎng)
 
應(yīng)用前景廣闊
 
相比為人所熟知的指紋識(shí)別、人臉識(shí)別,聲紋識(shí)別作為生物識(shí)別的另一個(gè)主要的分支,雖然剛剛從實(shí)驗(yàn)室走出進(jìn)入大眾視野,但卻擁有較強(qiáng)的適用性和較大的應(yīng)用空間。根據(jù)快商通提供的信息整理,首先,聲紋識(shí)別具有更高的采集便捷性,用戶接受度更高,被采集者無需接觸傳感器或面對(duì)鏡頭,即可完成識(shí)別。在疫情所帶來的新需求下,聲紋識(shí)別擁有極大的落地空間。
 
與此同時(shí),聲紋識(shí)別在1:1驗(yàn)證應(yīng)用下的準(zhǔn)確率高,并因聲紋的穩(wěn)定性,造假難度較高,是理想的生物識(shí)別模式。此外聲紋傳感器相對(duì)低廉的造價(jià)及部署成本也使得聲紋識(shí)別擁有可被廣泛應(yīng)用的優(yōu)勢(shì)。
 
聲紋技術(shù)難盈利,技術(shù)服務(wù)商何去何從?
 
現(xiàn)階段聲紋識(shí)別賽道的服務(wù)商普遍處于虧損狀態(tài),而剖析這一現(xiàn)象,需要從利潤(rùn)和成本兩個(gè)方向進(jìn)行考慮。
 
聲紋技術(shù)和行業(yè)早期磨合階段,滲透率較低
 
聲智科技戰(zhàn)略合伙人&COO李智勇首先表示:“聲紋識(shí)別作為一種新的技術(shù),雖然提供了更多的可能性,但是必須要和行業(yè)進(jìn)行進(jìn)一步的深度結(jié)合。然而在技術(shù)落地早期階段的磨合試探過程中,通常不會(huì)很通暢,這也導(dǎo)致了現(xiàn)階段的聲紋識(shí)別應(yīng)用勢(shì)必?zé)o法深度滲透行業(yè)。”
 
李稀敏博士也有類似的觀點(diǎn),他認(rèn)為在聲紋產(chǎn)品在沒有深度結(jié)合產(chǎn)業(yè)的情況下,產(chǎn)品過于單一,盈利的可能性很小。而另一方面聲紋技術(shù)仍不成熟,在無法達(dá)到預(yù)期使用期望的情況下,簽單量及簽單價(jià)都不理想。
 
技術(shù)紅利下,企業(yè)不斷增加研發(fā)成本
 
在投入成本方面,李智勇表示:“目前國(guó)內(nèi)企業(yè)正第一次主要進(jìn)行原創(chuàng)的技術(shù)研發(fā),技術(shù)研發(fā)本身所投入的成本相比于產(chǎn)品公司更高。此外,在技術(shù)紅利驅(qū)使下,企業(yè)也紛紛將大量的人力物力投入到科研研發(fā)中,以期望技術(shù)所帶來的未來的巨大利潤(rùn)空間。”
 
據(jù)億歐智庫調(diào)查統(tǒng)計(jì),現(xiàn)階段大部分聲紋技術(shù)服務(wù)商的研發(fā)人員占比均在50%以上,與此同時(shí),國(guó)內(nèi)相關(guān)專利公開數(shù)量也不斷提升,技術(shù)研發(fā)已然成為了服務(wù)商的發(fā)展重點(diǎn)。
 
厚積薄發(fā),多年沉淀等待破繭成蝶
 
綜合論述,較低的滲透率,及尚未成熟的技術(shù)體系導(dǎo)致聲紋識(shí)別營(yíng)收并不理想,另一方面技術(shù)紅利下,企業(yè)不斷加大自身研發(fā)成本。收支兩方面的因素導(dǎo)致現(xiàn)階段聲紋技術(shù)服務(wù)商的盈利十分艱難。然而這是一項(xiàng)新技術(shù)發(fā)展所需要經(jīng)歷的必然階段,新的技術(shù)勢(shì)必會(huì)引發(fā)新的產(chǎn)品和新的模式,而當(dāng)我們回顧2000年左右的互聯(lián)網(wǎng)市場(chǎng),會(huì)發(fā)現(xiàn)和現(xiàn)階段的語音市場(chǎng)相差無幾。整個(gè)語音市場(chǎng)是否會(huì)像互聯(lián)網(wǎng)市場(chǎng)一樣,成為一個(gè)時(shí)代的標(biāo)志,我們尚未可知,不過可以相信的是,在不久的將來,待語音技術(shù)成熟,和行業(yè)深度融合的那一天,聲紋識(shí)別業(yè)務(wù)一定會(huì)迎來屬于他們的春天。
 
聲紋市場(chǎng)風(fēng)口何時(shí)到來?
 
2017年,6月《中華人民共和國(guó)網(wǎng)絡(luò)安全法》正式施行,明確將個(gè)人生物識(shí)別信息納入個(gè)人信息范疇管理。同年12月,工信部引發(fā)《促進(jìn)新一代人工智能產(chǎn)業(yè)發(fā)展三年行動(dòng)計(jì)劃(2018-2020年)》,智能身份識(shí)別系統(tǒng)、智能語音交互系統(tǒng)被率先列入重點(diǎn)發(fā)展8大領(lǐng)域。直至2020年,相關(guān)政策紛紛出臺(tái),尤其是受年初疫情影響,無接觸,無感知的聲紋識(shí)別系統(tǒng)需求隨之增加。
 
市場(chǎng)方向,近年來全球生物識(shí)別產(chǎn)業(yè)規(guī)模不斷擴(kuò)大,聲紋識(shí)別的市場(chǎng)占比也逐年上升。而隨著技術(shù)的成熟以及在產(chǎn)業(yè)內(nèi)的不斷滲透,這一規(guī)模仍會(huì)繼續(xù)增加。市場(chǎng)參與者方向,綜合語音廠商,聲紋專業(yè)廠商,人工智能初創(chuàng)公司以及互聯(lián)網(wǎng)巨頭紛紛入駐聲紋賽道,并在各自細(xì)分領(lǐng)域不斷進(jìn)行行業(yè)融合,整體市場(chǎng)處于良性競(jìng)爭(zhēng)狀態(tài)。2016-2020年期間,聲紋識(shí)別賽道資本投資進(jìn)入加速階段,哪怕在2020年,資本市場(chǎng)整體遇冷情況下,賽道仍獲得多筆融資。
 
技術(shù)方向,李稀敏博士表示:“當(dāng)前聲紋學(xué)術(shù)領(lǐng)域,已經(jīng)在廣泛地使用最前沿的神經(jīng)網(wǎng)絡(luò)技術(shù),用于解決聲紋技術(shù)所存在的問題,比如人聲分離、遠(yuǎn)場(chǎng)識(shí)別、跨信道等。預(yù)計(jì)3年左右,這些問題將得到較好地解決,在通過一段時(shí)間的實(shí)踐,算法和工程化都將得到驗(yàn)證。總而言之,5年以內(nèi),風(fēng)口將來。”
 
綜合論述,盡管現(xiàn)階段聲紋識(shí)別的應(yīng)用仍具有局限性,但是聲紋主導(dǎo)的生物識(shí)別模式已經(jīng)進(jìn)入公眾視野,并被時(shí)代所接受。相信在未來,人臉識(shí)別大熱過后,聲紋識(shí)別一定能迎來屬于他的風(fēng)口。
 
三、聲紋識(shí)別市場(chǎng)參與者
 
企業(yè)不斷入局聲紋賽道,原因?yàn)楹危?/div>
 
近年來加入聲紋賽道的企業(yè)越來越多,包括騰訊、百度、字節(jié)跳動(dòng)、平安科技等,創(chuàng)業(yè)者也不斷入局,究其原因,我們可以從以下幾個(gè)視角進(jìn)行思考。
 
1.技術(shù)視角
 
李稀敏博士表示:“2011年前后神經(jīng)網(wǎng)絡(luò)技術(shù)在人臉識(shí)別和語音識(shí)別領(lǐng)域的廣泛應(yīng)用,帶動(dòng)了神經(jīng)網(wǎng)絡(luò)技術(shù)在聲紋技術(shù)領(lǐng)域的探索,直至2018年前后達(dá)到了一個(gè)高潮,各種算法層出不窮。所以,這個(gè)階段加入聲紋賽道,有其技術(shù)方面的因素。”在另一方面,李智勇也指出,在原創(chuàng)技術(shù)的推動(dòng)下,聲紋識(shí)別所帶來的技術(shù)紅利也是企業(yè)入局的促進(jìn)因素。
 
2.市場(chǎng)視角
 
在語音研發(fā)的道路上,服務(wù)商們逐漸發(fā)現(xiàn)了聲紋的重要性,以及潛在的市場(chǎng)需求,因而逐漸向聲紋技術(shù)發(fā)展。而隨著聲紋技術(shù)在金融、安全領(lǐng)域的探索應(yīng)用,身份認(rèn)證及聲紋反欺詐應(yīng)用不斷成熟,并引發(fā)了行業(yè)的廣泛關(guān)注。以金融、安全為引,聲紋市場(chǎng)逐漸向其他行業(yè)落地拓展,市場(chǎng)規(guī)模增長(zhǎng)的情況下,企業(yè)紛紛入局聲紋賽道。
 
3.政策視角
 
生物識(shí)別政策頻出,2018年,央行正式發(fā)布《移動(dòng)金融基于聲紋識(shí)別的安全應(yīng)用技術(shù)規(guī)范》,加深了聲紋識(shí)別在金融行業(yè)的應(yīng)用落地,大批聲紋服務(wù)商涌現(xiàn)。
 
聲紋識(shí)別服務(wù)商分類及布局
 
受市場(chǎng)、戰(zhàn)略以及技術(shù)的影響,聲紋識(shí)別技術(shù)服務(wù)商呈現(xiàn)出了多元化的趨勢(shì),業(yè)務(wù)模式、產(chǎn)品形態(tài)以及用戶群體都展現(xiàn)出了較大的差異化。現(xiàn)階段聲紋識(shí)別的市場(chǎng)參與者主要有四類,分別為綜合語音技術(shù)服務(wù)商、人工智能初創(chuàng)公司、深耕聲紋的技術(shù)服務(wù)商以及互聯(lián)網(wǎng)巨頭。
 
1.綜合語音技術(shù)服務(wù)商
 
多為傳統(tǒng)語音服務(wù)商,普遍成立于2000年左右,擁有較為成熟的技術(shù)支持及產(chǎn)品體系。整體業(yè)務(wù)以融合了多元語音技術(shù)的通用解決方案為主,客戶群體以大型客戶為主。聲紋識(shí)別作為語音的技術(shù)分支,更多作為定制化選項(xiàng)搭配語音方案進(jìn)行輸出。企業(yè)戰(zhàn)略本身就是平臺(tái)+賽道,也就是將其自身的AI平臺(tái),落地到各種賽道。典型的綜合語音技術(shù)服務(wù)商為科大訊飛,捷通華聲等。
 
2.深耕聲紋的技術(shù)服務(wù)商
 
在傳統(tǒng)語音技術(shù)服務(wù)商進(jìn)入市場(chǎng)后,一部分專注與語音細(xì)分賽道的企業(yè)相繼出現(xiàn),以得意音通、遠(yuǎn)鑒科技為代表的深耕聲紋識(shí)別的服務(wù)商進(jìn)入市場(chǎng)。整體業(yè)務(wù)以聲紋識(shí)別產(chǎn)品及方案為主,相比起綜合語音技術(shù)服務(wù)商,更加聚焦行業(yè)的特定需求,并專注于聲紋技術(shù)的落地,探索各類潛在的應(yīng)用場(chǎng)景。
 
3.人工智能初創(chuàng)公司
 
2010年開始,專注于特定行業(yè)的人工智能初創(chuàng)公司陸續(xù)進(jìn)入市場(chǎng)。因聚焦行業(yè),因此在行業(yè)圖譜及數(shù)據(jù)庫搭建上具備更大的優(yōu)勢(shì)。整體業(yè)務(wù)以特定行業(yè)的SaaS服務(wù)及落地方案為主,在行業(yè)的基礎(chǔ)上應(yīng)用聲紋技術(shù),更加深入行業(yè)需求,主要面向中小企業(yè)。典型的代表企業(yè)為快商通,聲智科技等。
 
4.互聯(lián)網(wǎng)巨頭公司
 
近年來互聯(lián)網(wǎng)巨頭公司紛紛開始布局聲紋賽道,依托自身云服務(wù)優(yōu)勢(shì)及龐大C端客戶流量進(jìn)入市場(chǎng)。業(yè)務(wù)布局較廣,擁有較大的潛在用戶群體。典型的互聯(lián)網(wǎng)巨頭為阿里云、騰訊云、百度智能云及華為云。

關(guān)鍵字:安防聲紋識(shí)別

本文摘自:億歐網(wǎng)

電子周刊
^
  • <menuitem id="jw4sk"></menuitem>

            1. <form id="jw4sk"><tbody id="jw4sk"><dfn id="jw4sk"></dfn></tbody></form>
              主站蜘蛛池模板: 拉孜县| 周宁县| 延川县| 湖北省| 资溪县| 盐边县| 香港 | 乌海市| 米易县| 南丰县| 大邑县| 岫岩| 天长市| 竹溪县| 成武县| 万宁市| 咸宁市| 咸丰县| 丰城市| 双牌县| 邳州市| 株洲市| 寻乌县| 平度市| 阿拉善左旗| 永春县| 新巴尔虎右旗| 洛宁县| 北川| 南昌市| 淳化县| 桦甸市| 宜春市| 永福县| 浪卡子县| 松阳县| 南汇区| 辉南县| 侯马市| 陆良县| 东辽县|