訊飛在深圳舉行主題為“遠(yuǎn)場識別 良辰可待”的遠(yuǎn)場識別技術(shù)發(fā)布會,60余名物聯(lián)網(wǎng)和智能家居的業(yè)者和開發(fā)者參與。
據(jù)訊飛開放平臺產(chǎn)品總監(jiān)王磊介紹,遠(yuǎn)場識別技術(shù)的核心有兩點:
一是語音前端處理:利用麥克風(fēng)陣列、回聲消除等技術(shù)將目標(biāo)說話人的聲音增強(qiáng),并抑制/消除周圍或本身無用的聲音(噪聲+回聲);
二是語音識別引擎:針對麥克風(fēng)陣列處理后的數(shù)據(jù)進(jìn)行收集、訓(xùn)練,以使遠(yuǎn)場效果最優(yōu)化。
王磊介紹,早在2010年,訊飛就構(gòu)建了聯(lián)合實驗室,投入語音前端處理研究,在2013年發(fā)布的基于雙麥的車載降噪模塊得到了很多知名車廠的認(rèn)可,目前累計出貨已超20萬套。
訊飛此次發(fā)布的遠(yuǎn)場識別方案系利用麥克風(fēng)陣列的空域濾波特性——在目標(biāo)說話人方向形成拾音波束,抑制波束之外的噪聲和反射聲,訊飛官方稱他們的“4麥克風(fēng)遠(yuǎn)場識別方案”的降噪和去混響效果均為國際頂級水平:
1. 5m范圍內(nèi)識別率和近講效果相當(dāng),5m距離語音識別率超過90%;
2. 超強(qiáng)的降噪性能,信噪比10dB、干擾60度條件下,識別率超過98%;
”我們目前的方案主要是均勻線性麥克風(fēng)陣列,根據(jù)算法不同,可分為適用于電視機(jī)、空調(diào)、機(jī)器人等的加性麥克風(fēng)陣列和適用于采訪話筒、錄音筆等的差分麥克風(fēng)陣列,未來,還會陸續(xù)推出能360度拾音波束的平面陣列和具備空間聲源定位功能的立體陣列“,王磊介紹道。
現(xiàn)場亦有訊飛的合作伙伴小魚兒科技CEO宋晨楓和華居智能COO盧堯分享,前者在研發(fā)一款智能陪伴機(jī)器人。小魚的陪伴機(jī)器人可以基于訊飛開放平臺提供的語音能力定制語音交互系統(tǒng),除了能和家人聊天,還可以實現(xiàn)如天氣查詢,信息咨詢等的服務(wù)。華居智能則表示希望通過語音解決N個設(shè)備的集中管理(比一個APP界面中十幾個設(shè)備的方案要優(yōu)越)。
而關(guān)于這一遠(yuǎn)場識別方案的發(fā)布時間,官方表示初期可能定在5.17日對開發(fā)者開放申請。