近日,騰訊云聯(lián)合微信推出了智能語音服務(wù),可以實現(xiàn)語音識別、語音合成、聲紋識別等功能。這項服務(wù)由微信AI團隊自主研發(fā)。
自主研發(fā) 騰訊云推出微信智能語音服務(wù)(圖片來自Yahoo)
作為繼鍵盤、鼠標(biāo)、觸屏之后人機交互的新體驗,語音識別技術(shù)被廣泛應(yīng)用在呼叫中心、網(wǎng)絡(luò)搜索、智能終端、移動應(yīng)用、人工智能等各大領(lǐng)域。
據(jù)悉,騰訊云智能語音服務(wù)包括語音識別、語音合成、聲紋識別、語言識別、性別識別、情緒識別等。通過“云端+嵌入式”的形式,云端智能語音服務(wù)可以隨需求彈性擴縮容,提供持久化可靠性達99.999999%的存儲能力,而嵌入式引擎則能夠滿足無網(wǎng)絡(luò)場景下智能語音需求。
此次上線的智能語音各項技術(shù)均通過了億萬級別業(yè)務(wù)的并發(fā)驗證,其中語音合成MOS值4.4,聲紋識別準(zhǔn)確率99%,語音識別更是采用業(yè)內(nèi)首創(chuàng)的并行解碼技術(shù),現(xiàn)網(wǎng)抽樣通用領(lǐng)域準(zhǔn)確率達到93.8%,在餐飲、娛樂、教育、金融等垂直領(lǐng)域識別更精準(zhǔn),識別率平均達94%。
據(jù)了解,騰訊云智能語音服務(wù)不僅能運用在語音質(zhì)檢中,而且還能運用在很多領(lǐng)域,解放用戶雙手,提升用戶體驗。
此外,騰訊云將提供專業(yè)領(lǐng)域定制化服務(wù),包括識別模型訓(xùn)練等,對專業(yè)領(lǐng)域的海量語音、語言數(shù)據(jù)庫進行信號處理和知識挖掘,獲取語音識別系統(tǒng)所需要的“聲學(xué)模型”和“語言模型”。
值得一提的是,騰訊云智能語音服務(wù)在語音識別過程中可以自主學(xué)習(xí)用戶的語音,從而對“聲學(xué)模型”和“語音模型”進行必要的“校正”,進一步提高識別的準(zhǔn)確率。