這項(xiàng)服務(wù)不僅可以識(shí)別中文、日文、英文、俄文等多國語言,還可以識(shí)別湖南、湖北、河南、東北、四川、廣東等地方言。
在日常生活中,阿裡AI語音鑒黃服務(wù)支持離線文件和實(shí)時(shí)語音流。阿裡安全部技術(shù)人員介紹,對(duì)那些有語義的內(nèi)容,系統(tǒng)先將語音識(shí)別轉(zhuǎn)成文字,然后再將這些文字跟文本反垃圾模型或關(guān)鍵詞庫比對(duì),判斷是否涉黃。對(duì)那些無語義的聲音,通過聲紋也能識(shí)別出來。
當(dāng)然,識(shí)別多國語言和多地方言的能力,需要進(jìn)行訓(xùn)練學(xué)習(xí)。“可以把它想象成一個(gè)機(jī)器人,像一個(gè)小孩,需要不斷的喂養(yǎng)、訓(xùn)練、學(xué)習(xí),它才具備這樣的能力。”阿裡安全部技術(shù)人員介紹,比如廣東話,可以用一些粵語電視劇來訓(xùn)練學(xué)習(xí)。
今年6月,全國掃黃打非辦通報(bào),多個(gè)網(wǎng)絡(luò)平臺(tái)上存在以ASMR(即自發(fā)性知覺經(jīng)絡(luò)反應(yīng),主要產(chǎn)品為聲音內(nèi)容,用於放鬆、助眠)形式傳播低俗甚至淫穢色情的問題。解決類似這種社會(huì)問題,人工智能語音鑒黃技術(shù)未來大有可為。