精品国产一级在线观看,国产成人综合久久精品亚洲,免费一级欧美大片在线观看

當(dāng)前位置:新聞中心行業(yè)動態(tài) → 正文

企業(yè)為色情內(nèi)容苦不堪言? 騰訊安全天御毫秒級識別!

責(zé)任編輯:cres |來源:企業(yè)網(wǎng)D1Net  2019-11-11 17:31:57 本文摘自:財金網(wǎng)

隨著互聯(lián)網(wǎng)的飛速發(fā)展,我們進(jìn)入了一個信息爆炸的時代。圖文、視頻、聊天、直播等互動內(nèi)容已經(jīng)成為人們?nèi)粘9ぷ鳌⑸畈豢苫蛉钡牟糠帧H欢谶@些日益增長的內(nèi)容中卻充斥著各種不良言論、垃圾廣告、涉黃等網(wǎng)絡(luò)垃圾。這些流竄在互聯(lián)網(wǎng)中的垃圾內(nèi)容,不僅極大程度影響了用戶體驗(yàn),也讓不少企業(yè)倍感困擾。

面對日益復(fù)雜的安全形勢,企業(yè)該如何“祛污”,守護(hù)內(nèi)容安全?在11月6日至7日舉辦的首屆騰訊 Techo 開發(fā)者大會云安全技術(shù)與應(yīng)用專場上,騰訊安全業(yè)務(wù)安全總監(jiān)楊紅圍繞《新時代的內(nèi)容風(fēng)控實(shí)踐與創(chuàng)新》,針對文本、圖片、音頻等載體的內(nèi)容安全,從現(xiàn)狀分析、算法選擇、對抗過程及實(shí)踐效果等方面著手,全景呈現(xiàn)了騰訊安全天御在守護(hù)內(nèi)容安全上的實(shí)踐經(jīng)驗(yàn)。

色情AI識別模型,毫秒級識別不良音頻

音頻是現(xiàn)階段網(wǎng)絡(luò)上發(fā)展最快的信息載體。當(dāng)下,游戲內(nèi)語音交流已成常態(tài),無論是手機(jī)游戲中的音頻傳輸,還是通過語音及時通訊工具傳輸?shù)囊纛l內(nèi)容,都是音頻垃圾內(nèi)容的災(zāi)區(qū),但音頻內(nèi)容時間短、信道復(fù)雜,難以識別,成為內(nèi)容安全監(jiān)管中的難點(diǎn)。

在海量的音頻識別中,“鑒黃”無疑挑戰(zhàn)巨大。相較標(biāo)準(zhǔn)AV音頻的識別,色情音頻在內(nèi)容、時長和信道維度都有其特點(diǎn),比如存在靜音、噪聲干擾大,存在較大的背景音樂,而且時間較短,編碼格式多樣和采樣率不統(tǒng)一等特點(diǎn),這都為識別造成一定困難。針對這一問題,騰訊安全基于AI設(shè)計了一套色情音頻識別流程,通過相應(yīng)技術(shù)去掉靜音內(nèi)容,對音頻進(jìn)行分段識別,最后根據(jù)每個片段的得分和時長匯總得到整條語音內(nèi)容的識別結(jié)果。針對音頻樣本搜集與標(biāo)注的難點(diǎn),騰訊安全天御大量綜合網(wǎng)友舉報,通過多類型、多標(biāo)簽標(biāo)注,已實(shí)現(xiàn)音頻鑒黃的準(zhǔn)確率達(dá)到82%、召回率達(dá)到90%以上。

而針對網(wǎng)絡(luò)謾罵,騰訊安全天御構(gòu)建了高性能多語種語音關(guān)鍵詞系統(tǒng),通過特征提取、聲學(xué)建模和解碼等技術(shù)加持,可毫秒級識別不良音頻。

線上打擊+離線主動收集標(biāo)注,惡意文本無處藏身

網(wǎng)絡(luò)文本是網(wǎng)絡(luò)中最大的信息載體,幾乎所有互聯(lián)網(wǎng)平臺都面臨文本安全問題。網(wǎng)絡(luò)文本類垃圾消息通常含有特殊符號、變異字、多音字、形近字干擾,而傳統(tǒng)的文本策略抗干擾能力弱,常常會導(dǎo)致誤殺。

騰訊安全天御對此專門建立了一套垃圾文本識別模型——TextCNN文本分類算法,通過在線實(shí)時打擊和離線主動收集標(biāo)注讓惡意文本無處藏身。在線模型訓(xùn)練中,補(bǔ)充了拼音和結(jié)構(gòu)信息用于訓(xùn)練,對訓(xùn)練數(shù)據(jù)添同音字和拆字,提升抗干擾性。對于線上模型不能覆蓋的新類型惡意垃圾,騰訊安全天御設(shè)計了離線樣本主動收集流程,讓學(xué)習(xí)算法主動提出要對哪些數(shù)據(jù)進(jìn)行標(biāo)注,增量訓(xùn)練分類模型進(jìn)行實(shí)時打擊。

在這套算法的支撐下騰訊安全天御提升了至少50%以上的識別覆蓋范圍,準(zhǔn)確率和召回率分別達(dá)到90%和80%以上。

多標(biāo)簽學(xué)習(xí)+細(xì)粒度識別,掃蕩網(wǎng)圖黑暗角落

圖片是僅次于文本的第二大信息載體,其面臨的識別挑戰(zhàn)比文本更大,騰訊安全天御針對性地提出了多標(biāo)簽的圖像識別算法,支持多標(biāo)簽輸出、多種標(biāo)簽預(yù)測,這意味著在一定顆粒度下,給圖片配上“身份證”以便識別。

騰訊安全天御豐富的數(shù)據(jù)積累是這套算法得以運(yùn)行的關(guān)鍵。目前騰訊安全天御積累了各種涉黃圖片數(shù)據(jù)500多萬,每張圖片有5個主要標(biāo)簽和10個細(xì)粒度標(biāo)簽。在標(biāo)簽識別中,不同的標(biāo)簽數(shù)量差距大、樣本不平衡,各維度標(biāo)簽響應(yīng)不同、統(tǒng)一閾值召回低的情況普遍存在,這也成為圖片識別中的難點(diǎn),騰訊安全天御采取標(biāo)簽級動態(tài)采樣,使低頻標(biāo)簽召回率提升15%;對維度標(biāo)簽問題,則使用驗(yàn)證集進(jìn)行閾值搜索,設(shè)置多閾值。

與此同時,騰訊安全天御自研的logo元素識別算法,能夠做到做到不同位置、尺度、分辨率、透視視角、遮擋干擾情況下具備良好的識別效果,準(zhǔn)確率和召回率分別達(dá)到90%以上。

企業(yè)在接入騰訊安全天御內(nèi)容風(fēng)控的能力上非常便捷。騰訊安全天御不僅提供API接口,還可以協(xié)同騰訊云等產(chǎn)品接入企業(yè)的內(nèi)容風(fēng)控系統(tǒng),幫助企業(yè)零開發(fā)、快速識別平臺中可能存在的違規(guī)內(nèi)容。

目前,騰訊安全天御的內(nèi)容風(fēng)控通過騰訊云和微信小程序已服務(wù)超過5萬家開發(fā)者。行業(yè)滲透率達(dá)90%,審核效率提升20倍以上,業(yè)務(wù)健康程度達(dá)到99.89%,守護(hù)數(shù)萬家客戶的內(nèi)容安全,保障業(yè)務(wù)健康開展,守衛(wèi)互聯(lián)網(wǎng)的清朗綠色。

關(guān)鍵字:騰訊安全

本文摘自:財金網(wǎng)

x 企業(yè)為色情內(nèi)容苦不堪言? 騰訊安全天御毫秒級識別! 掃一掃
分享本文到朋友圈
當(dāng)前位置:新聞中心行業(yè)動態(tài) → 正文

企業(yè)為色情內(nèi)容苦不堪言? 騰訊安全天御毫秒級識別!

責(zé)任編輯:cres |來源:企業(yè)網(wǎng)D1Net  2019-11-11 17:31:57 本文摘自:財金網(wǎng)

隨著互聯(lián)網(wǎng)的飛速發(fā)展,我們進(jìn)入了一個信息爆炸的時代。圖文、視頻、聊天、直播等互動內(nèi)容已經(jīng)成為人們?nèi)粘9ぷ鳌⑸畈豢苫蛉钡牟糠帧H欢谶@些日益增長的內(nèi)容中卻充斥著各種不良言論、垃圾廣告、涉黃等網(wǎng)絡(luò)垃圾。這些流竄在互聯(lián)網(wǎng)中的垃圾內(nèi)容,不僅極大程度影響了用戶體驗(yàn),也讓不少企業(yè)倍感困擾。

面對日益復(fù)雜的安全形勢,企業(yè)該如何“祛污”,守護(hù)內(nèi)容安全?在11月6日至7日舉辦的首屆騰訊 Techo 開發(fā)者大會云安全技術(shù)與應(yīng)用專場上,騰訊安全業(yè)務(wù)安全總監(jiān)楊紅圍繞《新時代的內(nèi)容風(fēng)控實(shí)踐與創(chuàng)新》,針對文本、圖片、音頻等載體的內(nèi)容安全,從現(xiàn)狀分析、算法選擇、對抗過程及實(shí)踐效果等方面著手,全景呈現(xiàn)了騰訊安全天御在守護(hù)內(nèi)容安全上的實(shí)踐經(jīng)驗(yàn)。

色情AI識別模型,毫秒級識別不良音頻

音頻是現(xiàn)階段網(wǎng)絡(luò)上發(fā)展最快的信息載體。當(dāng)下,游戲內(nèi)語音交流已成常態(tài),無論是手機(jī)游戲中的音頻傳輸,還是通過語音及時通訊工具傳輸?shù)囊纛l內(nèi)容,都是音頻垃圾內(nèi)容的災(zāi)區(qū),但音頻內(nèi)容時間短、信道復(fù)雜,難以識別,成為內(nèi)容安全監(jiān)管中的難點(diǎn)。

在海量的音頻識別中,“鑒黃”無疑挑戰(zhàn)巨大。相較標(biāo)準(zhǔn)AV音頻的識別,色情音頻在內(nèi)容、時長和信道維度都有其特點(diǎn),比如存在靜音、噪聲干擾大,存在較大的背景音樂,而且時間較短,編碼格式多樣和采樣率不統(tǒng)一等特點(diǎn),這都為識別造成一定困難。針對這一問題,騰訊安全基于AI設(shè)計了一套色情音頻識別流程,通過相應(yīng)技術(shù)去掉靜音內(nèi)容,對音頻進(jìn)行分段識別,最后根據(jù)每個片段的得分和時長匯總得到整條語音內(nèi)容的識別結(jié)果。針對音頻樣本搜集與標(biāo)注的難點(diǎn),騰訊安全天御大量綜合網(wǎng)友舉報,通過多類型、多標(biāo)簽標(biāo)注,已實(shí)現(xiàn)音頻鑒黃的準(zhǔn)確率達(dá)到82%、召回率達(dá)到90%以上。

而針對網(wǎng)絡(luò)謾罵,騰訊安全天御構(gòu)建了高性能多語種語音關(guān)鍵詞系統(tǒng),通過特征提取、聲學(xué)建模和解碼等技術(shù)加持,可毫秒級識別不良音頻。

線上打擊+離線主動收集標(biāo)注,惡意文本無處藏身

網(wǎng)絡(luò)文本是網(wǎng)絡(luò)中最大的信息載體,幾乎所有互聯(lián)網(wǎng)平臺都面臨文本安全問題。網(wǎng)絡(luò)文本類垃圾消息通常含有特殊符號、變異字、多音字、形近字干擾,而傳統(tǒng)的文本策略抗干擾能力弱,常常會導(dǎo)致誤殺。

騰訊安全天御對此專門建立了一套垃圾文本識別模型——TextCNN文本分類算法,通過在線實(shí)時打擊和離線主動收集標(biāo)注讓惡意文本無處藏身。在線模型訓(xùn)練中,補(bǔ)充了拼音和結(jié)構(gòu)信息用于訓(xùn)練,對訓(xùn)練數(shù)據(jù)添同音字和拆字,提升抗干擾性。對于線上模型不能覆蓋的新類型惡意垃圾,騰訊安全天御設(shè)計了離線樣本主動收集流程,讓學(xué)習(xí)算法主動提出要對哪些數(shù)據(jù)進(jìn)行標(biāo)注,增量訓(xùn)練分類模型進(jìn)行實(shí)時打擊。

在這套算法的支撐下騰訊安全天御提升了至少50%以上的識別覆蓋范圍,準(zhǔn)確率和召回率分別達(dá)到90%和80%以上。

多標(biāo)簽學(xué)習(xí)+細(xì)粒度識別,掃蕩網(wǎng)圖黑暗角落

圖片是僅次于文本的第二大信息載體,其面臨的識別挑戰(zhàn)比文本更大,騰訊安全天御針對性地提出了多標(biāo)簽的圖像識別算法,支持多標(biāo)簽輸出、多種標(biāo)簽預(yù)測,這意味著在一定顆粒度下,給圖片配上“身份證”以便識別。

騰訊安全天御豐富的數(shù)據(jù)積累是這套算法得以運(yùn)行的關(guān)鍵。目前騰訊安全天御積累了各種涉黃圖片數(shù)據(jù)500多萬,每張圖片有5個主要標(biāo)簽和10個細(xì)粒度標(biāo)簽。在標(biāo)簽識別中,不同的標(biāo)簽數(shù)量差距大、樣本不平衡,各維度標(biāo)簽響應(yīng)不同、統(tǒng)一閾值召回低的情況普遍存在,這也成為圖片識別中的難點(diǎn),騰訊安全天御采取標(biāo)簽級動態(tài)采樣,使低頻標(biāo)簽召回率提升15%;對維度標(biāo)簽問題,則使用驗(yàn)證集進(jìn)行閾值搜索,設(shè)置多閾值。

與此同時,騰訊安全天御自研的logo元素識別算法,能夠做到做到不同位置、尺度、分辨率、透視視角、遮擋干擾情況下具備良好的識別效果,準(zhǔn)確率和召回率分別達(dá)到90%以上。

企業(yè)在接入騰訊安全天御內(nèi)容風(fēng)控的能力上非常便捷。騰訊安全天御不僅提供API接口,還可以協(xié)同騰訊云等產(chǎn)品接入企業(yè)的內(nèi)容風(fēng)控系統(tǒng),幫助企業(yè)零開發(fā)、快速識別平臺中可能存在的違規(guī)內(nèi)容。

目前,騰訊安全天御的內(nèi)容風(fēng)控通過騰訊云和微信小程序已服務(wù)超過5萬家開發(fā)者。行業(yè)滲透率達(dá)90%,審核效率提升20倍以上,業(yè)務(wù)健康程度達(dá)到99.89%,守護(hù)數(shù)萬家客戶的內(nèi)容安全,保障業(yè)務(wù)健康開展,守衛(wèi)互聯(lián)網(wǎng)的清朗綠色。

關(guān)鍵字:騰訊安全

本文摘自:財金網(wǎng)

電子周刊
回到頂部

關(guān)于我們聯(lián)系我們版權(quán)聲明隱私條款廣告服務(wù)友情鏈接投稿中心招賢納士

企業(yè)網(wǎng)版權(quán)所有 ©2010-2024 京ICP備09108050號-6 京公網(wǎng)安備 11010502049343號

^
  • <menuitem id="jw4sk"></menuitem>

    1. <form id="jw4sk"><tbody id="jw4sk"><dfn id="jw4sk"></dfn></tbody></form>
      主站蜘蛛池模板: 共和县| 广德县| 清水河县| 安阳市| 涞水县| 苏尼特右旗| 仁化县| 临汾市| 防城港市| 溧水县| 广昌县| 雷州市| 宁乡县| 满洲里市| 吉林市| 铜鼓县| 潜山县| 多伦县| 安多县| 宣威市| 密山市| 锡林郭勒盟| 黑山县| 通海县| 漯河市| 宜川县| 河间市| 大田县| 资兴市| 永仁县| 惠水县| 陇川县| 曲阳县| 深泽县| 苏尼特左旗| 泰州市| 青铜峡市| 元阳县| 邻水| 达拉特旗| 拉孜县|