人工智能在各個(gè)領(lǐng)域的應(yīng)用都在逐漸成熟,從去年起人工智能、機(jī)器學(xué)習(xí)已經(jīng)被安全領(lǐng)域的廠商所接受。比如36氪在今年1月份報(bào)道美國(guó)創(chuàng)業(yè)公司 SentinelOne ,英國(guó)網(wǎng)絡(luò)安全公司Wandera,都將機(jī)器學(xué)習(xí)融入其產(chǎn)品中并在實(shí)際生產(chǎn)中得到應(yīng)用,前者也獲得7000萬(wàn)美金的C輪融資,后者也有超過2700萬(wàn)美元的融資。不僅僅是創(chuàng)業(yè)公司活躍于此,微軟也以1億美元收購(gòu)的以色列網(wǎng)絡(luò)安全公司Hexadite,而Hexadite最大的特點(diǎn)也在于將機(jī)器學(xué)習(xí)應(yīng)用于安全領(lǐng)域。在中國(guó),亞信安全也正在通過機(jī)器學(xué)習(xí)技術(shù)解決企業(yè)安全難題。
實(shí)際上,在安全領(lǐng)域沒有一招鮮吃遍天的事情,亞信安全通用安全產(chǎn)品中心總經(jīng)理、亞信網(wǎng)絡(luò)安全產(chǎn)業(yè)技術(shù)研究院副院長(zhǎng)童寧認(rèn)為,人工智能、機(jī)器學(xué)習(xí)毫無(wú)疑問在驅(qū)動(dòng)網(wǎng)絡(luò)安全發(fā)展。”但亞信安全不會(huì)放棄基于特征碼比對(duì)的一代技術(shù)和基于行為分析的二代技術(shù),它們的結(jié)合對(duì)于處置安全風(fēng)險(xiǎn)更為有效。
在機(jī)器學(xué)習(xí)領(lǐng)域,最主要的兩個(gè)概念就是有監(jiān)督學(xué)習(xí)和無(wú)監(jiān)督學(xué)習(xí)。
有監(jiān)督學(xué)習(xí)是指通過已有樣本來(lái)訓(xùn)練,從而得到一個(gè)最優(yōu)模型,再利用這個(gè)模型將所有新的數(shù)據(jù)樣本映射為相應(yīng)的輸出結(jié)果,對(duì)輸出結(jié)果進(jìn)行簡(jiǎn)單的判斷從而實(shí)現(xiàn)分類的目的。簡(jiǎn)單來(lái)說,“有監(jiān)督學(xué)習(xí)就是人們‘告訴’機(jī)器‘哪些數(shù)據(jù)是屬于哪一類的’,然后通過數(shù)據(jù)進(jìn)行訓(xùn)練。
有監(jiān)督學(xué)習(xí)可以用于網(wǎng)絡(luò)攻防中對(duì)惡意程序、垃圾郵件的識(shí)別和對(duì)勒索病毒的防治,特別是在需要多維度識(shí)別的情況下,能夠大幅提高識(shí)別速度和效率。雖如此,但有監(jiān)督學(xué)習(xí)同樣面臨挑戰(zhàn):一是模型的新鮮度,因?yàn)橥{進(jìn)化非常迅速,所以要保證訓(xùn)練數(shù)據(jù)的更新能力。二是分類識(shí)別的精度和誤判管理,主要包括兩個(gè)指標(biāo),正確率與召回率。
童寧認(rèn)為,正確率和召回率是很多所謂的人工智能安全廠商不敢正面去談的話題,正確率指的是抓了多少是正確的,召回率指的是漏掉了多少?zèng)]有抓住。
如果假設(shè)總共有100個(gè)文件,其中有10個(gè)惡意文件。如果人工智能從中找到5個(gè),并且全部正確,那么正確率是100%,召回率是50%。如果人工智能從中找到 20個(gè),包含其中10個(gè)惡意文件,那么正確率是50%,召回率是100%。
童寧指出,也許有的廠商說我的AI安全正確率是100%,這話沒有錯(cuò),但確是片面的。亞信安全在實(shí)踐有監(jiān)督學(xué)習(xí)時(shí),實(shí)際上一直在平衡正確率和召回率,總有一定的錯(cuò)誤率,想要前后都做到100%目前是不可能的,現(xiàn)在做的是如何控制在可控的范圍內(nèi)。
而無(wú)監(jiān)督學(xué)習(xí)是從無(wú)標(biāo)記的訓(xùn)練數(shù)據(jù)中推斷結(jié)論;也就是說,無(wú)監(jiān)督學(xué)習(xí)就是不‘告訴’機(jī)器,直接由人對(duì)最終輸出的結(jié)果進(jìn)行定義。”
童寧告訴36氪,無(wú)監(jiān)督學(xué)習(xí)通常用于反欺詐、異常發(fā)現(xiàn)、攻擊發(fā)現(xiàn)、行為分析(UBA)等。
與正確率和召回率一樣,無(wú)監(jiān)督學(xué)習(xí)也面臨著一些挑戰(zhàn),例如如何讓用于建模學(xué)習(xí)的數(shù)據(jù)不受干擾避免投毒攻擊。在客戶環(huán)境中進(jìn)行建模學(xué)習(xí),一般要學(xué)習(xí)幾個(gè)星期甚至幾個(gè)月,廠商投入成本相對(duì)較高;客戶無(wú)能力持續(xù)繼續(xù)運(yùn)維,模型更新緩慢。
與機(jī)器學(xué)習(xí)在其他領(lǐng)域的要求一樣,機(jī)器學(xué)習(xí)在安全領(lǐng)域的成功也要依賴于以下幾點(diǎn),第一,持續(xù)的、高質(zhì)量的數(shù)據(jù),保證機(jī)器的學(xué)習(xí)能力。第二,機(jī)器學(xué)習(xí)的專家,保持在建模、算法方面的持續(xù)優(yōu)化。
此外在安全領(lǐng)域內(nèi),安全專家也扮演的重要的角色,他們來(lái)判斷機(jī)器要抽取哪些特征進(jìn)行學(xué)習(xí)和對(duì)結(jié)果的把控。那么亞信安全的哪些產(chǎn)品或者在哪些領(lǐng)域運(yùn)用了機(jī)器學(xué)習(xí)技術(shù)?
事實(shí)上,亞信安全基于AI的安全引擎在數(shù)據(jù)、特征識(shí)別、算法、模型等層面均有積累,在亞信安全防毒墻網(wǎng)絡(luò)版OfficeScan 12中使用了跨代整合技術(shù),實(shí)現(xiàn)了AI-機(jī)器學(xué)習(xí)技術(shù)和其它防護(hù)技術(shù)融合創(chuàng)新。
童寧指出,在有監(jiān)督學(xué)習(xí)方面,亞信安全利用其進(jìn)行惡意程序及勒索病毒的防治,以及進(jìn)行防治垃圾郵件等進(jìn)行了實(shí)踐探索。無(wú)監(jiān)督學(xué)習(xí)方面,亞信安全對(duì)UBA、態(tài)勢(shì)感知、以及反欺詐(信勢(shì)和信盾)等產(chǎn)品進(jìn)行了機(jī)器學(xué)習(xí)的應(yīng)用。
人工智能在各個(gè)領(lǐng)域的應(yīng)用都在逐漸成熟,從去年起人工智能、機(jī)器學(xué)習(xí)已經(jīng)被安全領(lǐng)域的廠商所接受。比如36氪在今年1月份報(bào)道美國(guó)創(chuàng)業(yè)公司 SentinelOne,英國(guó)網(wǎng)絡(luò)安全公司W(wǎng)andera,都將機(jī)器學(xué)習(xí)融入其產(chǎn)品中并在實(shí)際生產(chǎn)中得到應(yīng)用,前者也獲得7000萬(wàn)美金的C輪融資,后者也有超過2700萬(wàn)美元的融資。不僅僅是創(chuàng)業(yè)公司活躍于此,微軟也以1億美元收購(gòu)的以色列網(wǎng)絡(luò)安全公司Hexadite,而Hexadite最大的特點(diǎn)也在于將機(jī)器學(xué)習(xí)應(yīng)用于安全領(lǐng)域。在中國(guó),亞信安全也正在通過機(jī)器學(xué)習(xí)技術(shù)解決企業(yè)安全難題。
實(shí)際上,在安全領(lǐng)域沒有一招鮮吃遍天的事情,亞信安全通用安全產(chǎn)品中心總經(jīng)理、亞信網(wǎng)絡(luò)安全產(chǎn)業(yè)技術(shù)研究院副院長(zhǎng)童寧認(rèn)為,人工智能、機(jī)器學(xué)習(xí)毫無(wú)疑問在驅(qū)動(dòng)網(wǎng)絡(luò)安全發(fā)展。”但亞信安全不會(huì)放棄基于特征碼比對(duì)的一代技術(shù)和基于行為分析的二代技術(shù),它們的結(jié)合對(duì)于處置安全風(fēng)險(xiǎn)更為有效。
在機(jī)器學(xué)習(xí)領(lǐng)域,最主要的兩個(gè)概念就是有監(jiān)督學(xué)習(xí)和無(wú)監(jiān)督學(xué)習(xí)。
有監(jiān)督學(xué)習(xí)是指通過已有樣本來(lái)訓(xùn)練,從而得到一個(gè)最優(yōu)模型,再利用這個(gè)模型將所有新的數(shù)據(jù)樣本映射為相應(yīng)的輸出結(jié)果,對(duì)輸出結(jié)果進(jìn)行簡(jiǎn)單的判斷從而實(shí)現(xiàn)分類的目的。簡(jiǎn)單來(lái)說,“有監(jiān)督學(xué)習(xí)就是人們‘告訴’機(jī)器‘哪些數(shù)據(jù)是屬于哪一類的’,然后通過數(shù)據(jù)進(jìn)行訓(xùn)練。
有監(jiān)督學(xué)習(xí)可以用于網(wǎng)絡(luò)攻防中對(duì)惡意程序、垃圾郵件的識(shí)別和對(duì)勒索病毒的防治,特別是在需要多維度識(shí)別的情況下,能夠大幅提高識(shí)別速度和效率。雖如此,但有監(jiān)督學(xué)習(xí)同樣面臨挑戰(zhàn):一是模型的新鮮度,因?yàn)橥{進(jìn)化非常迅速,所以要保證訓(xùn)練數(shù)據(jù)的更新能力。二是分類識(shí)別的精度和誤判管理,主要包括兩個(gè)指標(biāo),正確率與召回率。
童寧認(rèn)為,正確率和召回率是很多所謂的人工智能安全廠商不敢正面去談的話題,正確率指的是抓了多少是正確的,召回率指的是漏掉了多少?zèng)]有抓住。
如果假設(shè)總共有100個(gè)文件,其中有10個(gè)惡意文件。如果人工智能從中找到5個(gè),并且全部正確,那么正確率是100%,召回率是50%。如果人工智能從中找到 20個(gè),包含其中10個(gè)惡意文件,那么正確率是50%,召回率是100%。
童寧指出,也許有的廠商說我的AI安全正確率是100%,這話沒有錯(cuò),但確是片面的。亞信安全在實(shí)踐有監(jiān)督學(xué)習(xí)時(shí),實(shí)際上一直在平衡正確率和召回率,總有一定的錯(cuò)誤率,想要前后都做到100%目前是不可能的,現(xiàn)在做的是如何控制在可控的范圍內(nèi)。
而無(wú)監(jiān)督學(xué)習(xí)是從無(wú)標(biāo)記的訓(xùn)練數(shù)據(jù)中推斷結(jié)論;也就是說,無(wú)監(jiān)督學(xué)習(xí)就是不‘告訴’機(jī)器,直接由人對(duì)最終輸出的結(jié)果進(jìn)行定義。”
童寧告訴36氪,無(wú)監(jiān)督學(xué)習(xí)通常用于反欺詐、異常發(fā)現(xiàn)、攻擊發(fā)現(xiàn)、行為分析(UBA)等。
與正確率和召回率一樣,無(wú)監(jiān)督學(xué)習(xí)也面臨著一些挑戰(zhàn),例如如何讓用于建模學(xué)習(xí)的數(shù)據(jù)不受干擾避免投毒攻擊。在客戶環(huán)境中進(jìn)行建模學(xué)習(xí),一般要學(xué)習(xí)幾個(gè)星期甚至幾個(gè)月,廠商投入成本相對(duì)較高;客戶無(wú)能力持續(xù)繼續(xù)運(yùn)維,模型更新緩慢。
與機(jī)器學(xué)習(xí)在其他領(lǐng)域的要求一樣,機(jī)器學(xué)習(xí)在安全領(lǐng)域的成功也要依賴于以下幾點(diǎn),第一,持續(xù)的、高質(zhì)量的數(shù)據(jù),保證機(jī)器的學(xué)習(xí)能力。第二,機(jī)器學(xué)習(xí)的專家,保持在建模、算法方面的持續(xù)優(yōu)化。
此外在安全領(lǐng)域內(nèi),安全專家也扮演的重要的角色,他們來(lái)判斷機(jī)器要抽取哪些特征進(jìn)行學(xué)習(xí)和對(duì)結(jié)果的把控。那么亞信安全的哪些產(chǎn)品或者在哪些領(lǐng)域運(yùn)用了機(jī)器學(xué)習(xí)技術(shù)?
事實(shí)上,亞信安全基于AI的安全引擎在數(shù)據(jù)、特征識(shí)別、算法、模型等層面均有積累,在亞信安全防毒墻網(wǎng)絡(luò)版OfficeScan 12中使用了跨代整合技術(shù),實(shí)現(xiàn)了AI-機(jī)器學(xué)習(xí)技術(shù)和其它防護(hù)技術(shù)融合創(chuàng)新。
童寧指出,在有監(jiān)督學(xué)習(xí)方面,亞信安全利用其進(jìn)行惡意程序及勒索病毒的防治,以及進(jìn)行防治垃圾郵件等進(jìn)行了實(shí)踐探索。無(wú)監(jiān)督學(xué)習(xí)方面,亞信安全對(duì)UBA、態(tài)勢(shì)感知、以及反欺詐(信勢(shì)和信盾)等產(chǎn)品進(jìn)行了機(jī)器學(xué)習(xí)的應(yīng)用。