在剛剛落幕的第20屆Blackhat大會上,“機器學習”被反復提及,人工智能在網(wǎng)絡安全各個領域得到廣泛探索和應用嘗試。人工智能在網(wǎng)絡安全領域已經(jīng)從早期的概念炒作,向方案落地轉(zhuǎn)變。
當人工智能遇上網(wǎng)絡安全,在紛繁復雜的技術與應用方案背后,可以歸納成執(zhí)行層、感知層、任務層和戰(zhàn)略層四大層面的智能化,不僅幫助解決現(xiàn)有的一些安全難題,未來的發(fā)展也非常有想象空間。
網(wǎng)絡安全新戰(zhàn)場需要AI填補人才緊缺
目前網(wǎng)絡安全已經(jīng)進入了一個嶄新的時代,面向各種新戰(zhàn)場,需要新的架構、新的方法、新的編程語言來支撐我們應對越來越艱巨的戰(zhàn)斗。新戰(zhàn)場以黑產(chǎn)對抗、反勒索軟件、反Insider-based APT、物聯(lián)網(wǎng)/車聯(lián)網(wǎng)這些新方向為代表。比如很多攝像頭、智能門鎖、兒童手表,都是成批次的被攻破,車聯(lián)網(wǎng)與智能車的安全問題也引起業(yè)界的嚴重關注和顧慮。
眾所周知,在移動互聯(lián)網(wǎng)時代,安卓的碎片化生態(tài)幾乎已經(jīng)失控了。不少手機廠商對某些低版本的手機系統(tǒng)都不再進行升級,盡管還有很多用戶在用,這就帶來了嚴重的安全隱患,惡意代碼可以輕易通過攻擊幾年前的安卓漏洞來獲利。進入物聯(lián)網(wǎng)時代,這種情況會更加嚴重。很多硬件廠商在開發(fā)產(chǎn)品的時候完全沒有考慮引入專業(yè)安全服務,最終面臨嚴峻的安全漏洞時卻難以應對。
一方面是新的攻擊不斷涌現(xiàn),另一方面防守方卻顯得捉襟見肘了。安全的核心是對抗,而對抗是多維度的、持續(xù)的。為了進行有威懾力的對抗,最大的挑戰(zhàn)還是缺少高素質(zhì)安全專業(yè)人才。在這種情況下,我們只能靠AI,也就是靠人工智能來填補人才空缺。
對于人工智能的看法業(yè)界出現(xiàn)兩極分化:一種觀點認為AI可以幫人類完成一切工作,另一種認為AI會毀滅人類。事實上沒有絕對的黑白,AI的作用也遠遠沒有這么極端。AI能做什么?吳恩達教授給出了很好的解釋:一方面,正常人類1秒內(nèi)能做出的判斷,AI也能做的很好。比如無人駕駛時代已經(jīng)悄然來臨,人臉識別、語音識別,現(xiàn)在機器也能夠做到很高的準確率。另一方面,通過大量已經(jīng)發(fā)生過的具體重復事件,AI能很好的預測即將發(fā)生的事情。
當AI遇到網(wǎng)絡安全
當AI遇到網(wǎng)絡安全時,又會發(fā)生什么樣的化學反應呢?
網(wǎng)絡安全是一個非常復雜的體系,可以分為執(zhí)行層、感知層、任務層和戰(zhàn)略層。現(xiàn)在AI已經(jīng)可以在執(zhí)行層和感知層有不錯的應用,同時在任務層和戰(zhàn)略層已經(jīng)開始摸索,但還處于比較初期的階段。
(一)執(zhí)行層:顯著提高安全運維效率
在執(zhí)行層,AI可以顯著提升安全工具的規(guī)則運維效率。規(guī)則體系的觸角在整個安全網(wǎng)絡體系里面的延伸非常廣泛,包括像殺毒、WAF、反SPAM、反欺詐等。這些領域在傳統(tǒng)模式中需要大量的人力來維護,比如像反欺詐系統(tǒng)里面可能有上千條規(guī)則,這些規(guī)則之間存在著很多的沖突,某些規(guī)則組合甚至超出了人的理解能力,人在維護這些規(guī)則的時候也常常會出現(xiàn)問題。
而依靠AI,就可以很好的解決這些情況,機器學習已經(jīng)展示出非常強大的價值。它可以自動生成規(guī)則,不用依靠龐大的人力資源來維護。而且安全事件通常是大量發(fā)生的,所以AI能夠比較好的識別判斷下一次事件。
AI是如何做到的呢?機器學習能自動生成規(guī)則,但是其中的學習深度還是有一定的區(qū)分。“淺學習”以SVM、Random Forrest、GBDT等算法為代表,它還需要很多的人工特征工程來準備特征向量,然后由算法自動完成分類識別。在風控領域,運用最廣泛的是GBDT(很多比賽的冠軍都是用GBDT),但是當特征維度上升到數(shù)千維后,深度學習的優(yōu)勢就開始慢慢展現(xiàn)出來。深度學習和“淺學習”存在一個很大的區(qū)別,就是深度學習對特征工程的依賴減弱很多,它能比較好的自動提取特征,可以生成深度學習模型,比如CNN(卷積神經(jīng)網(wǎng)絡)和RNN(循環(huán)神經(jīng)網(wǎng)絡)技術等。
舉例而言,AI在移動殺毒引擎的應用效果明顯。眾所周知,現(xiàn)在病毒種類的變形越來越多,大多數(shù)黑產(chǎn)都會進行不同的嘗試。如果用人工來構建那些惡意代碼的識別特征,就需要構建一套非常龐大的體系,不僅慢而且難以維護。百度利用深度學習技術在這方面取得了非常出色的成果,在歷次AV Test測試中長期保持第一。去年百度安全在頂級安全工業(yè)界會議 Blackhat Europe 上就此成果做了專題報告,也是目前全球安全工業(yè)界第一個有實質(zhì)性進展的深度學習應用技術報告。
另一個例子是AI在網(wǎng)頁安全中的應用,效果也非常顯著。目前網(wǎng)頁安全的威脅主要包括三類:第一種欺詐類網(wǎng)站,包括虛假高校、虛假藥品、假冒貸款、仿冒火車票、虛假金融證券、仿冒飛機票、虛假中獎、仿冒登錄、虛假招聘等;第二類是存在風險的網(wǎng)站,主要包括網(wǎng)頁掛馬、惡意代碼、隱私竊取、惡意跳轉(zhuǎn)、僵尸網(wǎng)絡通信、木馬下載主機等;第三類是違法網(wǎng)站,包括色情和博彩等。
百度每天爬取索引的數(shù)據(jù)中,有1%~5%的URL包含不同程度的惡意信息,如果不加防護將會對網(wǎng)民帶來巨大的傷害。百度安全通過規(guī)則體系、機器學習(淺層模型)、深度學習(文本)、深度學習(圖片)以及威脅情報挖掘等網(wǎng)址安全復合檢測算法來保障網(wǎng)站的安全。目前,百度安全利用機器學習進行網(wǎng)頁檢測,對惡意信息的防護已經(jīng)取得了很好的成果。單條樣本檢測時延已經(jīng)小于10ms,對非法網(wǎng)站的識別準確率已經(jīng)超過99%。百度安全團隊也受國際安全學術泰斗 UC Berkley Prof. Dawn Song 邀請,在 Singapore Cyber security Consortium (SGCSC) 上就此成果做了專題報告。
(二)感知層:生物特征識別與對抗的興起
在感知層,當下最重要的應用就是生物特征認證。人臉認證是目前AI在安全領域最成功的一個應用。整個認證流程看起來簡單,其實里面的技術相當復雜:首先需要在各種環(huán)境下準確追蹤人臉,如果有偏差能夠給予及時有效的提示;其次要在最小用戶打擾的情況下完成可靠的活體識別,而不被虛假照片或化妝欺騙,能高速完成可信人臉數(shù)據(jù)對比。第三,設備和應用的安全狀態(tài)也需要可靠的保障,一旦發(fā)現(xiàn)惡意攻擊可以即時進行取證。最后,還必須要在云端對用戶隱私信息有著嚴格的保護。因此,要實現(xiàn)順滑的人臉認證體驗,必須要有AI技術和系統(tǒng)化安全技術做全面支撐。
為什么要在安全過程中用AI感知來做人臉識別?因為銀行或者運營商對于客戶的實名認證環(huán)節(jié),傳統(tǒng)上是要靠人來完成的。但是人其實是在整個安全過程中最容易被攻破的一環(huán),攻擊者可以找到很多理由,比如最近胖了/瘦了/病了等來蒙混過關。如果是AI來做這件事,反而鐵面無私,能夠把這個體系構建的更加標準化,并隨著技術的進步不斷完善。
目前,百度的人臉認證已經(jīng)能夠在秒級內(nèi)完成超過90%的高可信驗證比率,顯著高于業(yè)界平均水平,并且已經(jīng)在實戰(zhàn)中積累了很多活體識別對抗的經(jīng)驗和能力。除此之外,我們也在聲紋識別、用戶行為識別等領域做了很多應用探索和嘗試。
(三)任務層和戰(zhàn)略層:尚處在初級探索階段
將AI應用于網(wǎng)絡安全任務層和戰(zhàn)略層,在某些國際大賽上已經(jīng)開始嘗試,但目前還只是封閉空間的自動對抗。其中最著名的就是 DARPA 主辦的 CGC 大賽,比賽讓7個頂級團隊構建自動化系統(tǒng),對有缺陷的服務程序做自動加固,然后相互攻擊,不僅要抵抗外來攻擊,同時還要反擊對手。但是,這個還不能說是人工智能,因為所有的邏輯都是人預先設定好的。也就是說,目前仍然停留在自動化階段,還在向AI方向摸索。
在安全的任務層和戰(zhàn)略層要真正達到人工智能的高級階段,首先要解決人工智能對開放空間的認知問題,包括世界認知、人性弱點、創(chuàng)造力、跨維打擊等方面,其實還有很長一段距離。不過最近在相對封閉的任務空間中的人工智能探索研究,已經(jīng)取得了很好的進展,相信在不遠的將來會有一些顛覆性的應用產(chǎn)生。
總結(jié)
人工智能在網(wǎng)絡安全領域的應用,執(zhí)行層上面已經(jīng)實用化,可以顯著的提升規(guī)則化安全工作的效率,彌補專業(yè)人員人手的不足;在感知層面,可以把原本依賴于人(不可靠)的安全體系標準化,現(xiàn)在已經(jīng)開始實現(xiàn)大規(guī)模的推廣,包括人臉識別和圖象識別等等;AI在任務層上的摸索剛剛開始,在某些封閉任務領域已經(jīng)展現(xiàn)出很好的潛力;在戰(zhàn)略層,由于開放空間的特性,AI的路還比較遙遠,所以大家還不用擔心“天啊,人類要毀滅了”這樣的問題。同時,隨著人工智能在安全領域的應用,圍繞著人工智能技術本身的攻防對抗也成為學術界的研究熱點,相信其中的研究成果很快也會在安全實踐中得到應用。
作者:百度安全 韋韜
在剛剛落幕的第20屆Blackhat大會上,“機器學習”被反復提及,人工智能在網(wǎng)絡安全各個領域得到廣泛探索和應用嘗試。人工智能在網(wǎng)絡安全領域已經(jīng)從早期的概念炒作,向方案落地轉(zhuǎn)變。
當人工智能遇上網(wǎng)絡安全,在紛繁復雜的技術與應用方案背后,可以歸納成執(zhí)行層、感知層、任務層和戰(zhàn)略層四大層面的智能化,不僅幫助解決現(xiàn)有的一些安全難題,未來的發(fā)展也非常有想象空間。
網(wǎng)絡安全新戰(zhàn)場需要AI填補人才緊缺
目前網(wǎng)絡安全已經(jīng)進入了一個嶄新的時代,面向各種新戰(zhàn)場,需要新的架構、新的方法、新的編程語言來支撐我們應對越來越艱巨的戰(zhàn)斗。新戰(zhàn)場以黑產(chǎn)對抗、反勒索軟件、反Insider-based APT、物聯(lián)網(wǎng)/車聯(lián)網(wǎng)這些新方向為代表。比如很多攝像頭、智能門鎖、兒童手表,都是成批次的被攻破,車聯(lián)網(wǎng)與智能車的安全問題也引起業(yè)界的嚴重關注和顧慮。
眾所周知,在移動互聯(lián)網(wǎng)時代,安卓的碎片化生態(tài)幾乎已經(jīng)失控了。不少手機廠商對某些低版本的手機系統(tǒng)都不再進行升級,盡管還有很多用戶在用,這就帶來了嚴重的安全隱患,惡意代碼可以輕易通過攻擊幾年前的安卓漏洞來獲利。進入物聯(lián)網(wǎng)時代,這種情況會更加嚴重。很多硬件廠商在開發(fā)產(chǎn)品的時候完全沒有考慮引入專業(yè)安全服務,最終面臨嚴峻的安全漏洞時卻難以應對。
一方面是新的攻擊不斷涌現(xiàn),另一方面防守方卻顯得捉襟見肘了。安全的核心是對抗,而對抗是多維度的、持續(xù)的。為了進行有威懾力的對抗,最大的挑戰(zhàn)還是缺少高素質(zhì)安全專業(yè)人才。在這種情況下,我們只能靠AI,也就是靠人工智能來填補人才空缺。
對于人工智能的看法業(yè)界出現(xiàn)兩極分化:一種觀點認為AI可以幫人類完成一切工作,另一種認為AI會毀滅人類。事實上沒有絕對的黑白,AI的作用也遠遠沒有這么極端。AI能做什么?吳恩達教授給出了很好的解釋:一方面,正常人類1秒內(nèi)能做出的判斷,AI也能做的很好。比如無人駕駛時代已經(jīng)悄然來臨,人臉識別、語音識別,現(xiàn)在機器也能夠做到很高的準確率。另一方面,通過大量已經(jīng)發(fā)生過的具體重復事件,AI能很好的預測即將發(fā)生的事情。
當AI遇到網(wǎng)絡安全
當AI遇到網(wǎng)絡安全時,又會發(fā)生什么樣的化學反應呢?
網(wǎng)絡安全是一個非常復雜的體系,可以分為執(zhí)行層、感知層、任務層和戰(zhàn)略層。現(xiàn)在AI已經(jīng)可以在執(zhí)行層和感知層有不錯的應用,同時在任務層和戰(zhàn)略層已經(jīng)開始摸索,但還處于比較初期的階段。
(一)執(zhí)行層:顯著提高安全運維效率
在執(zhí)行層,AI可以顯著提升安全工具的規(guī)則運維效率。規(guī)則體系的觸角在整個安全網(wǎng)絡體系里面的延伸非常廣泛,包括像殺毒、WAF、反SPAM、反欺詐等。這些領域在傳統(tǒng)模式中需要大量的人力來維護,比如像反欺詐系統(tǒng)里面可能有上千條規(guī)則,這些規(guī)則之間存在著很多的沖突,某些規(guī)則組合甚至超出了人的理解能力,人在維護這些規(guī)則的時候也常常會出現(xiàn)問題。
而依靠AI,就可以很好的解決這些情況,機器學習已經(jīng)展示出非常強大的價值。它可以自動生成規(guī)則,不用依靠龐大的人力資源來維護。而且安全事件通常是大量發(fā)生的,所以AI能夠比較好的識別判斷下一次事件。
AI是如何做到的呢?機器學習能自動生成規(guī)則,但是其中的學習深度還是有一定的區(qū)分。“淺學習”以SVM、Random Forrest、GBDT等算法為代表,它還需要很多的人工特征工程來準備特征向量,然后由算法自動完成分類識別。在風控領域,運用最廣泛的是GBDT(很多比賽的冠軍都是用GBDT),但是當特征維度上升到數(shù)千維后,深度學習的優(yōu)勢就開始慢慢展現(xiàn)出來。深度學習和“淺學習”存在一個很大的區(qū)別,就是深度學習對特征工程的依賴減弱很多,它能比較好的自動提取特征,可以生成深度學習模型,比如CNN(卷積神經(jīng)網(wǎng)絡)和RNN(循環(huán)神經(jīng)網(wǎng)絡)技術等。
舉例而言,AI在移動殺毒引擎的應用效果明顯。眾所周知,現(xiàn)在病毒種類的變形越來越多,大多數(shù)黑產(chǎn)都會進行不同的嘗試。如果用人工來構建那些惡意代碼的識別特征,就需要構建一套非常龐大的體系,不僅慢而且難以維護。百度利用深度學習技術在這方面取得了非常出色的成果,在歷次AV Test測試中長期保持第一。去年百度安全在頂級安全工業(yè)界會議 Blackhat Europe 上就此成果做了專題報告,也是目前全球安全工業(yè)界第一個有實質(zhì)性進展的深度學習應用技術報告。
另一個例子是AI在網(wǎng)頁安全中的應用,效果也非常顯著。目前網(wǎng)頁安全的威脅主要包括三類:第一種欺詐類網(wǎng)站,包括虛假高校、虛假藥品、假冒貸款、仿冒火車票、虛假金融證券、仿冒飛機票、虛假中獎、仿冒登錄、虛假招聘等;第二類是存在風險的網(wǎng)站,主要包括網(wǎng)頁掛馬、惡意代碼、隱私竊取、惡意跳轉(zhuǎn)、僵尸網(wǎng)絡通信、木馬下載主機等;第三類是違法網(wǎng)站,包括色情和博彩等。
百度每天爬取索引的數(shù)據(jù)中,有1%~5%的URL包含不同程度的惡意信息,如果不加防護將會對網(wǎng)民帶來巨大的傷害。百度安全通過規(guī)則體系、機器學習(淺層模型)、深度學習(文本)、深度學習(圖片)以及威脅情報挖掘等網(wǎng)址安全復合檢測算法來保障網(wǎng)站的安全。目前,百度安全利用機器學習進行網(wǎng)頁檢測,對惡意信息的防護已經(jīng)取得了很好的成果。單條樣本檢測時延已經(jīng)小于10ms,對非法網(wǎng)站的識別準確率已經(jīng)超過99%。百度安全團隊也受國際安全學術泰斗 UC Berkley Prof. Dawn Song 邀請,在 Singapore Cyber security Consortium (SGCSC) 上就此成果做了專題報告。
(二)感知層:生物特征識別與對抗的興起
在感知層,當下最重要的應用就是生物特征認證。人臉認證是目前AI在安全領域最成功的一個應用。整個認證流程看起來簡單,其實里面的技術相當復雜:首先需要在各種環(huán)境下準確追蹤人臉,如果有偏差能夠給予及時有效的提示;其次要在最小用戶打擾的情況下完成可靠的活體識別,而不被虛假照片或化妝欺騙,能高速完成可信人臉數(shù)據(jù)對比。第三,設備和應用的安全狀態(tài)也需要可靠的保障,一旦發(fā)現(xiàn)惡意攻擊可以即時進行取證。最后,還必須要在云端對用戶隱私信息有著嚴格的保護。因此,要實現(xiàn)順滑的人臉認證體驗,必須要有AI技術和系統(tǒng)化安全技術做全面支撐。
為什么要在安全過程中用AI感知來做人臉識別?因為銀行或者運營商對于客戶的實名認證環(huán)節(jié),傳統(tǒng)上是要靠人來完成的。但是人其實是在整個安全過程中最容易被攻破的一環(huán),攻擊者可以找到很多理由,比如最近胖了/瘦了/病了等來蒙混過關。如果是AI來做這件事,反而鐵面無私,能夠把這個體系構建的更加標準化,并隨著技術的進步不斷完善。
目前,百度的人臉認證已經(jīng)能夠在秒級內(nèi)完成超過90%的高可信驗證比率,顯著高于業(yè)界平均水平,并且已經(jīng)在實戰(zhàn)中積累了很多活體識別對抗的經(jīng)驗和能力。除此之外,我們也在聲紋識別、用戶行為識別等領域做了很多應用探索和嘗試。
(三)任務層和戰(zhàn)略層:尚處在初級探索階段
將AI應用于網(wǎng)絡安全任務層和戰(zhàn)略層,在某些國際大賽上已經(jīng)開始嘗試,但目前還只是封閉空間的自動對抗。其中最著名的就是 DARPA 主辦的 CGC 大賽,比賽讓7個頂級團隊構建自動化系統(tǒng),對有缺陷的服務程序做自動加固,然后相互攻擊,不僅要抵抗外來攻擊,同時還要反擊對手。但是,這個還不能說是人工智能,因為所有的邏輯都是人預先設定好的。也就是說,目前仍然停留在自動化階段,還在向AI方向摸索。
在安全的任務層和戰(zhàn)略層要真正達到人工智能的高級階段,首先要解決人工智能對開放空間的認知問題,包括世界認知、人性弱點、創(chuàng)造力、跨維打擊等方面,其實還有很長一段距離。不過最近在相對封閉的任務空間中的人工智能探索研究,已經(jīng)取得了很好的進展,相信在不遠的將來會有一些顛覆性的應用產(chǎn)生。
總結(jié)
人工智能在網(wǎng)絡安全領域的應用,執(zhí)行層上面已經(jīng)實用化,可以顯著的提升規(guī)則化安全工作的效率,彌補專業(yè)人員人手的不足;在感知層面,可以把原本依賴于人(不可靠)的安全體系標準化,現(xiàn)在已經(jīng)開始實現(xiàn)大規(guī)模的推廣,包括人臉識別和圖象識別等等;AI在任務層上的摸索剛剛開始,在某些封閉任務領域已經(jīng)展現(xiàn)出很好的潛力;在戰(zhàn)略層,由于開放空間的特性,AI的路還比較遙遠,所以大家還不用擔心“天啊,人類要毀滅了”這樣的問題。同時,隨著人工智能在安全領域的應用,圍繞著人工智能技術本身的攻防對抗也成為學術界的研究熱點,相信其中的研究成果很快也會在安全實踐中得到應用。