在我們許多人的眼中,機器無需人類教受便能夠自主學習是科幻小說或電影中的情節(jié)。而科幻電影給我們留下的印象往往是邪惡計算機企圖統(tǒng)治世界。但當人工智能和機器學習成為我們生活中的一部分,并且用于保護人類和財產(chǎn)安全時,這是不是很有意思?
作為全球最大的網(wǎng)絡安全公司,賽門鐵克調(diào)查發(fā)現(xiàn),每年全球都會發(fā)生超過10萬億起安全事件,平均每天會發(fā)現(xiàn)超過100萬個惡意軟件。如今,單靠人類和傳統(tǒng)系統(tǒng)根本無法理解和處理當下的海量數(shù)據(jù),并將它們轉(zhuǎn)化為實用的情報。這促使我們開發(fā)和試驗新技術以解決這一難題,而其中,機器學習和人工智能成為研究的重點。
機器學習是什么?它與人工智能有何不同?
盡管當下的數(shù)字助手、Siri、Friends、數(shù)據(jù)挖掘、計算機視覺和工業(yè)應用等技術已令人驚嘆不已,但事實上,我們?nèi)蕴幱跈C器學習和人工智能發(fā)展的初級階段。實際上,雖然這些概念已經(jīng)提出超過60年,但直至最近十年,這些技術才取得真正的實質(zhì)性發(fā)展。
機器學習和人工智能密切相關,但也存在顯著差異。機器學習無需特別編程,便能夠從輸入和經(jīng)驗中進行學習,而人工智能則需要機器去感知和模仿人類的行為。以自動駕駛汽車為例,識別行人可以被理解為機器學習,但在抵達目的地之前的行駛過程中所處理的所有內(nèi)容則是人工智能。
機器學習在網(wǎng)絡安全領域的應用
隨著越來越多的企業(yè)擁抱數(shù)字化,保護自身企業(yè)的措施也必須進行演進。主動抵御安全風險,要比被動響應風險更加至關重要。現(xiàn)在,威脅和設備數(shù)量以及網(wǎng)絡規(guī)模如此龐大,人類和傳統(tǒng)系統(tǒng)根本無法充分理解安全威脅,并建立關聯(lián)。因此,我們必須求助于機器學習和人工智能,確保能夠領先網(wǎng)絡攻擊者一步。
在網(wǎng)絡安全領域,機器學習和人工智能作為助力手段,為我們提供了新的機遇--系統(tǒng)能夠理解數(shù)據(jù),并提供我們需要關心和采取行動的信息,這能夠極大地提高安全分析師的工作效率。
機器學習在網(wǎng)絡安全中的應用主要集中在三個方面:威脅檢測、異常檢測,以及用戶行為分析。
以威脅檢測為例,我們委托機器學習系統(tǒng)檢測新型未知文件,并確定該文件是否構成威脅。要做到這點,它必須通過查看已知惡意文件(已確定的惡意文件)進行學習,它所查看的樣本數(shù)量越多,就會越了解這些樣本的特征(屬性、組件、行為),也就越能夠檢測和發(fā)現(xiàn)未知文件。這是一個持續(xù)自我改善與提升的過程,通過發(fā)現(xiàn)和吸納已核實的新結(jié)果,不斷提升機器學習的能力。
而對于異常檢測而言,它需要系統(tǒng)檢測行為模式,并基于此自動構建配置文件。在自動駕駛汽車等封閉系統(tǒng)中,系統(tǒng)會觀察車輛的所有組件以及它們之間的通信方式,并為正常狀態(tài)構建一個基準模型。當發(fā)生超出該模型的異常事件時,系統(tǒng)就會提示異常。由于數(shù)據(jù)可用性的挑戰(zhàn),對互聯(lián)網(wǎng)等開放系統(tǒng)的異常檢測變得極為難以實現(xiàn)。只有以海量數(shù)據(jù)為樣本時,才能實現(xiàn)真正有效的檢測。賽門鐵克憑借來自億萬系統(tǒng)的遙測數(shù)據(jù)資源,能夠?qū)崿F(xiàn)有效異常檢測。
機器學習在這兩方面為我們構建出色的工具提供了支持,使賽門鐵克能夠領先網(wǎng)絡攻擊者一步。威脅檢測幫助我們發(fā)現(xiàn)全新未知的惡意軟件,而異常檢測則能夠幫助我們查看網(wǎng)絡或系統(tǒng)是否受到攻擊,或是否需要進一步調(diào)查。
數(shù)據(jù)是機器學習的動力之源。而大數(shù)據(jù)則是賽門鐵克機器學習方法的核心。得益于在端點、網(wǎng)絡和云安全的廣泛足跡,我們從來自不同企業(yè)、行業(yè)和地區(qū),并處于實時監(jiān)測下的1.75億端點和 5,700萬攻擊傳感器中收集了廣泛的威脅與攻擊數(shù)據(jù)。這些數(shù)據(jù)意味著數(shù)十億文件和近四萬億關聯(lián)信息。這是一個龐大而豐富的數(shù)據(jù)集,能夠訓練分類系統(tǒng)去分辨哪些是“無害”、“惡意”,以及介于兩者之間的數(shù)據(jù)和內(nèi)容。我們擁有的數(shù)據(jù)越多越豐富,檢測就會越精確越高效。
Symantec Endpoint Protection 14 解決方案能夠在端點和云端部署高級機器學習,同時充分利用云中附加的人工智能機制和賽門鐵克的全球智能情報網(wǎng)絡。
展望未來
最終,我們需要能夠構建出色的情報安全系統(tǒng),并確保它們擁有比威脅發(fā)展更快的速度進行學習,還能夠預測新的攻擊。我們可以利用機器去搜索暗網(wǎng),無需查找關鍵詞,便能夠理解和解讀以任何語言所進行的討論,并將這些內(nèi)容導入人工智能,將它們與所有其他機器學習輸出進行整合,從而最終實現(xiàn)感知、檢測和生產(chǎn)。
盡管機器智能的概念存在已久,但真正意義上的發(fā)展還是開始于近年。我們對于機器學習和人工智能將威脅監(jiān)測帶入新的領域感到興奮不已。如果能夠正確利用人工智能與機器學習,并與端點和云端廣泛而豐富的數(shù)據(jù)相結(jié)合,這些技術將徹底改變打擊網(wǎng)絡犯罪的方式。
隨著計算能力和數(shù)據(jù)量的提升,人工智能和機器學習也在快速發(fā)展。每當我們在網(wǎng)上購物、使用ATM機 、或者瀏覽廣告時,智能機器都正在保護著我們。雖然現(xiàn)實生活中并沒有統(tǒng)治世界這種驚心動魄的故事,但它們的出現(xiàn)至少會讓我們睡得更加踏實。