Watson(沃森)可謂是全能型選手,不僅在2011年的危機邊緣(Jeopardy)智力搶答挑戰中戰勝人類冠軍 Brad Rutter 和 Ken Jennings,而且在食譜創作、服裝設計、天氣預測和超級計算機等領域都有突出的表現。而現在它即將被賦予一項新的技能——在金融、醫療和其他領域打擊網絡犯罪。自今天開始,40多家機構通過Watson的計算機認知能力開展打擊網絡犯罪。
同時這項網絡安全測試項目也給IBM提供了很大的幫助,因為Watson在現實生活中積累的經驗能夠磨練它的技能并能更好地服務于特定行業。那些讓永明金融集團(Sun Life Financial)的安全專家通宵加班所面臨的網絡威脅和新不倫瑞克大學(University of New Brunswick)所受到的網絡偵查是完全不同的,而Waston都能從這些經驗中受益。
Watson并非全無經驗。早在去年春天,IBM的研究人員就已著手培訓Watson關于網絡安全的基礎知識,以便于計算機能夠分析和阻止各項威脅。而現在它作為合格的畢業生,開始投入到現實生活中來進一步打磨技能,你可以將其看作是世界上最聰明的實習生。
美國的勒索軟件
自今年5月以來Watson進行了更廣泛的學習。網絡空間無疑是非常龐大的,只有認知和理解能力不斷提升,Watson 才能更有效地理解溫和的威脅以及真實問題之間的區別。Watson 最卓越的技能并不是梳理海量信息(盡管他同樣能夠勝任),而是綜合處理和分析結構化數據(如特定安全事件)與非結構化數據(如白皮書,研究報告)。
Forrester Research安全分析專家 Andras Cser 說道:“認知計算比傳統基于規則的系統快30%至40%”。他同時認為類似于Watson的認知系統能夠大幅減少誤判。因此伴隨著深入學習,它們不會再犯相同的錯誤。
在正式投入現實應用前,Waston還經歷了一段學習生涯。直到今年秋季,科研專家每個月都會讓Watson閱讀至少15000份文檔,并連接至圖書館和新聞源確保數據庫處于最新狀態。
以“勒索軟件”為例。這種攻擊手段深受黑客的喜歡,它主要劫持計算機和操作系統,只有受害人繳納約定的贖金才能解鎖。但對初期的Watson來說,就可能會把它理解成一個地名(Ransomware, USA)。
IBM安全的副總裁 Caleb Barlow 說道:“我們猜測單詞‘Ransom’可能被識別為某個城市的地名,主要是因為‘ransomware’ 這個單詞目前還未被大部分詞典收錄。因此我們認為,每次當這個單詞出現的時候Watson都想要理解這代表什么意思,最終判定為一個地址。”IBM的研究人員隨后在文檔中注釋“ransomware”的定義。
這是非常有趣的軼事,但也說明了Watson所面臨的挑戰和機遇。它或許不知道某個單詞代表的含義,但是能夠根據上下文去猜測。而且如果猜測失敗,它還能自我學習。更為重要的是一旦學習掌握后,它絕對不會忘記。而它目前還只是測試項目,未來它將具備更強悍的能力。
專業語言訓練
現在,Watson的測試也不像傳統軟件的測試項目。
Barlo說道:“在常規開發項目中,通常會分配測試矩陣來衡量軟件在測試中的表現。在這種情況下,它更偏向于人類的學習軌跡。就像人類會經歷小學、初中、高中、大學并最后參加工作一樣,Watson的學習過程是非常相似的。”
總而言之,Watson目前已經理解和掌握了安全的基礎原理。而現在他需要學習出現在各個案例中的特定術語。Barlow說道:“在醫療保健行業所使用的安全語言可能就和能源行業的安全語言不同。”
在測試期間,Watson將會同數十家企業開展深度合作,并提供帶報告和建議的安全分析。具體來說,Watson能夠識別安全事件是否和已知的惡意程序存在關聯,并提供相關的背景審查以及識別用戶的可疑行為。
Watson并不會替代人類的作用,而是幫助人類做出更快更全面地反應。IBM的研究顯示,安全團隊在Watson的配合下每天平均能夠識別篩選 200,000 個潛藏重大安全事件。這不僅能夠讓計算機優先處理這些事件,而且揭示Watson在未來能夠更快地適應廣闊的互聯網世界。
Avnet的安全主管Sean Valcamp說道:“傳統的網絡安全分析模型可以看做是站在高速公路邊上的交警,能夠識別潛在的違法者。但是當車流量不斷增加,那么分辨是否超車或者是被盜車輛就不那么容易了。而通過使用Watson,就像是坐在直升飛機上審視相同的高速公路。”
Watson每次可能都不一定正確,但這正是測試的意義所在。而最重要的是Watson能夠從錯誤中學習,并且掌握一些人類教師沒有察覺的事件。Barlow說:“每天Watson都具備高度可操作的事件,這些都來自于數據分析和人類活動。Watson每天以驚人的速度成長,我們的目的是讓Watson找到新事物。”
而且在這個過程中,解決企業和他們的客戶免受潛在的安全威脅?,F在Watson已經開始在互聯網上搜索勒索軟件,不得不說這是非常不錯的學習曲線。