美國情報高級研究計劃署(IARPA)將其1140萬美元“網絡攻擊自動化非常規傳感器環境(CAUSE)”項目簽給了全球第三大軍品公司——BAE Systems。
IARPA的項目簡介指明:“IARPA希望執行者能識別并提取內部和外部傳感器(常規和非常規)先導信號,并將之用于產生網絡攻擊警告——概率預報和/或檢測。執行者將產生針對參與CAUSE項目的一家或多家美國產業公司的真實網絡攻擊。”
目的在于預測網絡威脅,而非僅僅檢測。公司企業此后將能夠防范攻擊,而不用為響應攻擊焦頭爛額。
BAE聲稱:CAUSE項目將開發結合現有高級入侵檢測功能和非常規公開可用數據源的預測方法,利用那些一般不與網絡安全聯系起來的數據源。“研究人員將尋求從大量嘈雜的外部數據流識別出攻擊主要指標,然后從不同來源關聯相關數據以產生準確的、可執行的警告。”
這不是第一個尋求用計算機的力量預測未來的項目?,F有的兩個例子是洛克希德馬丁公司維護的“綜合危機早期預警系統(ICEWS)”,以及喬治城大學卡勒夫·李塔路教授開發并維護的“事件語言和語調全球數據(GDELT)”項目。所有3個例子,ICEWS、GDELT和現在的CAUSE,其基本前提,都是輸入大量數據,處理那些數據,并基于那些數據輸出預測。
數據明顯是關鍵。只有具備了正確的源數據、合適的源數據量,和正確的分析算法,預測才可能成功。稍早的預測系統都不是太成功。很多之前的努力都有待證明其可操作性。政治科學家40年來不斷嘗試自動化預測這些事件之后,大數據框架提供了某種程度上的洞見,但在可靠性和一致性上完全失敗。其中一個關鍵原因,就是數據科學上的一句老話:“垃圾進,垃圾出”——胡亂輸入,自然就得到胡亂的輸出。
但是,今天可用的數據,在質量和數量上,都遠超幾年前的。大多數網絡早期預警框架只關注某個特定數據流或最多少量幾個,而且它們幾乎沒有囊括進人類行為。CAUSE跳出了這種模式,建立在之前自動化的開源工作基礎上,利用社交媒體、傳統新聞媒體報道和其他公開來源,進行攻擊或不穩定狀態預報。
“社交媒體”這個元素進來吸引了大量關注。上周,推特CEO杰克·多爾西將自家媒體形容為“人民的新聞網絡”。雖然某種程度上這或許是真的,但推特流在提供可靠預測上是否足夠準確,還有待觀察。颶風桑迪登陸之后,如果首批救援人員用推特來找受災最嚴重的地方,那他們就會只去往電力尚存的區域,而不是那些連網都上不了的地方,但這些地方恰恰是應急救援需要關注的。
CAUSE與之前預測方法的區別,就在于此處。雖然還是會從推特之類的“嘈雜”來源獲取數據,CAUSE會尋求在做出預測性結論前,將這些數據與更可靠的來源相互關聯。即便如此,預期數據源里還是會包括甚至比推特更不可靠的,比如來自暗網的數據。雖然也是有用的數據源,但暗網數據未必能納入可靠范圍,尤其是從網絡早期預警所要求的速度和覆蓋面來看。
瑞貝卡·卡西,BAE首席研究員,解釋了CAUSE工作原理。“我們的系統,將人類行為、網絡攻擊和社會理論,應用到公開信息上,開發出對攻擊早期階段指示性行為的非常規傳感器。這些傳感器會搜索包括情感語言、情緒和交通話題的信號。傳感器的輸出將會與根植了專門知識的模型進行融合,預測出正對特定目標的網絡攻擊的可能性。這與傳統網絡攻擊檢測完全不同。傳統方式利用運行在私有數據上的常規傳感器,重點在于檢測正在進行的事件,而不是預測。我們的傳感器利用一系列技術和算法,來挖掘數據的圖解展示。”
目前還有待觀察的,就是大數據融合、處理能力和高級分析上是否有足夠的進步以將良好想法轉變為可靠行動。