大數據近幾年來,筆者都接觸過很多;大數據簡單來說就是一些通過分析長久以來的數據,從而抽取出當中的一些慣性,最終得出較為準確的趨勢預測;亦因為這種特性,往往令大數據看似擁有神秘的力量;然而隨著大數據分析方案以及數據科學家變得「不再特別」,加上如 IBM、Cisco、Splunk 等均加入大數據研究行列,未來大數據的應用層面將愈來愈廣及普及化。
要數最近期的研究,業界已出現了一種應用于資安層面的大數據案例;當然利用大數據預測安全趨勢并不是新鮮事,筆者亦不是指這一種「傳統」的大數據應用案例,筆者這裡指的是一種取自大數據分析結果,并模疑以「人類思考」方式所進行的資安防御功能。
例如某位員工已經出差到外地,其帳號卻在公司辦公室中登錄內聯網并瀏覽重要資料,作為一名網絡管理人員,當你知道這一切,你首先會想到:這名員工的帳號被盜了?公司的商業機密正在被盜竊?之所以得出這樣的結論,是由于按照正常的邏輯判斷,將「出差」與「本地瀏覽 IP 位置」連結思考所得出的想法,在情理上是矛盾的。專家正尋求方法,并希望機器也能夠如同人類一般進行「邏輯思維」。結合大數據技術,今天這種智慧型的解決方案已經成為下一代大數據方案的發展趨勢。
大數據技術在今天已經成型并已經運用多年。在外國,不僅 Cisco 和 IBM 這樣的傳統巨頭在進行相關研發,一些新的企業,如 Fireeye、Splunk 等,也憑大數據在 IT 業界漸露頭角。
大數據應用在資安分析方面是一項新事物,之所以新,是因為它引入了「列式數據模型」以彌補傳統「行式數據模型」的不足,這為資安數據的處理、數據分析提供了新的邏輯思維、新的分析角度,當然亦帶來了新的安全價值。
現時資安已經上升至國家戰略的一部份,資安應用環境也發生了很大變化,加上可觀的市場收益,令這些傳統的安全公司癡迷于大數據,并希望利用大數據技術對傳統資安產業賦予新的邏輯思維。于是,基于大數據的資安,這個綜合了多項技術的新興事物應運而生,如雨后春筍。縱觀這些公司,但凡能嶄露頭角的,其不僅需要有資安開發經驗,還需要對數據採集、處理、分析、應用等有較深的理解,更需要企業有較深的、長期的業務和強大的財政支援來構建大數據的整體邏輯。相信這些安全企業可以借助大數據開啟市場新一頁,將經驗拓展到更為廣泛的應用領域。
開源系統開源技術將大大降低成本,同時亦可提高開發自由度。在性能方面,隨著開源技術對數據掌控能力不斷加強,開源技術將在穩定性、安全性上不斷完善和提升;創新方面,圍繞開源技術的創新和服務創新已逐漸形成,因而能更快地適應大數據時代的業務改變及快速轉型。
分析機構 Gartner 很早之前就已經表態,指出基于大數據分析的安全絕對是對付高級攻擊的有效手段,但其「比較復雜」的系統構架讓很多專業的資安公司難以涉足。事實上,基于大數據的資安方案已成為現今資安公司展現實力的分水嶺,誰先得掌握,誰便將會主宰企業資安市場。