我們先解釋一個名詞,大數據安全分析。
這種安全并不是保護數據本身的安全,而是用大數據技術進行安全分析。
當前網絡與信息安全領域,正在面臨著多種挑戰。一方面,企業和組織安全體系架構的日趨復雜,各種類型的安全數據越來越多,傳統的分析能力明顯力不從心;另一方面,新型威脅的興起,內控與合規的深入,傳統的分析方法存在諸多缺陷,越來越需要分析更多的安全信息、并且要更加快速的做出判定和響應。信息安全也面臨大數據帶來的挑戰。
如何鑒別所謂的大數據安全分析是真的呢?在摩根大通、美林、英特爾、IBM等公司安全部門供職過的Ron Bennatan給了5個鑒別方法。
大數據安全分析應運而生。在今天的安全分析行業,大數據是一個熱門詞匯,但很多客戶還是持懷疑態度。因為很多公司花了數十年的時間建“數據湖”后才發現不能通過“泄湖”得到一些有用的東西。
今天的解決方案通常包括昂貴的集群加上靜態的商業智能報告以及看上去不錯、但實際作用不大的可視化儀表盤。
著眼于分析和如何應用有價值的數據來得到實時決策、發現關鍵模式、決定持續性的和不斷變化的安全政策,大幅提高安全性,這才是有用的。
看看谷歌、亞馬遜、Netflix這樣的公司就能認識到,通過對具有3v(velocity, variety and volume)的數據集進行實時挖掘,大數據可以成為商業成功的推動者。這些公司使用大數據預測分析,來識別出你想要買或者看些什么,這才是真正有用的安全分析模型。
如果遇到有供應商告訴你他們會提供大數據安全技術,這里有5個測試,來幫助你確定他們是不是真的使用了大數據技術。
1、你的大數據解決方案只針對“3v”數據嗎?
如果只是解決處理速度、數據類型和數據量的問題,那么大數據系統可能比SIEM(安全信息和事件管理)更高效,但它會是大數據存儲的陷阱。你的供應商需要與你討論貝葉斯理論,回歸、分類算法、維度問題,來確保大數據是真正可操作,可預測的。
2、當你問“安全分析”是什么意思的時候你會得到什么答案?
如果你聽到相關性、儀表板、查詢和alerts,注意,這些都是老的詞匯。 你需要聽到機器學習庫、多維數據集、余弦矩陣等。一切都是基于大數定律/異常值——這種技術要利用大量的數據和大量的歷史來自動建造東西(不斷更精確),而不是一個人需要盯著靜態聚合數據或手動定義明確的安全策略。
3、你的安全分析系統關閉了反饋回路嗎?
分析不是報告,分析只能幫助你做出決定。安全分析不是“事后”,他們利用歷史信息來改善。例如查找分析、,修改您的實時監測、告訴你排除、關注、而不只是給你發送警報。當談到智能安全分析,增加大量的數據與相應的算法顯著提高了分析和決策一直有用的系統。
4、數據集群是否越來越大?
大數據世界有時候很瘋狂,可能添加了大量數據和各種復雜維度,但得到的卻很少,你今天賺到了錢不代表你明天也會賺錢,而且既然我們的目標要從許多時間和來源匯總數據,你還要確保成本和數據是匹配的。一般來說,更多的數據會產生更好的效果,但如果打破一定的邊界數據也會變的無用。你應該尋找平臺,有效地擴展。尋找那些使用NoSQL的方法、柱狀數據域和一個內存中的分布式并行處理架構系統。一個有效的系統不應該要求一個節點幾TB的數據 - 的比率必須要高得多。
5、你的數據管理架構面對大量的數據是否靈活?
大數據具有多種層次和許多選項,這將幫助你和一些可以削弱你的復雜性。大數據提供了一個豐富的信息通過支持多種數據類型。大數據經歷了許多代非常快,因此,它是重要為你尋找壓力簡單的現代數據的方法,例如那些將大數據與JSON(JavaScript對象表示法)作為一個靈活的數據格式。
在對大數據的炒作中,這5個簡單的測試可以讓你針對自己所需要的安全分析選擇解決方案。