“世界的本質是數據,大數據開啟了一次重大的時代轉型,也是一場生活、工作與思維的大變革”。隨著世界各大國在陸、海、空、天、電、網多維度戰略的緊張部署,信息技術爆炸式發展。基于大數據發展對國家、社會的組織結構和治理模式,對商業、企業的決策方式和業務策略,對個人的生活思維方式等各方面產生的深刻影響,各界逐漸開始關注“信息”本身而不只是“技術”了。在大數據時代,人類信息管理準則也將面臨重新定位,而在信息安全問題日益突出的當下,大數據給信息安全帶來新挑戰的同時,也為信息安全領域的發展帶來新機遇。
1大數據及其思維特點
大數據,源于“人、機、物”,規模大且復雜以至于很難在一定時間范圍內用現有數據庫管理工具或數據處理工具進行捕捉、管理和處理的數據集合,其特征業界概括為“4V+1C”:Volume(規模大)、Variety(類型多)、Value(價值密度低)、Velocity(處理速度快),Complexity(復雜)。大數據思維特點:
不是隨機樣本,而是全體數據:小數據時代,用少量數據樣本獲得最多信息是受限于與數據交流的技術限制而非自然限制;大數據時代,該限制得到緩解,要分析與某事物相關的所有數據,進入全數據模式;
不是精確性,而是混雜性:接受數據的紛繁混雜,而不再執迷其精確性。相比小數據的精確性,大數據更強調數據的完整性和混雜性,更接近事實真相;
不是因果關系,而是相關關系:不揭示內部運作機制,通過識別有用的關聯物來做分析或預測,因果關系只是相關關系的一種特殊情況,先追求“是什么”,而非“為什么”。
2大數據時代信息安全面臨的挑戰
2.1加大隱私泄露風險
從個人隱私的角度而言,用戶在互聯網中產生的數據具有累積性和關聯性,單點信息可能不會暴露隱私,但如果采用大數據關聯性抽取和集成有關該用戶的多點信息并進行匯聚分析,其隱私泄露風險將大大增加,其關聯性利用類似于現實生活中的“人肉搜索”將某人或事物暴露。
從企業、政府等大的角度而言,大數據安全標準體系尚不完善,隱私保護技術和相關法律法規尚不健全,加之大數據所有權和使用權出現分離,使得數據公開和隱私保護很難做到友好協調,在數據的合法使用者在利用大數據技術收集、分析和挖掘有價值信息的同時,攻擊者也同樣可以利用大數據技術最大限度地獲取他們想要的信息,無疑增加了企業和政府敏感信息泄露的風險。
從大數據基礎技術的角度而言,無論是被公認為大數據標準開源軟件的Hadoop,還是大數據依托的數據庫基礎NOSQL,其本身均存在數據安全隱患。Hadoop作為一個分布式系統架構對數據的匯聚增加數據泄露風險的同時,作為一個云平臺也存在著云計算面臨的訪問控制問題,其派生的新數據也面臨加密問題。NOSQL技術將不同系統、不同應用和不同活動的數據進行關聯,加大隱私泄露風險,又由于數據的多元非結構化,使得企業很難對其中的敏感信息進行定位和保護。
2.2大數據成為黑客攻擊的目標和手段
大數據其自身規模大且集中的特點使得其在網絡空間中無疑是一個更易被“發現”、“命中”的大目標,低成本高收益的攻擊效果對黑客而言是充滿誘惑力的。
此外,大數據也被當做黑客的攻擊手段,除了獲取用戶或其他組織機構的敏感信息之外,也可以對這些信息進行篡改、偽造、重放,通過控制關鍵節點放大攻擊效果,或控制大量傀儡機發起傳統單點攻擊不具備的高數量級僵尸網絡攻擊。更甚者,利用大數據價值密度低的特征,將大數據作為APT攻擊的載體,稀釋APT攻擊代碼攜帶的安全分析工具所需的價值點,或誤導安全廠商或安全分析工具進行安全監測的方向。若將該手段與0day漏洞結合利用,后果將不堪設想。
2.3大數據對信息安全的合規性要求
大數據時代,出現數據擁有權和使用權分離,數據經常脫離數據擁有者的控制范圍活躍著,這就對數據需求合規性和用戶授權合規性提出新的要求,包括數據形態和轉移方式的合規性。數據需求方為精準開展一個業務要求數據擁有者提供原始敏感數據或未脫敏的統計類數據,顯然這有違背信息安全的本意。就算數據需求遵循最小級原則,對數據的提供未超出合理范圍,用戶授權仍是數據服務的前提,包括轉移數據使用的目的、范圍、方式以及授權信息的保存等各個環節。
在對信息安全提出合規性要求的同時,引入第三方的標準符合性審查服務似乎也很必要。如通過針對數據提供者和接受者雙方的審查,包括文檔資料安全規范的審查,技術輔助現場審查,在供方和需方之間做掃描和數據檢測,提供第三方公平的數據安全審查服務。
3大數據時代信息安全面臨的機遇
3.1大數據為基于異常的入侵檢測提供支撐
傳統的入侵檢測機制基于簽名庫,即黑名單,顯然該機制不可檢測0day漏洞,而基于異常即白名單的檢測機制將有效彌補該缺陷。異常的鑒定需借助機器學習,而大量數據的機器學習則需要大數據技術對海量多元數據進行分析和處理從而更高效地刻畫網絡異常。大數據為基于異常的入侵檢測提供新的可能性。
3.2大數據為APT攻擊檢測新的突破口
APT攻擊的相對于其他攻擊形式更為高級,在發動攻擊之前針對攻擊對象進行長期、有計劃和組織性地收集相關資料、情報,并在整個過程中極具隱蔽性,攻擊特征難以提取,攻擊渠道的多元化,社會工程學也被其充分利用,且存在攻擊空間的不確定性。這也意味著傳統的攻擊檢測將需要花費不可接受的人力、物力和財力成本。此時,大數據將為解決該問題提供新的突破口:不局限于單點檢測,而是針對一段時間內的多源海量數據利用數據之間的關聯特性持續地進行動態分析、處理,若有各層面、各階段的全方位信息數據,即可對任何交互行為都進行檢測,可以利用不同的數據找到不同的階段進行APT分析;其次也可考慮從全流量分析入手,在此基礎上做宏觀的分析、微觀特定事件的檢測,利用大數據組織、整理相關信息,提高截獲攻擊者攻擊路徑的概率。
4大數據時代信息安全風險防范的建議
2015年8月,國務院印發《促進大數據發展行動綱要》,指出我國在大力發展大數據產業的同時要注意大數據利用過程中的安全保障問題;2016年3月17日,十二屆全國人大四次會議表決通過的“十三五規劃”要求實施國家大數據戰略,同時要強化信息安全保障??梢姶髷祿h境下的信息安全問題已提升到國家戰略層面。而大數據安全標準是保障大數據安全、促進大數據發展的重要支撐,加快大數據安全標準化的研究將尤為迫切。中國軟件評測中心認為,除了完善相關體系、制度、標準外,加強大數據環境下網絡安全問題的研究和基于大數據的網絡安全技術的研究,落實信息安全等級保護、風險評估等網絡安全體制也是解決信息安全問題的關鍵。中國軟件評測中心基于多年開展軟硬件測試的豐富經驗,啟動了基于大數據背景的第三方的標準符合性審查、評估和認證工作,服務于大數據產業鏈的相關企業及機構。致力于與各界共同妥善處信息安全保障和發展創新之間的關系,做到大數據創新驅動發展,大數據治理保障安全,大數據發展與安全同步推進。