近年來,隨著大數據應用的爆發性增長,大數據衍生出獨特架構,并推動存儲、網絡及計算機技術的發展,同時也引發了新的安全問題。國際社會已經將大數據安全列入國家信息網絡安全戰略,國內學術界、信息安全界、產業界也正逐步關注大數據的發展。
一、大數據相關概念
1.1 研究背景及意義
大數據是繼云計算、物聯網之后信息產業當前科技創新、產業政策及國家安全領域的又次知識新增長點。在大數據的背景下信息安全面臨著很多的挑戰,特別是現階段已有的信息安全手段已經不能滿足大數據時代的信息安全的實際要求,因此研究大數據時代所面臨的信息安全問題具有重要意義大數據的研究與應用也引起了各國政府部門的重視,成為重要的戰略布局方向。縱觀國際形勢,各國陸續出臺大數據相關的政策及戰略方案。2012年,美國奧巴馬政府宣布將投資2億美元用于啟動“大數據研發倡議( Big Data Research and Development Initiative),旨在從海量繁雜的數據中萃取有用的信息。大數據下信息安全的事件所涉及的內容日益增多,受到的危險越來越嚴重的。信息安全問題需要經過多方面、多部門共同努力進行解決。
1.2 大數據概念
所謂大數據,即海量數據,具有信息量大、信息主體多元、更新速度快和價值密度低等特點,通常是指大量非結構化或半結構化的數據集。其實早在幾年前,數據的海量增長就引起了人們的關注,海量數據的發生、使用、儲存伴隨著云計算的發展等都成為了現實,“大數據”已經走入了我們的生活。最早將大數據用于IT環境的是知名咨詢公司麥肯錫,麥肯錫在研究報告中指出:如果云計算為數據資產提供了保管、訪問的場所和渠道,那么如何盤活數據資產使其為國家治理、企業決策乃至個人生活服務,則是大數據的核心議題,也是云計算內在的靈魂和必然的升級方向。
從信息安全角看,大數據是指規模和格式前所未有而又相互關聯的大量數據,搜集自企業的各個部分,技術人員可以對它們進行高速分析。
就像電影《黑客帝國》中的感知機器人或者《終結者》電影中的天網一樣,現在的大數據環境由大規模并行處理數據庫產品(不過所幸的是,它們沒有自我感知能力)組成,這些產品通過處理PB級(1015)到ZB級(1021)看似不同的數據來創建趨勢和數據映射。通過建立這種宏觀層面的信息,大數據可以讓企業了解到他們的產品是如何以前所未有的經濟理解水平在運行。也就是說,通過以新方式來結合和分析海量數據,我們可以實現新的業務洞察力.
1.3 大數據特征
大數據的4V+1C特征:
1).Volume,數據量大,據國際知名數據公司IDC提供的數據,全球數據量大約每兩年翻番,人類近兩年產生的數據量相當于之前產生的全部。
2).Variety,數據類型多,數據可分為結構化數據,半結構化數據和非結構化數據,相較便于存儲的文本為主的結構化數據,日志,音頻,視頻,圖片等非結構化數據,對數據處理能力提出了更高要求。
3).Value,價值密度低,價值密度的高低與數據數量成反比。例如在連續的一小時監控過程中,可能有用的數據只有一秒。如何通過強大的計算機算法更迅速的完成對有用數據的提取,是大數據背景下亟待解決的問題。
4)Velocuty,處理速度快,這是大數據相較于傳統數據挖倔最顯著的特征,IDC的“數字宇宙”報告預計到2020年,全球以電子形式存儲的數據數量將達到35.2ZB,在如此海量的數處理效率將成為衡量技術水平的關鍵。
5)Complexity,復雜性加大,更提升了處理分析大數據的難度。
二、大數據安全問題
2.1 大數據時代面臨的挑戰
當前互聯網改變著世界,信息滲透到社會生活的各個角落,與各個領域密切結合。同時也給國家信息安全和個人信息安全帶來了嚴峻的挑戰。隨著數據量的增大和數據的集中,對海量數據進行安全防護變得愈加困難,網絡空間中大數據大信息的泄露風險來源涵蓋范圍非常廣,數據的大量匯集、數據的集中存儲不可避免的增加了用戶數據泄露風險。這些數據成為維護公共安全的重要工作。另外,對敏感數據的所有權和使用權沒有明確的界定,大數據的分析對涉及的個體隱私問題很多都未考慮。再有,對國外大數據分析技術與平臺的過分依賴,使得別國通過獲取的情報而摸清國家經濟和社會脈搏,威脅到了國家安全,加大了信息泄露的風險。
大數據安全面臨的種種威脅如下:
(一)從基礎技術角度看,大數據依托的基礎技術—NoSQL(非關系型數據庫)與當前廣泛應用的SQL(關系型數據庫)技術不同,沒有經過長期改進和完善,在維護數據安全方面也未設置嚴格的訪問控制和隱私管理。NoSQL技術還因大數據中數據來源和承載方式的多樣性使得企業將很難定位和保護其中的機密信息。這是NoSQL內在安全機制的不完善,即缺乏保密性和完善性特質。另一方面, NoSQL對來自不同系統,不同應用程序及不同活動的數據進行關聯,也加大了隱私泄露的風險。此外, NoSQL允許不斷對數據記錄添加屬性,這也對數據庫管理員的安全性預見能力提出了更高的要求。數據的大量匯集,無形中增加了黑客的“收益率”降低了進攻成本,使得一次成功的攻擊能獲取更多的有價值的數據。從近年互聯網公司發生的某些用戶信息泄露案不難發現,被泄露的數據量都非常的龐大。
(二)大數據時代,智能終端的數據安全問題顯得越發關鍵。中國已經成為全球最大智能終端市場。隨身攜帶的終端在占用人們大部分時間的同時,也存儲了大量的個人信息。人們對于“大數據并不安全”的擔憂也不無道理。因此智能終端數據的安全就提上了議事日程。智能家居的產品化,假如人們所使用的智能終端如手機可以控制家里的所有智能終端,一旦被病毒侵犯,那么全家的智能終端都成為了被攻擊的目標,那后果就不堪設想。
(三)與任何虛擬化技術一樣,數據虛擬化是允許用戶訪問、管理和優化異構基礎架構的良方。數據被人們視為財富的同時,大數據就成為了寶藏,數據虛擬化技術就是挖掘數據和利用寶藏的最好武器。最有代表性的應用就是數據的虛擬化存儲技術。于用戶而言,虛擬化的存儲資源就像是一個巨大的磁石,用戶不用關心具體的存儲設備,也不必考慮數據經過的路徑在應用虛擬化存儲時,面對異構存儲設備的特點,如何統一監管、虛擬化后不同密級信息混合存儲的位置,造成的越權訪問、數據泄密等成為大的難題。
三、大數據安全的對策
3.1 大數據信息安全對策
隨著在線交易、在線對話、在線互動,在線數據越來越多,黑客們的犯罪動機也比以往任時候都來得強烈。如今的黑客們組織性更強,更加專業,作案工具也是更加強大,作案手段更是層出不窮。相比于以往一次性數據泄露或者黑客攻擊事件的小打小鬧,現在數據一旦泄露,對整個企業可以說是一著不慎滿盤皆輸,不僅會導致聲譽受損、造成巨大的經濟損失,嚴重的還要承擔法律責任,所以在大數據時代,網絡的恢復能力以及防范策略可以說是至關重要的。針對不同類型的大數據采取不同的決策,方法如下:
1)結構化數據
大數據時代下數據非常復雜,數據量驚人,對于許多企業而言,保證這些信息數據的安全有效利用是非常嚴肅的問題。數據結構化對于數據的安全及開發有著及其重要的作用。結構化的數據便于加密管理和處理分類,能高效的分辨非法入侵的數據,從而保證數據的安全未來社會,數據標準化、結構化是大趨勢.
2)安全加固網絡層端點的數據
通常分層構建是常規的數據安全模式。端點安全方式對于網絡層的安全防護并不完美。數據時代的信息爆炸,非法入侵服務端的次數急劇增長;云計算的大趨勢,導致現在的網絡數據威脅方式和方法難以預測辨識,給目前的端點數據安全模式造成了巨大壓力。今后網絡層安全應當作為重點發展。加強網絡層數據辨識結構化、智能化基礎上加強與本地系統監控協調,杜絕非常態數據的運行,形成網絡層構筑屬于大數據時代的全面安全堡壘,避免自身的缺陷。
3) 對本地數據加強安全策略
大數據時代數據的財富化導致大量的信息泄露,泄露事件中內部的威勒更大。在本地策略的構建上需要加入內部管理的監控,用純數據的模式來避免人為原因造成的數據流失和信息泄露。在今后的數據安全監管手段中,逐漸分化管理者的角色權重,用數據本身的自我監控和智能管理來代替一大部分人為的操作,在本地安全策略的構建過程中還要注重與各個環節的協調,依托于網絡這種數據處理方式,在數據的處理過程中往往出現大量的數據調用,調用過程中容易出現大的安全威脅。必須降本地和網絡的鏈接,從根本上做到杜絕數據的安全威脅,就必須完善緩存機制和儲存規則,保證數據源的純潔。
4)建立異構數據中心安全系統
傳統數據存儲都建立了全面完善的防護措施,但基于云計算架構的大數據,需要進一步完善數據存儲隔離與調用間的數據邏輯關系設定,當前,用虛擬化海量存儲技術來存儲數據資源是大數據的安全存儲方式,以服務的形式提供數據的存儲和操作。在云共享環境中云計算的大數據存儲,可以通過建立一個基于異構數據為中心的安全系統,使大數據的所有者可以對大數據進行控制,從系統管理上保證大數據的安全。
當企業轉變為數據驅動的機器時,其潛力是巨大的:企業所擁有的數據可能成為獲得競爭優勢的關鍵。因此,企業的數據和基礎設施的安全也變得比以往任何時候都重要。在許多情況下,企業或組織都可能得到 Forrester所說的“有毒的數據”。
四、總結
大數據時代的到來,信息成為了國家和社會發展的重要戰略資源,帶來了更多的安全風險,直接影響國家安全和社會穩定,同時也帶來了新機遇。對于海量數據的分析提供了新的可能性,網絡的異常行為有助于信息安全服務提供商更好地找出數據中的風險點。與此同時,大數據時代也對信息安全行業的發展有著積極的促進作用,大數據分析與安全軟件相結合后信息安全問題將變的容易、快捷,大數據給信息安全帶來了機遇和挑戰,信息安全戰略的制定需重視大數據的開發利用,多方位、多層次、多維度地維護國家信息安全。
繼實驗科學、理論科學、計算機科學之后,以大數據為代表的數據密集型科學或將成為新一次技術變革的基石,成為人類科學研究的第四大范式。面對挑戰與機遇并存的大數據安全問題,在規劃大數據發展的同時,要明確信息安全在大數據發展中的重要地位,加強對大數據安全形勢的宣傳力度,明確大數據的重點保障對象,加大對敏感,要害數據的監管,加快面向大數據的信息安全技術的研究,培養大數據安全的專業人才,建立并完善大數據信息安全體系。