1.引言
大數(shù)據(jù)的產(chǎn)生使數(shù)據(jù)分析與應用更加復雜,難以管理。據(jù)統(tǒng)計,過去3年里全球產(chǎn)生的數(shù)據(jù)量比以往400年的數(shù)據(jù)加起來還多,這些數(shù)據(jù)包括文檔、圖片、視頻、Web頁面、電子郵件、微博等不同類型,其中,只有20%是結構化數(shù)據(jù),80%則是非結構化數(shù)據(jù)。數(shù)據(jù)的增多使數(shù)據(jù)安全和隱私保護問題日漸突出,各類安全事件給企業(yè)和用戶敲醒了警鐘。在整個數(shù)據(jù)生命周期里,企業(yè)需要遵守更嚴格的安全標準和保密規(guī)定,對數(shù)據(jù)存儲與使用的安全性和隱私性要求越來越高,傳統(tǒng)數(shù)據(jù)保護方法常常無法滿足新變化網(wǎng)絡和數(shù)字化生活也使黑客更容易獲得他人信息,有了更多不易被追蹤和防范的犯罪手段,而現(xiàn)有的法律法規(guī)和技術手段卻難于解決此類問題。因此,在大數(shù)據(jù)環(huán)境下數(shù)據(jù)安全和隱私保護是一個重大挑戰(zhàn)。
但是也應該看到,在大數(shù)據(jù)時代,業(yè)務數(shù)據(jù)和安全需求相結合能夠有效提高企業(yè)的安全防護水平。通過對業(yè)務數(shù)據(jù)的大量搜集、過濾與整合,經(jīng)過細致的業(yè)務分析和關聯(lián)規(guī)則挖掘,企業(yè)能夠感知自身的網(wǎng)絡安全態(tài)勢,預測業(yè)務數(shù)據(jù)走向。了解業(yè)務運營安全情況,這對企業(yè)來說具有革命性的意義。目前,在一些運營商的業(yè)務部門已經(jīng)開始使用安全基線和大數(shù)據(jù)分析技術,及時檢測與發(fā)現(xiàn)網(wǎng)絡中的各種異常行為和安全威脅,從而采取相應的安全措施。據(jù)Gartner公司預測,2016年40%的企業(yè)(以銀行、保險、醫(yī)藥、電信、金融和國防等行業(yè)為主)將積極地對至少10TB數(shù)據(jù)進行分析,以找出潛在的安全危險。
隨著對大數(shù)據(jù)的廣泛關注。有關大數(shù)據(jù)安全的研究和實踐也已逐步展開,包括科研機構、政府組織、企事業(yè)單位、安全廠商等在內(nèi)的各方力量,正在積極推動與大數(shù)據(jù)安全相關的標準制定和產(chǎn)品研發(fā),為大數(shù)據(jù)的大規(guī)模應用奠定更加安全和堅實的基礎。
[page]
2.不同領域的大數(shù)據(jù)安全需求
在理解大數(shù)據(jù)安全內(nèi)涵、制定相應策略之前,有必要對各領域大數(shù)據(jù)的安全需求進行全面了解和掌握,以分析大數(shù)據(jù)環(huán)境下的安全特征與問題。
(1)互聯(lián)網(wǎng)行業(yè)
互聯(lián)網(wǎng)企業(yè)在應用大數(shù)據(jù)時,常會涉及數(shù)據(jù)安全和用戶隱私問題。隨著電子商務、手機上網(wǎng)行為的發(fā)展,互聯(lián)網(wǎng)企業(yè)受到攻擊的情況比以前更為隱蔽。攻擊的目的并不僅是讓服務器宕機,更多是以滲透APT的攻擊方式進行。因此,防止數(shù)據(jù)被損壞、篡改、泄露或竊取的任務十分艱巨。同時,由于用戶隱私和商業(yè)機密涉及的技術領域繁多、機理復雜。很難有專家可以貫通法理與專業(yè)技術,界定出由于個人隱私和商業(yè)機密的傳播而產(chǎn)生的損失,也很難界定侵權主體是出于個人目的還是企業(yè)行為。因此,互聯(lián)網(wǎng)企業(yè)的大數(shù)據(jù)安全需求是:可靠的數(shù)據(jù)存儲。安全的挖掘分析,嚴格的運營監(jiān)管,呼喚針對用戶隱私的安全保護標準、法律法規(guī)、行業(yè)規(guī)范,期待從海量數(shù)據(jù)中合理發(fā)現(xiàn)和發(fā)掘商業(yè)機會和商業(yè)價值。
(2)電信行業(yè)
大量數(shù)據(jù)的產(chǎn)生、存儲和分析,使得運營商在數(shù)據(jù)對外應用和開放過程中面臨著數(shù)據(jù)保密、用戶隱私、商業(yè)合作等一系列問題。運營商需要利用企業(yè)平臺、系統(tǒng)和工具實現(xiàn)數(shù)據(jù)的科學建模,確定或歸類這些數(shù)據(jù)的價值。由于數(shù)據(jù)通常散亂在眾多系統(tǒng)中,信息來源十分龐雜,因此運營商需要進行有效的數(shù)據(jù)收集與分析,保障數(shù)據(jù)的完整性和安全性。在對外合作時,運營商需要能夠準確地將外部業(yè)務需求轉換成實際的數(shù)據(jù)需求,建立完善的數(shù)據(jù)對外開放訪問機制。在此過程中,如何有效保護用戶隱私,防止企業(yè)核心數(shù)據(jù)泄露,成為運營商對外開展大數(shù)據(jù)應用需要考慮的重要問題。因此,電信運營商的大數(shù)據(jù)安全需求是:確保核心數(shù)據(jù)與資源的保密性、完整性和可用性。在保障用戶利益、體驗和隱私的基礎上充分發(fā)揮數(shù)據(jù)價值。
(3)金融行業(yè)
金融行業(yè)的系統(tǒng)具有相互牽連、使用對象多樣化、安全風險多方位、信息可靠性、保密性要求高等特征。而且金融業(yè)對網(wǎng)絡的安全性、穩(wěn)定性要求更高。系統(tǒng)要能夠高速處理數(shù)據(jù),提供冗余備份和容錯功能,具備較好的管理能力和靈活性,以應對復雜的應用。雖然金融行業(yè)一直在數(shù)據(jù)安全方面追加投資和技術研發(fā),但是由于金融領域業(yè)務鏈條的拉長、云計算模式的普及、自身系統(tǒng)復雜度的提升以及對數(shù)據(jù)的不當利用。都增加了金融業(yè)大數(shù)據(jù)的安全風險。因此,金融行業(yè)的大數(shù)據(jù)安全需求是:對數(shù)據(jù)訪問控制、處理算法、網(wǎng)絡安全、數(shù)據(jù)管理和應用等方面提出安全要求,期望利用大數(shù)據(jù)安全技術加強金融機構的內(nèi)部控制,提高金融監(jiān)管和服務水平,防范和化解金融風險。
(4)醫(yī)療行業(yè)
隨著醫(yī)療數(shù)據(jù)的幾何倍數(shù)增長,數(shù)據(jù)存儲壓力也越來越大。數(shù)據(jù)存儲是否安全可靠,已經(jīng)關乎醫(yī)院業(yè)務的連續(xù)性。因為系統(tǒng)一旦出現(xiàn)故障,首先考驗的就是數(shù)據(jù)的存儲、災備和恢復能力。如果數(shù)據(jù)不能迅速恢復,而且恢復不到斷點,則對醫(yī)院的業(yè)務、患者滿意度構成直接損害。同時,醫(yī)療數(shù)據(jù)具有極強的隱私性,大多數(shù)醫(yī)療數(shù)據(jù)擁有者不愿意將數(shù)據(jù)直接提供給其他單位或個人進行研究利用,而數(shù)據(jù)處理技術和手段的有限性也造成了寶貴數(shù)據(jù)資源的浪費。因此,醫(yī)療行業(yè)對大數(shù)據(jù)安全的需求是:數(shù)據(jù)隱私性高于安全性和機密性,同時需要安全和可靠的數(shù)據(jù)存儲、完善的數(shù)據(jù)備份和管理,以幫助醫(yī)生與病人進行疾病診斷、藥物開發(fā)、管理決策、完善醫(yī)院服務,提高病人滿意度,降低病人流失率。
(5)政府組織
大數(shù)據(jù)分析在安全上的潛能已經(jīng)被各國政府組織發(fā)現(xiàn),它的作用在于能夠幫助國家構建更加安全的網(wǎng)絡環(huán)境。例如,美國進口安全申報委員會不久前宣布,通過6個關鍵性的調(diào)查結果證明,大數(shù)據(jù)分析不僅具備強大的數(shù)據(jù)分析能力,而且能確保數(shù)據(jù)的安全性。美國國防部已經(jīng)在積極部署大數(shù)據(jù)行動,利用海量數(shù)據(jù)挖掘高價值情報,提高快速響應能力,實現(xiàn)決策自動化。而美國中央情報局通過利用大數(shù)據(jù)技術,提高從大型復雜的數(shù)字數(shù)據(jù)集中提取知識和觀點的能力,加強國家安全。因此,政府組織對大數(shù)據(jù)安全的需求是:隱私保護的安全監(jiān)管、網(wǎng)絡環(huán)境的安全感知、大數(shù)據(jù)安全標準的制定、安全管理機制的規(guī)范等內(nèi)容。
3.大數(shù)據(jù)環(huán)境安全
通過上述分析可知,各領域的安全需求正在發(fā)生改變,從數(shù)據(jù)采集、數(shù)據(jù)整合、數(shù)據(jù)提煉、數(shù)據(jù)挖掘、安全分析、安全態(tài)勢判斷、安全檢測到發(fā)現(xiàn)威脅,已經(jīng)形成一個新的完整鏈條。在這一鏈條中,數(shù)據(jù)可能會丟失、泄露、被越權訪問、被篡改,甚至涉及用戶隱私和企業(yè)機密等內(nèi)容。通常,大數(shù)據(jù)安全具有以下6個方面的特征和問題。
(4)海量數(shù)據(jù)的安全存儲問題
隨著結構化數(shù)據(jù)和非結構化數(shù)據(jù)量的持續(xù)增長以及分析數(shù)據(jù)來源的多樣化。以往的存儲系統(tǒng)已經(jīng)無法滿足大數(shù)據(jù)應用的需要。對于占數(shù)據(jù)總量80%以上的非結構化數(shù)據(jù),通常采用NoSQL存儲技術完成對大數(shù)據(jù)的抓取、管理和處理。雖然NoSQL數(shù)據(jù)存儲易擴展、高可用、性能好,但是仍存在一些問題。例如,訪問控制和隱私管理模式問題、技術漏洞和成熟度問題、授權與驗證的安全問題、數(shù)據(jù)管理與保密問題等。而結構化數(shù)據(jù)的安全防護也存在漏洞,例如物理故障、人為誤操作、軟件問題、病毒、木馬和黑客攻擊等因素都可能嚴重威脅數(shù)據(jù)的安全性。大數(shù)據(jù)所帶來的存儲容量問題、延遲、并發(fā)訪問、安全問題、成本問題等,對大數(shù)據(jù)的存儲系統(tǒng)架構和安全防護提出挑戰(zhàn)。
(5)大數(shù)據(jù)生命周期變化促使數(shù)據(jù)安全進化
傳統(tǒng)數(shù)據(jù)安全往往是圍繞數(shù)據(jù)生命周期部署的,即數(shù)據(jù)的產(chǎn)生、存儲、使用和銷毀。隨著大數(shù)據(jù)應用越來越多,數(shù)據(jù)的擁有者和管理者相分離,原來的數(shù)據(jù)生命周期逐漸轉變成數(shù)據(jù)的產(chǎn)生、傳輸、存儲和使用。由于大數(shù)據(jù)的規(guī)模沒有上限,且許多數(shù)據(jù)的生命周期極為短暫,因此,傳統(tǒng)安全產(chǎn)品要想繼續(xù)發(fā)揮作用,則需要及時解決大數(shù)據(jù)存儲和處理的動態(tài)化、并行化特征,動態(tài)跟蹤數(shù)據(jù)邊界,管理對數(shù)據(jù)的操作行為。
(6)大數(shù)據(jù)的信任安全問題
大數(shù)據(jù)的最大障礙不是在多大程度上取得成功,而是讓人們真正相信大數(shù)據(jù)、信任大數(shù)據(jù),這包括對別人數(shù)據(jù)的信任和自我數(shù)據(jù)被正確使用的信任。例如,近年來工資“被增長”、CPI“被下降”、房價“被降低”、失業(yè)率“被減少”,因百姓的切身感受與統(tǒng)計數(shù)據(jù)之間的差異以及國家和地方之間GDP數(shù)據(jù)嚴重不符。都導致了市場對統(tǒng)計數(shù)據(jù)的質(zhì)疑。同時,大數(shù)據(jù)的信任安全問題也不僅是指要相信大數(shù)據(jù)本身,還包括要相信可以通過數(shù)據(jù)獲得的成果。但是,要讓人們相信和信任通過大數(shù)據(jù)模型獲得的洞察信息卻并不容易,而證明大數(shù)據(jù)本身的價值比成功完成一個項目要更加困難。因此,構建對大數(shù)據(jù)的安全信任至關重要,這需要政府機構、企事業(yè)單位、個人等多方面共同建設和維護好大數(shù)據(jù)可信任的安全環(huán)境。
4.大數(shù)據(jù)安全內(nèi)涵
基于以上大數(shù)據(jù)環(huán)境的安全分析,作者認為大數(shù)據(jù)安全應該包括兩個層面的含義,如圖1所示。
圖1 大數(shù)據(jù)安全內(nèi)涵
(1)保障大數(shù)據(jù)安全,即大數(shù)據(jù)自身的安全問題
大數(shù)據(jù)安全不同于關系型數(shù)據(jù)安全,大數(shù)據(jù)無論是在數(shù)據(jù)體量、結構類型、處理速度、價值密度方面,還是在數(shù)據(jù)存儲、查詢模式、分析應用上都與關系型數(shù)據(jù)有著顯著差異。大數(shù)據(jù)意味著數(shù)據(jù)及其承載系統(tǒng)的分布式,單個數(shù)據(jù)和系統(tǒng)的價值相對降低,空間和時間的大跨度、價值的稀疏,使得外部人員尋找價值攻擊點更不容易。但是,在大數(shù)據(jù)環(huán)境下完全的去中心化很難。只要存在中心就可能成為被攻擊的穴道,而對于低密度價值的提煉過程也是吸引攻擊的內(nèi)容。針對這些問題,傳統(tǒng)安全產(chǎn)品所使用的監(jiān)視、分析日志文件、發(fā)現(xiàn)數(shù)據(jù)和評估漏洞的技術在大數(shù)據(jù)環(huán)境中并不能有效運行。很多傳統(tǒng)安全技術方案中,數(shù)據(jù)的大小會影響到安全控制或配套操作能否正確運行。多數(shù)安全產(chǎn)品不能進行調(diào)整,無法滿足大數(shù)據(jù)領域,也不能完全理解其面對的信息。而且,在大數(shù)據(jù)時代會有越來越多的數(shù)據(jù)開放,交叉使用,在這個過程中如何保護用戶隱私是最需要考慮的問題。圖2說明了保障大數(shù)據(jù)安全的相關要點。
圖2 保障大數(shù)據(jù)安全
為解決大數(shù)據(jù)自身的安全問題,需要重新設計和構建大數(shù)據(jù)安全架構和開放數(shù)據(jù)服務,從網(wǎng)絡安全、數(shù)據(jù)安全、災難備份、安全風險管理、安全運營管理、安全事件管理、安全治理等各個角度考慮,部署整體的安全解決方案。保障大數(shù)據(jù)計算過程、數(shù)據(jù)形態(tài)、應用價值的安全