隨著互聯(lián)網、云計算、物聯(lián)網等網絡技術快速發(fā)展和智能終端、智慧城市廣泛應用及大范圍建設,全球數據量呈現爆炸式增長,驅動著整個互聯(lián)網世界邁入大數據時代。
為應對大數據時代的挑戰(zhàn),推廣大數據基礎分析、技術研發(fā)與應用、安全技術,以及推進大數據技術創(chuàng)新管理能力和業(yè)務能力、加強大數據安全與隱私管理,廣東省信息協(xié)會、廣東省計算機信息網絡安全協(xié)會、廣東省大數據技術聯(lián)盟聯(lián)合主辦的“2014廣東省大數據應用與安全高峰論壇”定于10月21日(星期二)上午在廣東亞洲國際大酒店召開且圓滿結束。
藍盾股份作為中國信息安全行業(yè)領先的專業(yè)網絡安全企業(yè)和服務提供商,也應邀參加該次峰會,并圍繞“大數據應用安全隱患與安全體系建設”作出了重要演講。
下文就演講的幾個重要方面整理成文,重點歸納總結了大數據的應用價值、大數據背景下面臨的安全問題以及對大數據時代安全建設的幾點考慮。
一、大數據背景介紹
1、大數據特性
大數據(Big Data)是指“無法用現有的軟件工具提取、存儲、搜索、共享、分析和處理的海量的、復雜的數據集合。”業(yè)界通常用4個V(即Volume、Variety、Value、Velocity)來概括大數據的基本特征。
一是數據體量巨大(Volume)。據國際知名數據公司IDC 提供的更為復雜的新數據已經出現,而且生成的速度達到了前所未有的程度,IBM預計,到2020年將增至40萬億GB的水平。
二是數據類型繁多(Variety)。大數據來源種類豐富,更為復雜的新數據已經出現,社交網絡數據、網絡日志、存檔數據和傳感器數據、地理位置信息都屬于人們在分析中關注的新數據源。
三是價值密度低(Value)。雖然每天產生25億GB數據,但其中只有接近0.5%的經檢測數據才具有分析價值。
四是處理速度快(Velocity)。面對如此海量的數據,非結構化數據也越來越多,如何快速地處理這些數據并挖掘出有價值的信息,這也是大數據區(qū)分于傳統(tǒng)數據挖掘的最顯著特征。
2、大數據技術趨勢
1)Hadoop技術的應用
Apache hadoop是一個開源的分布式計算框架,通過集成MapReduce技術,Hadoop將大數據分布到多個數據節(jié)點上進行處理。Hadoop遵循Apache 2.0許可證,可以輕松處理結構化、半結構化和非結構化數據,一舉成為現在非常流行的大數據解決方案,可以用來應對PB甚至ZB級的海量數據存儲。
2)與云計算的融合
大數據和云是兩個不同的概念,但兩者之間有很多交集。支撐大數據以及云計算的底層原則是一樣的,即規(guī)模化、自動化、資源配置、自愈性,因此實際上大數據和云之間存在很多合力的地方。可以說大數據和云計算是相伴而生的,大數據的處理離不開云,大數據應用是在云上跑的、非常典型的應用。
二、大數據的應用價值
《華爾街日報》將大數據時代、智能化生產和無線網絡革命稱為引領未來繁榮的三大技術變革。麥肯錫公司的報告指出數據是一種生產資料,大數據是下一個創(chuàng)新、競爭、生產力提高的前沿。更有世界經濟論壇報告認定:大數據為新財富,價值堪比石油。
就國內外對大數據的研究與投入來看,2014年,Intel、IBM、微軟、阿里巴巴等行業(yè)巨頭紛紛布局大數據。IDC預測2014年產生2萬TB數據,2014年大數據產值超6億,2016年將可望突破100億。
那么,這些看似平凡的數據能為我們帶來什么?事實上當你把微博等社交平臺當作發(fā)泄工具時,專業(yè)的斂財高手們卻正在挖掘這些互聯(lián)網的“數據財富”,先人一步用這些數據來預判市場走勢,做出正確的決定,并取得不俗的收益。
大數據的核心價值是能夠為政府、企業(yè)提供決策服務,幫助企業(yè)把握市場機遇、迅速實現大數據商業(yè)模式創(chuàng)新,協(xié)助政府建設智慧城市和應對公共安全,幫助公安進行犯罪預測與預防。
例如,華爾街根據民眾情緒拋售股票;美國疾控中心依據國民搜索,分析全球范圍內流感等病疫的傳播狀況;投資機構搜集并分析上市企業(yè)聲明,從中尋找破產的蛛絲馬跡;電信行業(yè)利用大數據幫助電信業(yè)對業(yè)務的分析和優(yōu)化;電子商務收集、分析海量的消費者數據,從中挖掘消費者多變、復雜的需求。
總之,在大數據時代,以利用數據價值為核心,合理挖掘和利用大數據,已經為各行各業(yè)帶來了巨額財富。
三、大數據的安全隱患
隨著大數據應用的爆發(fā)性增長,大數據衍生出獨特架構,并推動存儲、網絡及計算機技術的發(fā)展,同時也引發(fā)了新的安全問題。
1、網絡化社會使大數據成攻擊目標
開放的網絡化社會,大數據的數據量大且相互關聯(lián),對于攻擊者而言,相對低的成本可以獲得“滾雪球”的收益。用戶數據泄露,個人賬號信息失竊的事件時有發(fā)生,一旦遭受攻擊,失竊的數據量也是巨大的。
最近幾年來數以百萬計的信息大泄密和大量的網絡犯罪案件說明,大數據和云環(huán)境下的信息安全的風險度已非昔時可比。
2、大數據加大隱私泄露風險
大數據是把“雙刃劍”,快捷的網絡、精準的營銷,雖能帶給人們一個更加便捷的生活方式,同時,卻也讓個人隱私的保護幾成空談。數據分析技術的發(fā)展,勢必對用戶隱私產生極大威脅。如今的大數據營銷,對于消費者而言,就好似被一雙眼睛盯著,每時每刻窺探著你的一舉一動,作為個體消費者,我們早就無法避免自己的個人隱私被網絡系統(tǒng)記取被商家掌握并挖掘利用,甚至被惡意使用。
3、技術短板帶來的安全隱患
NOSQL(非關系型數據庫)作為大數據處理的基礎技術,與當前廣泛應用的SQL(關系型數據庫)技術不同,沒有經過長期改進和完善,在維護數據安全方面也未設置嚴格的訪問控制和隱私管理,缺乏保密性和完整性特質。
4、大數據環(huán)境打破傳統(tǒng)安全壁壘
大數據的處理和存儲離不開云,其運營環(huán)境的特殊性打破了傳統(tǒng)的網絡邊界壁壘,使得傳統(tǒng)的安全技術手段無法做到有效的安全防護。
大數據本身的安全防護存在漏洞,雖然云計算對大數據提供了便利,但對大數據的安全控制力度仍然不夠。
5、大數據可能成為高級可持續(xù)攻擊的載體
APT攻擊是一個持續(xù)的過程,不具有被實時檢測到的明顯特征。同時,隱藏在大量數據中的APT攻擊代碼也很難被發(fā)現。此外,攻擊者還可以利用社交網絡和系統(tǒng)漏洞進行攻擊,在威脅特征庫無法檢測出來的時間段發(fā)起攻擊行為。
四、大數據時代下的安全體系建設
1、大數據存儲安全
大量的數據產生、存儲和分析,數據安全存儲問題將在未來幾年內成為一個更大的問題。行業(yè)必須盡快盡早規(guī)劃和布局大數據安全存儲防護措施,協(xié)同技術的發(fā)展,加大安全防護投入。安全存儲是大數據安全的最基本需求,我們可以從集中存儲、加密存儲、加密傳輸、認證授權和日志審計等方面來對大數據的安全存儲環(huán)境加大保護力度。
2、個人隱私信息的保護
大數據和個人隱私之間的“戰(zhàn)爭”早已打響,必須從技術和法規(guī)層面上保障大數據時代的隱私安全,完善用戶個人信息的保障體系。
法規(guī)層面應從標準和法律兩個方面界定數據屬性和銷售許可,出臺相應資質認證和法律法規(guī),建立健全大數據隱私安全保障體系。
技術層面應使用大數據清洗、去隱私化等技術完成對客戶隱私數據的隱藏化處理。
3、大數據云安全
大數據一般都需要在云中實現上傳、下載及交互,在吸引越來越多黑客和病毒攻擊的云端及客戶端做好安全保護必不可少。
我們可基于虛擬化的云數據中心提供系統(tǒng)性的安全解決方案,以安全虛擬器件代替原有硬件設備的產品交付方式,確保物理、虛擬和云環(huán)境中服務器的應用程序和數據的安全,可以為云和虛擬化環(huán)境提供主動防御、自動安全保護,將傳統(tǒng)數據中心的安全策略擴展到云計算平臺上。
4、建立防御機制
在規(guī)劃大數據發(fā)展的同時,建立并完善大數據信息安全體系很有必要。結合傳統(tǒng)信息安全技術和考量大數據收集、處理和應用時的實際環(huán)境安全需求,建立面向大數據信息安全的事件監(jiān)測機制,及時發(fā)現信息系統(tǒng)安全問題,當大數據運營環(huán)境遭到攻擊前或已經遭到攻擊時,快速、準確地發(fā)現攻擊行為,并迅速啟動處置和應急機制。
5、重新規(guī)范管理員的權限
大數據的跨平臺傳輸應用在一定程度上會帶來內在風險,可以根據大數據的密級程度和用戶需求的不同,將大數據和用戶設定不同的權限等級,并嚴格控制訪問權限。而且,通過單點登錄的統(tǒng)一身份認證與權限控制技術,對用戶訪問進行嚴格的控制,有效地保證大數據應用安全。
總之,大數據時代機遇與挑戰(zhàn)并存,在推進大數據技術創(chuàng)新管理能力和業(yè)務能力的同時,要加強大數據安全與隱私管理相關研究的力度,通過政策法規(guī)與技術手段相互作用,使大數據在我國各個行業(yè)得以沿著正確的方向更快、更深入的發(fā)展。