大數(shù)據(jù)時代
對保密范圍和方式的挑戰(zhàn)
隨著傳感網(wǎng)和物聯(lián)網(wǎng)的快速發(fā)展,人、機、物三元世界高度融合引發(fā)數(shù)據(jù)規(guī)模幾何式增長和數(shù)據(jù)模式極度多樣化,網(wǎng)絡化的大數(shù)據(jù)時代已悄然來到我們身邊。大數(shù)據(jù)時代對于保密工作的直接挑戰(zhàn)是,一些重要信息可保性急劇下降,關系國家安全的關鍵性數(shù)據(jù)亟須納入保密管控。
01
原屬于政府控制的一些重要信息可保性急劇下降
日本3•11地震期間,政府先向公眾宣稱放射程度沒有那么危險,核輻射處于控制之中;隨后,核反應堆墻體被沖垮,在冒著滾滾濃煙的畫面下,政府欲蓋彌彰仍稱情況在不斷好轉。大數(shù)據(jù)時代,這種行為只能稱之為作死,日本各地成千上萬人自發(fā)上傳蓋革(Geiger)計數(shù)器(用于測量放射性污染程度)數(shù)據(jù),通過Pachube平臺對外發(fā)布,政府和東京電力公司的“人設”瞬間崩塌。在一個可以有效感知并能分享信息的世界中,將數(shù)據(jù)算法運用到大數(shù)據(jù)上,就不難對部分政府希望保密的事項進行推斷和預測,這顯然是對傳統(tǒng)政府壟斷重要信息的巨大挑戰(zhàn)。舍恩伯格等在《大數(shù)據(jù)時代》中舉例,美國勞工統(tǒng)計局每個月統(tǒng)計、公布消費價格指數(shù)(CPI),花費巨大且結果滯后。兩位麻省理工學院經(jīng)濟學家通過軟件在互聯(lián)網(wǎng)上每天收集50萬種商品價格信息,通過大數(shù)據(jù)分析,就能比官方提前兩個月發(fā)現(xiàn)通貨緊縮的趨勢。
對數(shù)據(jù)進行有選擇性地屏蔽是政府控制信息的傳統(tǒng)方法,大數(shù)據(jù)時代此法可能不再奏效。以“谷歌街景”作為類比來看,谷歌公司的圖像采集車在很多國家采集了道路和房屋的圖像以及大量備受爭議的數(shù)據(jù),德國民眾強烈抗議這一行為,認為這些圖片會幫助黑幫竊賊選擇有利可圖的目標。在巨大壓力下,谷歌公司將一些房屋或花園的影像模糊化,但這種模糊化卻起到了此地無銀三百兩的反作用。與之類似,如果政府試圖屏蔽某些大數(shù)據(jù)庫里的數(shù)據(jù),則有可能引起相反的效果。
大數(shù)據(jù)格局下,要求政府重新審視需要保守的國家秘密范圍,對于已不具有可保性的,及時從范圍中剝離出去;對一些通過大數(shù)據(jù)分析有可能被準確預測,且確實關系國家安全的信息,要研究如何切斷數(shù)據(jù)獲取、分析和預測的途徑,而不僅僅是將國家秘密信息放在保險柜中。
02
一些關系國家安全的基礎數(shù)據(jù)逐步顯示出保密的重要性
大數(shù)據(jù)背景下,過去沒有引起足夠重視的一些數(shù)據(jù),對國家安全的重大影響逐步顯現(xiàn)。比如,過去我們對人種基因的安全重視不夠,隨著醫(yī)療大數(shù)據(jù)、基因大數(shù)據(jù)的快速發(fā)展,已直接關系國家存亡甚至種族延續(xù);對壟斷性電商銷售數(shù)據(jù)的長時間匯總、分析,就有可能直接掌握各地區(qū)經(jīng)濟發(fā)展態(tài)勢、居民購買力等重要信息。
此外,大數(shù)據(jù)將對涉密人員管理產(chǎn)生巨大影響。我們的通話、電子郵件、即時通訊信息等被加上時間印戳備份在通訊公司、軟件公司的服務器中;我們在電商處買東西的偏好和支付能力被詳細統(tǒng)計分析;我們的即時行蹤被手機廠商完全掌握;甚至我們的音容笑貌都被各大街角和商場的攝像頭實時捕捉并存儲在網(wǎng)絡上。可以說,每個人在大數(shù)據(jù)面前都是一絲不掛,當然也包括涉密人員,這就有可能對國家安全產(chǎn)生間接威脅。帕特里克•塔克爾在《赤裸裸的未來》中舉例,2010年,美國羅切斯特大學研究員亞當•薩迪雷克組織了一項研究,如果鎖定的目標關掉GPS,且不再發(fā)布含有地理定位的信息,能否對其準確定位?他們通過搜集目標朋友或親屬公開的推特信息,利用其中帶有的定位標簽,大數(shù)據(jù)分析預測目標的行蹤準確率高達47%。2011年,薩迪雷克和研究員約翰•克魯姆又組織了一項研究,他們雇傭了數(shù)百個受試者,讓其隨身攜帶追蹤器。經(jīng)對受試者及相關人員超過6年的監(jiān)測,可以通過大數(shù)據(jù)分析,在80個禮拜或更久前預測受試者所在的位置,準確率高達80%。
可以想見,未來的保密已不僅僅是信息的保密,構成信息的基礎數(shù)據(jù)的保密將會同等重要。這要求我們不僅僅考慮信息的保密,還要考慮在大數(shù)據(jù)分析條件下,哪些數(shù)據(jù)可能推測出相關信息。必要時,要通盤考慮對數(shù)據(jù)的保密管理要求和技術防范措施。
03
一些大數(shù)據(jù)與國家安全的關聯(lián)程度正在不斷增強
總體國家安全觀提出的國家安全體系,使得國家安全的外延得到進一步延伸。國家安全的概念不僅包括傳統(tǒng)上的政治、軍事、領土等國家生存安全的領域,還逐步擴大到包括文化、社會、科技等多個國家發(fā)展安全的領域;不僅包括傳統(tǒng)安全領域,還包括非傳統(tǒng)安全領域。在涉及國家發(fā)展安全方面,如經(jīng)濟安全、生態(tài)安全等,一定程度上依托于大數(shù)據(jù)安全;在非傳統(tǒng)安全領域,如糧食安全、文化和意識形態(tài)安全、網(wǎng)絡與信息安全等,都涉及或者包含大量的相關行業(yè)、部門、區(qū)域的大數(shù)據(jù)信息,而掌握這些信息,并由此進行梳理、整合、分析,可以得到更有價值涉及國家安全的重要信息或者重要結論、判斷。比如,我們對糧食安全的判斷,可以基于耕地數(shù)據(jù)、氣候數(shù)據(jù)、農(nóng)業(yè)技術數(shù)據(jù)以及農(nóng)產(chǎn)品市場數(shù)據(jù)、主要產(chǎn)糧國家經(jīng)濟政治數(shù)據(jù)等予以推斷;我們對金融安全的判斷,可以基于信息化背景下金融系統(tǒng)大數(shù)據(jù)的分析和研判。因此,大數(shù)據(jù)在一定程度上直接決定了很多國家安全領域重要信息的安全與否。
當前,世界主要國家在數(shù)據(jù)主權上的博弈日趨激烈,發(fā)達國家相繼推出“數(shù)據(jù)治國”戰(zhàn)略并制定發(fā)展規(guī)劃以贏得先機。對此,我們必須未雨綢繆、防患未然,在總體國家安全觀的指引下,認真分析對國家安全可能造成重要影響的大數(shù)據(jù)安全,并有針對性地采取保護措施。
大數(shù)據(jù)時代的泄密風險
隨著時代的發(fā)展,保密管理經(jīng)歷了針對紙質(zhì)文件資料的“三鐵一器時代”、針對電子文件資料的“涉密信息系統(tǒng)管控時代”。這些方式之所以有效,在于找到了紙質(zhì)和電子文件資料泄露的風險點。大數(shù)據(jù)時代,泄密風險發(fā)生了質(zhì)的變化,需要有針對性地研究。
01
大數(shù)據(jù)時代國家重要信息的擁有者和發(fā)布者不斷分散
過去,國家重要信息的擁有者和發(fā)布者主要是國家。大數(shù)據(jù)時代,信息的跨國流動已成為現(xiàn)實,政府不再是信息的唯一擁有者和權威發(fā)布者。全世界單獨的個體被調(diào)動起來形成巨大的合力,足以打破政府對信息的控制。比如,在馬航MH370失聯(lián)事件發(fā)生后,美國數(shù)字地球公司通過Tomnod軟件應用平臺,提供其所匯集的失聯(lián)區(qū)域數(shù)據(jù)和高分辨率衛(wèi)星圖像,邀請來自世界各地的科技志愿者搜索失聯(lián)航班的任何跡象。該平臺共動員了全球800萬志愿者尋找失聯(lián)航班,提供各類信息。不難預見,這種動員能力如果用于針對獲取某個特定國家的國家秘密和重要情報,后果是不可想象的。據(jù)報道,美國數(shù)字地球公司最賺錢的業(yè)務,就是為美國情報界提供相關服務。該公司曾經(jīng)在上述軟件應用平臺推出了一個名為“搜索挑戰(zhàn)”的項目,要求志愿者利用其發(fā)布的高分辨率衛(wèi)星圖像,幫助搜索上千平方公里內(nèi)的軍事飛行器和車輛。值得玩味的是,這個搜索項目的目的并沒有公布。
02
大數(shù)據(jù)時代國家重要信息的存在方式發(fā)生巨大變化
從大數(shù)據(jù)發(fā)展態(tài)勢來看,即將到來的世界是人、機、物融合的三元世界,機中有人、人中有機,物中有機、機中有物的世界已逐步走近我們。隨著人、機、物的相互融合,對不同領域的大數(shù)據(jù)進行跨領域、集成式研究,就有可能推測和判斷國家重要信息。比如,針對某涉密科研院所,通過對研究人員在互聯(lián)網(wǎng)及數(shù)據(jù)庫中的搜索記錄進行分析,可能了解研究課題的主要方面甚至遇到的瓶頸問題;對該院所最近一段時間購買儀器設備記錄進行分析,可能推斷正在進行的課題研究方向甚至進展程度;對該院所研究人員、管理人員的電子郵件進行分析,可能發(fā)現(xiàn)有關項目的協(xié)作配套等信息;從該院所公開的外部人員來訪報道進行分析,可能推測出項目委托方情況;如果可以幸運地侵入該院所實驗設備構成的物聯(lián)網(wǎng)中,獲得產(chǎn)生的實驗數(shù)據(jù),據(jù)此判斷項目進展情況就顯得更加輕而易舉了。也許單一來源的信息可能不會暴露國家秘密或重要情報,但如果像上述分析一樣,可以將某個事件、某個人或者某群體的很多行為,從不同的獨立角度聚集在一起時,信息就有可能被泄露,因為有關這個事件、這個人或者這個群體的數(shù)據(jù)已經(jīng)足夠多。傳統(tǒng)以信息為主要形態(tài)的國家秘密或重要情報,在大數(shù)據(jù)時代發(fā)生質(zhì)的改變。它們不僅簡單地以文件、圖片、資料的形式存在,還可以通過直接或者間接有關的大數(shù)據(jù),經(jīng)過細致的分析、推理和判斷,描繪出其細致輪廓,甚至分毫不差。
此外,部分大數(shù)據(jù)自身就是重要的戰(zhàn)略資源。比如,媒體頻繁披露的境外機構、人員在我境內(nèi)實施非法測繪活動,其目的就是獲取我國家基礎地理信息數(shù)據(jù);再如,媒體曾報道美籍華人薛峰實施非法竊密活動的主要目標就是我油氣資源數(shù)據(jù)。其他譬如氣象數(shù)據(jù)、基因數(shù)據(jù)等,也是境外非法獲取的重點目標。
03
大數(shù)據(jù)時代獲取國家秘密和重要情報的渠道不斷增多
近年來,境外非法獲取國家秘密和重要情報的方式日趨多樣,大數(shù)據(jù)分析重要性顯著上升。《參考消息》2014年11月24日報道,據(jù)美國情報系統(tǒng)的研究,所有情報中有90%來自公開渠道,只有10%是通過秘密管道獲取。顯然,大數(shù)據(jù)分析功不可沒。
觀察各種復雜系統(tǒng)得到的大數(shù)據(jù),直接呈現(xiàn)出來的往往是一個個孤立的數(shù)據(jù)和分散的鏈接,但這些反映相互關系的數(shù)據(jù)和鏈接整合起來就是一個網(wǎng)絡。大數(shù)據(jù)往往以數(shù)據(jù)和鏈接背后復雜的關系網(wǎng)絡予以存在。大數(shù)據(jù)分析給竊取國家秘密和重要情報提供了重要依循,通過對數(shù)據(jù)背后的網(wǎng)絡進行查找、分析和挖掘,基于相互關系分析基礎上進行預測即可獲得或者推斷有關信息。此外,對于已經(jīng)獲得的國家秘密和重要情報,還可以通過大數(shù)據(jù)分析的方式,印證信息的準確與否。比如,對于一些重大涉密會議、活動安排,可以通過組織人員、已知參加人員的即時通訊記錄、電子郵件記錄數(shù)據(jù),有關機場、火車站的調(diào)度安排、警衛(wèi)情況數(shù)據(jù),賓客下榻酒店客房、餐飲準備數(shù)據(jù)等大概分析出會議、活動參加人員、行程、議題等內(nèi)容,而不必一定拿到會議、活動安排方案。再比如,對于一些涉密的軍隊調(diào)動情況,通過相關地區(qū)的攝像頭監(jiān)控網(wǎng)絡數(shù)據(jù)、有關機場或火車站的調(diào)度數(shù)據(jù)、有關軍隊飲食供應站情況數(shù)據(jù),如果再增加一些沿途網(wǎng)民上傳的照片、消息等數(shù)據(jù),將會準確掌握軍隊調(diào)度的路線、規(guī)模甚至目的等重要信息。
04
大數(shù)據(jù)分析獲取國家秘密和重要情報成為常態(tài)
大數(shù)據(jù)分析不同于傳統(tǒng)的邏輯推理研究,而是通過將海量碎片化的數(shù)據(jù)匯聚到一起,積少成多,再進行統(tǒng)計性的搜索、比較、聚類、分類等分析歸納,在碎片化的數(shù)據(jù)之間建立某種整體聯(lián)系,就有可能挖掘出隱藏在大數(shù)據(jù)背后的重要信息。因此,大數(shù)據(jù)分析具備了從大量不敏感信息中發(fā)現(xiàn)國家秘密和重要情報的能力,日益成為境外情報機關搜集信息不可或缺的重要渠道。
美國國家安全局長期對全球通信系統(tǒng)和互聯(lián)網(wǎng)進行大數(shù)據(jù)采集、挖掘和分析,從中搜集他國國家秘密和重要情報信息。斯諾登曝光的美國國家安全局實施的棱鏡計劃(PRISM),顯示出美國情報機關較早便采用大數(shù)據(jù)分析方式獲取情報,甚至可以說美國情報機關具有瘋狂獲取大數(shù)據(jù)的特殊癖好。棱鏡計劃監(jiān)視范圍很廣,參與的公司包括微軟、雅虎、Google、Facebook、Paltalk、YouTube、Skype、美國在線、蘋果公司等;采集的數(shù)據(jù)范圍很廣,包括日志數(shù)據(jù)、社交網(wǎng)絡數(shù)據(jù)、過程行為數(shù)據(jù)、傳感網(wǎng)絡數(shù)據(jù)、智能終端數(shù)據(jù)等,可以監(jiān)控包括電子郵件、即時消息、視頻、照片、存儲數(shù)據(jù)、語音聊天、文件傳輸、視頻會議、登錄時間和社交網(wǎng)絡資料等信息。
臺灣地區(qū)情報機關也在強化運用大數(shù)據(jù)分析方式獲取大陸情報。2015年,媒體曝光了臺“國安局”建構了運用大數(shù)據(jù)概念的“輿情監(jiān)控系統(tǒng)”對大陸搜集情報,可同時搜集超過200個網(wǎng)站、1000個網(wǎng)頁,并對海量網(wǎng)絡數(shù)據(jù)進行自動分析、存取。據(jù)《環(huán)球時報》報道,早在2007年,臺灣地區(qū)情報機關已對我政府和軍隊以及國防科研機構、軍工企業(yè)網(wǎng)絡實施大規(guī)模的網(wǎng)絡攻擊行動,受攻擊單位遍及我絕大部分省、自治區(qū)、直轄市,還包括我十幾個駐外機構。臺灣地區(qū)網(wǎng)絡間諜李芳榮案中被控制的電腦和網(wǎng)絡達數(shù)百個,竊密內(nèi)容涉及政治、軍事、外交、經(jīng)濟、醫(yī)療衛(wèi)生等多個領域。不難看出,此類網(wǎng)絡攻擊的動機就是竊取目標用戶的海量數(shù)據(jù),作為大數(shù)據(jù)分析竊密的基礎。
大數(shù)據(jù)時代的風險防范
習近平總書記強調(diào),要切實保障國家數(shù)據(jù)安全。要加強關鍵信息基礎設施安全保護,強化國家關鍵數(shù)據(jù)資源保護能力,增強數(shù)據(jù)安全預警和溯源能力。要加強政策、監(jiān)管、法律的統(tǒng)籌協(xié)調(diào),加快法規(guī)制度建設。大數(shù)據(jù)時代的到來,必將推動保密管理又一次產(chǎn)生新的革命性變革,直接對保密的方式、要求和標準產(chǎn)生質(zhì)的影響。對大數(shù)據(jù)時代的泄密風險防范,我們必須進行深入研究,切實采取有效措施以應對這一重大變革。
01
從過去的信息保密為主轉變?yōu)閿?shù)據(jù)、信息保密并重
數(shù)據(jù)是信息的載體,信息是數(shù)據(jù)的內(nèi)涵。數(shù)據(jù)的價值不只限于特定的用途,它既蘊含我們所需要的信息,也包羅我們尚未發(fā)現(xiàn)的信息。判斷數(shù)據(jù)的價值需要考慮到未來它可能被使用的各種潛在方式,而非僅僅考慮它目前的用途。大數(shù)據(jù)時代告誡我們,不能把眼光僅僅局限在涉密信息的安全上,還要考量能夠直接獲得或者推測判斷出涉密信息的基礎數(shù)據(jù)的安全。要充分認識這些基礎數(shù)據(jù)的基本價值和潛在價值。需要注意的是,大數(shù)據(jù)時代的一個突出特點是,非結構化數(shù)據(jù)的比例要遠遠高于結構化數(shù)據(jù)或半結構化數(shù)據(jù)。不論是結構化數(shù)據(jù)、半結構化數(shù)據(jù),還是非結構化數(shù)據(jù),這些數(shù)據(jù)都具有顯性或者隱性的網(wǎng)絡化存在,使得數(shù)據(jù)之間的復雜關系無所不在,一旦忽視其中的重要環(huán)節(jié),就有可能導致重要情報的泄露。因此,大數(shù)據(jù)時代給我們的第一個挑戰(zhàn)就是,對于關系國家安全和利益的數(shù)據(jù)進行準確的判斷和篩選,既要注意各類結構化、半結構化數(shù)據(jù),也需要考慮容易引起忽視的非結構化數(shù)據(jù)。
02
從過去的嚴防死守為主轉變?yōu)轭A防為先、攻防結合
過去我們對國家秘密信息的保護,往往是通過切斷或者減少信息傳播的途徑來實現(xiàn)的,比如知悉范圍的最小化、信息設備的物理隔離等。大數(shù)據(jù)時代下,這樣的方式顯得力所不及。大數(shù)據(jù)分析的優(yōu)勢和缺陷是一致的,即通過大數(shù)據(jù)綜合分析可以得到有效信息的前提是,用于分析的數(shù)據(jù)“噪聲”比較少,即虛假或者無用數(shù)據(jù)相對較少。大數(shù)據(jù)分析的真正意義在于對數(shù)據(jù)進行分析之后產(chǎn)生的價值,因此數(shù)據(jù)的可靠性和準確性是實現(xiàn)價值的關鍵因素。關于大數(shù)據(jù)的一個普遍觀點是,數(shù)據(jù)自己可以說明一切,數(shù)據(jù)自身就是事實。但是,成也蕭何,敗也蕭何,如果對基礎數(shù)據(jù)不仔細甄別,數(shù)據(jù)也會欺騙。正如由于網(wǎng)絡刷單的存在,我們現(xiàn)在已經(jīng)越來越難地從電商賣家的銷售數(shù)量中判斷該賣家的信譽和貨品的質(zhì)量;我們也很難通過點評網(wǎng)站上用戶的點評,判斷某家餐館的菜品質(zhì)量。因此,為了保護一些關系國家安全和利益的大數(shù)據(jù),我們可以人為地制造“噪聲”,使其無法或者很難從真假混雜的大數(shù)據(jù)中提取出有效的數(shù)據(jù)。通過偽造或者刻意制造的數(shù)據(jù),可以引導分析者得到錯誤的結論,誘導分析者獲取不實的信息。
03
準確、合理、有區(qū)分地判斷數(shù)據(jù)的保密、共享與公開
大數(shù)據(jù)時代開啟了一場尋寶游戲,不同的人對大數(shù)據(jù)的因果關系有不同的理解,不同的人也就可以在浩瀚的大數(shù)據(jù)中挖掘不同的寶礦。2015年8月,國務院常務會議通過《關于促進大數(shù)據(jù)發(fā)展的行動綱要》,提出要推動政府信息系統(tǒng)和公共數(shù)據(jù)互聯(lián)共享,深化大數(shù)據(jù)在各行業(yè)創(chuàng)新應用。由此可見,通過大數(shù)據(jù)的共享共用,實現(xiàn)對各方面事業(yè)的巨大推動作用,是當前經(jīng)濟社會發(fā)展的一個重要著力點。恰當?shù)乜刂拼髷?shù)據(jù)可能造成的危害和充分地利用大數(shù)據(jù)共享所產(chǎn)生的巨大成效,是擺在大家面前的一項重要抉擇。在國家大數(shù)據(jù)戰(zhàn)略背景下,需要我們認真地研究大數(shù)據(jù)互聯(lián)共享可能造成的潛在危害,并根據(jù)實際妥善采取相應的方式,有效地控制這種危害的產(chǎn)生。要堅持大數(shù)據(jù)互聯(lián)共享為原則,關系國家安全和利益的數(shù)據(jù)保密為例外,把必須保密的數(shù)據(jù)控制在最小的知悉范圍,適當限制可能危害國家安全和利益數(shù)據(jù)的共享,密切關注公開的大數(shù)據(jù)并能在一旦發(fā)生危害國家安全情況下,采取必要的應急處置措施,這應當是我們面對大數(shù)據(jù)保密、共享與公開應有的態(tài)度。
習近平總書記強調(diào),善于獲取數(shù)據(jù)、分析數(shù)據(jù)、運用數(shù)據(jù),是領導干部做好工作的基本功。各級領導干部要加強學習,懂得大數(shù)據(jù),用好大數(shù)據(jù),增強利用數(shù)據(jù)推進各項工作的本領,不斷提高對大數(shù)據(jù)發(fā)展規(guī)律的把握能力,使大數(shù)據(jù)在各項工作中發(fā)揮更大作用。大數(shù)據(jù)時代的到來,對保密工作而言是挑戰(zhàn)也是機遇,需要我們站在更高更廣的層面,系統(tǒng)研究保密的范圍以及保密工作的對象、方式,實現(xiàn)保密工作在大數(shù)據(jù)時代的轉型升級。學好大數(shù)據(jù)這門必修課,應當成為每一位保密工作者的基本功。