大數據模糊了涉密與非涉密數據的界限,顛覆了數據垃圾無秘密的傳統認識,打破了以客觀存在為基礎的定密習慣。因此,稍有疏忽便有可能引發泄密事件,保密工作者應高度警惕。
大數據暗藏“竊密通道”
從非涉密數據中發現涉密信息。大數據基本理論告訴人們:“如果將海量的碎片化數據匯聚到一起,積少成多,形成大數據,然后通過數據分析,就可挖掘出隱藏在大數據表象背后的重要價值。”這一理論啟示人們:如果將海量多元的非涉密數據通過大數據技術進行關聯分析,在碎片化的信息之間建立某種整體聯系,就可挖掘出隱藏在非涉密數據背后的重要價值。而這種“價值信息”因具有價值屬性很可能涉及秘密范疇,從而使大數據具備了從非涉密數據中發現涉密信息的能力。比如,早些時候曝光的“棱鏡”“X關鍵分”等美國網絡監控計劃已經充分表明,美國情報機構早已與“八大金剛”等網絡巨頭緊密合作,對全球通信系統和互聯網進行大數據采集、挖掘和分析,從中搜集他國國家秘密和情報信息。因此,如果將非涉密數據置于一種失管失控的狀態,就容易被不法分子輕易獲取并從中發現有用情報。
使數據垃圾顯現涉密價值。大數據基本理論告訴人們:“數據的價值并不僅限于特定的用途,它可以為了同一目的而被多次使用,也可以用于其它目的;判斷數據的價值需要考慮到未來它可能被使用的各種潛在方式,而非僅僅考慮其目前的用途。”比如,在英國學者舍恩伯格所著《大數據時代》一書中,有一則關于“莫里的導航圖”案例,就是運用數據垃圾再利用的典型案例。該案例講述的是年輕的航海家馬修·方丹·莫里利用庫房里存放的航海書箱、陳舊的地圖和圖表,以及多年前海軍上尉寫的大量航海日志制作全新航海圖的故事。雖然莫里能夠接觸到的航海日志都是陳年舊貨,內容上也無章可循,但莫里和他的助手硬是把看似垃圾的航海日志繪制成表格并重新利用,成功創建了一張全新的更安全、更有效的航海圖,取得了空前成功。由此可見,大數據再利用技術能夠使所謂的數據垃圾釋放新的能量,重現新的價值,這種價值一旦具有涉密屬性,就會使數據垃圾顯現涉密價值。
提前感知涉密事項的趨勢與未來。基于相關關系分析基礎上的預測是大數據的核心。A增長的同時B也增長,A降低的同時B也降低,在擁有海量A數據的基礎上,就可以利用大數據技術捕捉B的現在和預測B的未來。舍恩伯格在《大數據時代》中提到,麻省理工學院兩位經濟學家通過一個軟件在互聯網上每天收集50萬種商品的價格信息,然后把大數據和好的分析法相結合,就能比官方數據提前一步發現通貨緊縮趨勢。這種趨勢涉及國家經濟發展大局和未來走向,提前一步發現就是相當于掌握了核心機密。由此可見,大數據預測功能使人們有能力提前一步感知到涉密事項的發展趨勢和未來狀態,這一功能如果被不法分子利用,就可能演變為一種新型的竊密手段。
堵住大數據“竊密通道”刻不容緩
改變對待非涉密數據和數據垃圾的傳統處理方式。大數據時代,非涉密數據、數據垃圾與涉密數據一樣,具有特有的價值和可能的涉密屬性。這就啟示保密工作者不能再像以往一樣把眼光局限在涉密數據上,而應在緊盯涉密數據的基礎上,清醒地認識到非涉密數據以及數據垃圾存在的泄密風險。要充分認識到,包括數據墳墓、數據孤島、數據垃圾、由涉密數據解密形成的非涉密數據、自然形成的非涉密數據在內的所有數據,都有其基本價值和潛在價值,都有可能是挖掘涉密信息,感知涉密事項趨勢和未來的基礎原料。保密工作者在處置非涉密數據和數據垃圾時,再也不能把非涉密數據絕對性地界定在涉密范疇之外,使其脫離了保密視線,也不能一味地把數據垃圾當作廢棄物拋棄;相反,要采取有效措施,防范非涉密數據或數據垃圾成為失密泄密的新源頭。
打破涉密數據以時長作為解密條件的傳統標準。無論是《中華人民共和國保守國家秘密法》,還是《中國人民解放軍保密條例》,對于秘密的管理都是以時長作為涉密信息定解密的一條主要標準。然而,在大數據背景下,涉密數據不僅具有基本價值,還具有潛在價值,僅僅依靠時間來判斷涉密數據是否仍有使用價值和保密需要是遠遠不夠的,因為保密期限的屆滿并不能完全代表涉密數據已經沒有任何使用價值。因此,要打破涉密數據以時長作為解密條件的傳統標準,引入價值判斷這一新標準,將兩者有效結合起來。在傳統時長標準的前提下,組織專業的大數據公司和數據科學家,依托科學合理的應用模型,審核即將到期解密的涉密數據,判斷涉密數據的有用性和價值殘留,在此基礎上,再來確定涉密數據是否按期解密。
嚴格把控大數據的共享共用。2015年8月,國務院常務會議通過《關于促進大數據發展的行動綱要》,提出要推動政府信息系統和公共數據互聯共享,深化大數據在各行業創新應用。由此可見,在大數據時代,非涉密數據共享共用,充分挖掘數據價值將成為數據運用的新常態。但同時要看到,大數據模糊了涉密與非涉密數據的界限,并能運用預測功能從非涉密大數據中感知秘密的未來,這就要求將非涉密數據控制在一定的知悉范圍內,防止過度擴散。這樣做,又不可避免地會在一定程度上對數據運用產生反作用力。可見,恰當地平衡好兩者的關系是必須解決的問題。保密工作者要認識到非涉密數據共享共用不是無原則濫用,共享是有條件的,共享共用的數據必須是非涉密或公開后帶來的風險隱患是在可控范圍內;而保密是無條件的,數據的共享共用必須確保其涉密內容的絕對安全。要做到既不因為數據共享共用而降低保密要求,也不能片面追求絕對安全而阻礙了大數據應有作用的發揮。