[如果現有大數據能夠被利用,將至少帶來3萬億美元的收益。當入網連接增至“千億”,其產生的網絡價值將有可能是現在的百倍以上。對于業界而言,迫切需要找到安全、規范的大數據使用方式,開發其紅利]
“如果擔心被發現,最好不要去做這件事。”谷歌公司高管這樣回答關于防止隱私泄露的詢問。
在《第一財經日報》記者參加的2014年中國計算機大會(CNCC2014)上,來自科研院所、安全廠商的資深安全專家紛紛聚焦“信息安全”,不過,沒有專家能確保“絕對”的“信息安全”。
“過去,隱私保護的研究主要在小數據集上,模糊化、匿名化、加密和密碼保護都是防止隱私泄露的常用技術。現在大規模數據采集技術、新型存儲技術、高級分析技術,都使得隱私保護面臨巨大挑戰。”中國人民大學信息學院教授孟小峰在上述論壇上表示。
傳統手段已失效
我國IMT2020(5G)推進組預測,到2020年,全球移動終端(不含物聯網設備)將超過100億,2020年全球移動數據流量將比2010年增長200倍。到2030年,“萬物互聯”的時代全面到來,全球物聯網連接數將達到1000億,移動數據流量將比2010年增長近2萬倍。
過去兩年,全球積累的數據量就已經超過了以往人類所有歷史的總和,讓過去基于小數據集的隱私保護技術難以應付。
“大數據的廣度帶來了多元技術的融合,使得傳統的模糊化技術、匿名技術幾乎無法生效,大數據的深度帶來了實時分析,使得傳統加密和密碼技術遇到巨大的瓶頸。”孟小峰說。
孟小峰舉例說,移動軌跡通常蘊含著豐富的個人敏感信息,例如家庭住址和行為模式,而在每150萬條個人移動軌跡數據中,在不依賴外部背景知識前提下,只要隨機給出2個時空數據點,就可以甄別出50%的個人移動軌跡。隨機給出4個數據點,被甄別出的幾率可達到95%。基因數據中隱藏著個人疾病情況,根據美國一項研究,對20萬名志愿者基因信息進行匿名化處理,然而通過把志愿者的匿名數據和美國公眾選民信息融合,可甄別率達到了84%~87%。
設備、應用爆炸式增長的當下,用戶也很難察覺自己何時、何地泄露了何種信息。
360首席隱私官譚曉生表示,在新的技術環境下,網絡的邊界已變得模糊,“一切都可能成為被攻擊對象。”
“很不幸,昨天我聽說360安全服務器也被攻破,對搞安全的人來說,這一點都不奇怪。今年我們實現了對特斯拉的破解,公布的是開了車門、開了車廂,沒有告訴大家的是,我們把引擎‘打著了’,車是可以開走的。我們把漏洞通報給了特斯拉,他們的人當天下午就飛回了總部。”譚曉生說。
“萬物互聯,它的脆弱性是怎么引進的?能不能徹底解決?如果不能徹底解決,能不能有減弱它的辦法?很遺憾,這是由我們當下計算機體系結構的脆弱性造成的,我們只能想辦法讓它發生得少一點,或者發生了危害會小一點。”譚曉生說。
新技術和立法
大數據帶來信息安全問題的同時,也潛在著巨大的經濟價值。根據麥肯錫的分析,如果現有大數據能夠被利用,將至少帶來3萬億美元的收益。當入網連接增至“千億”,其產生的網絡價值將有可能是現在的百倍以上。對于業界而言,迫切需要找到安全、規范的大數據使用方式,開發其紅利。
“互聯網帶來的紅利是讓信息流動更便捷,信息變得對稱。當我們試圖采用加密技術、隔離技術保障安全的時候,這和互聯網本質是違背的,所以國內數據防泄露幾乎走不下去。”譚曉生說。
譚曉生介紹,360希望促使技術人員報告漏洞,“不要害怕去報漏洞,公開漏洞是逼迫開發者把漏洞去掉。”另外,譚曉生也認為需要提升基本安全能力,“已知的大量漏洞是因為程序員不懂安全,現在電路板設計基本沒有防止非法調試,45分鐘破解22種設備,就是在電路板串口上調試,知道漏洞后就開始竄改。”
在孟小峰看來,大數據時代的安全理論應該有相應變革,“從過去建立在被動保護基礎上的理論體系,演變成具有主動保護模式的隱私管理框架。而不能出現了什么泄露問題,有了矛再去構建盾。”
中國工程院院士鄔江興認為,建筑在圖靈可計算理論、馮諾依曼結構上的計算機體系,在功耗、效能、安全等多方面都面臨瓶頸。鄔江興提出擬態計算、擬態安全理論,通過系統結構創新來改進現有計算機體系,“把動態性、隨機性、多樣性導入計算機,增量改造芯片、操作系統、軟硬件,構建擬態芯片、操作系統、防御體系。”
除了技術上的創新,在一些專家看來,國家亟須對大數據利用加以立法規范。北京郵電大學互聯網治理與法律研究中心主任李欲曉認為,在信息網絡環境下,個人信息及隱私等都具有了財產屬性,以營利為目的的企業可能會對存儲于云端的隱私等信息進行商業化利用,造成用戶的隱私泄露。國家應將個人信息保護納入國家戰略資源的保護和規劃范疇,制定相關行業標準,并通過立法防范侵權行為。