“大數據”一詞來自于未來學家托夫勒于1980年所著的《第三次浪潮》。而最早開始對大數據進行應用探索的是全球知名咨詢公司麥肯錫,2011年6月,麥肯錫公司發布了一份關于“大數據”的報告,該報告稱:隨著互聯網的高速發展,全球信息化不斷推進,數據將滲透到當今每一行業和業務職能領域,成為重要的生產因素。人們對于海量數據的挖掘和運用,預示著新一波生產率增長和消費盈余浪潮的到來。
的確如麥肯錫所說,國際數據公司(IDC)的研究結果表明,2008年全球的數據量為0.49ZB,2009年的數據量為0.8ZB,2010年增長為1.2ZB,2011年數量更是高達1.82ZB,相當于全球每人產生200GB以上的數據。而整個人類文明所獲得的全部數據中,有90%是過去幾年內產生的。到2020年,全世界所產生的數據規模將達到今天的44倍。
數據如同一把雙刃劍,在帶來便利的同時也帶來了很多安全隱患
數據對于互聯網服務提供者而言具備了更多的商業價值,但數據的分析與應用將愈加復雜,也更難以管理。如同一把雙刃劍,數據在帶來許多便利的同時也帶來了很多安全隱患,個人隱私無處遁形。回顧2014年,全球各地用戶信息安全事件頻出:
2014年3月22日“攜程網”出現安全支付日志漏洞,導致大規模用戶信息如姓名、身份證號、銀行卡類別、銀行卡卡號、銀行卡CVV等信息泄露。
2014年5月13日,小米論壇用戶數據庫泄露,涉及約800萬使用小米手機、MIUI系統等小米產品的用戶,泄露的數據中帶有大量用戶資料,可被用來訪問“小米云服務”并獲取更多的私密信息,甚至可通過同步獲得通信錄、短信、照片、定位、鎖定手機及刪除信息等。
2014年12月2日 烏云漏洞平臺公開了一個導致“智聯招聘網”86萬用戶簡歷信息泄露的漏洞。黑客可通過該漏洞獲取包含用戶姓名、婚姻狀況、出生日期、出生日期、戶籍地址、身份證號、手機號等各種詳細的信息。
2014年12月25日,12306網站用戶數據信息發生大規模泄露。
2014年8月 蘋果“iCloud服務”被黑客攻破,造成數百家喻戶曉的名人私密照片被盜。
……
這些信息安全事件讓人們開始感受到“數據”原來與我們的生活接觸如此緊密,數據泄露可以對個人的生活質量造成極大的威脅。
大數據時代,如何構建信息安全體系,保護用戶隱私,是企業未來發展過程中必須面對的問題。安全技術水平的提高、法律法規的完善、以及企業和個人用戶正視數據的運用的意識缺一不可。
數據安全技術是保護數據安全的主要措施
在大數據的存儲,傳輸環節對數據進行各種加密技術的處理,是解決信息泄露的主要措施。對關鍵數據進行加密后,即使數據被泄漏,數據的盜取者也無法從中獲得任何有價值的信息。盡管對于大數據的加密動作可能會犧牲一部分系統性能,但是與不加密所面臨的風險相比,運算性能的損失是值得的。這實際上是企業管理和風險管理間的協調,重要的是企業要有將信息安全放在第一位的理念。
目前數據加密保護技術主要包括:數據發布匿名保護、社交網絡匿名保護、數據水印等幾種。此外,除了對數據進行加密處理以外,也有許多可以運用在數據的使用過程,以及發生數據泄露之后的相關保護技術,比如:風險自適應的訪問控制、數據溯源等,這些技術可以有效地降低數據安全事故帶來的損失。
1、數據發布匿名保護技術
數據發布匿名保護技術是對大數據中結構化數據實現隱私保護的核心關鍵與基本技術手段。能夠很好地解決靜態、一次發布的數據隱私保護問題。
2、社交網絡匿名保護技術
社交網絡匿名保護技術包括兩部分:一是用戶標識與屬性的匿名,在數據發布時隱藏用戶的標志與屬性信息;二是用戶間關系的匿名,在數據發布時隱藏用戶之間的關系。
3、數據水印技術
數據水印是指將標識信息以難以察覺的方式嵌入在數據載體內部且不影響其使用方法,多見于多媒體數據版權保護,也有針對數據庫和文本文件的水印方案。
4、風險自適應的訪問控制
風險自適應的訪問控制是針對在大數據場景中,安全管理員可能缺乏足夠的專業知識,無法準確的為用戶指定其可以訪問的數據的情況。
5、數據溯源技術
數據溯源技術目標是幫助人們確定數據倉庫中各項數據的來源,也可用于文件的溯源于恢復,基本方法即標記法,比如通過對數據進行標記來記錄數據在數據倉庫中的查詢與傳播歷史。
政策法規的完善是構建信息安全環境的重要保障
除了技術以外,政策和立法才是大數據時代個人隱私保障的重要憑借。近年來我國在互聯網信息安全領域出臺了若干政策法規。2012年12月28日,《全國人民代表大會常務委員會關于加強網絡信息保護的決定》審議通過。2013年,工信部根據全國人大的決定,出臺了關于互聯網和電信網個人信息保護的條例,提出了數據保護的一系列要求。
大數據時代,各方都在挖掘數據的商業價值,數據不僅僅需要保護,將來會有越來越多的數據交易商業活動。大數據的保護與交易需要遵循什么樣的標準,是當前政策制定者面臨的挑戰。有價值的數據是非常重要的資源,但前提是要建立交易規則。我國的幾大互聯網運營企業都在做大數據分析,并且都想把數據作為可交易的產品,這需要我們盡快建立數據交易有關的法律法規。
當然,標準和政策的制定是不斷摸索的過程,需要隨著市場去探索,深度地介入到關于目前國內數據交易的活動中,去探討這方面的政策、標準制定。
企業的大數據運用理念和個人用戶數據安全意識是構建信息安全環境的基礎
事實上,真正好用的大數據技術,應該是對數據進行加工,分析挖掘其中的價值,并以此來指導決策,而非販賣用戶個性化隱私這種原始數據信息本身的次層次濫用。企業在對大數據的利用過程中,應該只針對群體,而不針對個體的信息挖掘,這是應遵循的基本原則。
而對于用戶來說,提高信息安全意識、注意個人隱私保護也十分重要。不過,鑒于大數據時代個人隱私保護的困難程度,已有專家提出了“遺忘”的必要性。牛津大學教授、大數據領域權威專家維克托就在他的著作《刪除》中表示,對于人類而言,遺忘一直是常態,而記憶才是例外。