現在我們都在談論大數據和云計算,而我們在談論的過程當中有一點是無論如何也繞不開的,那就是數據的安全。隨著棱鏡門事件的發生,使得政府和用戶對于數據安全的關注程度達到了一個前所未有的高度。
而在我們談論大數據的時候也有很多人說大數據和用戶隱私本身就是完全對立的兩個事物,不單是我們現在的工作還是生活當中,隨處可見我們的信息被他人竊取和盜用,那么這類問題如何杜絕?實際的大數據應用本該如此嗎?本期我們就來聊聊。
大數據和用戶隱私這兩個事物,其實我們現在所謂的用戶隱私在技術層面就是加密技術,大數據負責收集、存儲和分析工作,而用戶隱私也在這層層分析當中被暴露出來。
數據加密是必經路?
曾經有一批美國科學家在針對大數據技術和用戶隱私之間進行分析時指出,加密功能是必須要走的路,如今,在社交網絡和其它的公共網站上,可以免費獲得大量關于個人的數據,任何一個想要做壞事的人都可以從任意數量的在線資源通過交叉引用來建立關于他們的目標的輪廓。
這種實際的努力通常是指所謂的“同態”加密,這使得它可以在不先對加密數據解密時而執行對加密數據的計算。20世紀70年代末,研究者一直強調完全同態加密是可能的,所謂的完全同態加密是指,在加密過程中,可以對信息以任意種方式進行切片或切塊,而同時不顯示實際的數據。這種系統可能對云計算特別有利,因其提供了一種分析信息的方法,這種方法對信息提供者來說有最小的隱私風險。
IBM公司的研究人員曾經表示,其實早在2009年計算機科學家們就已經開發出了一個非常實用的完全同態的系統,這項復雜的系統成果不僅能夠對于數據進行完全的分析和處理,同時還能夠在數據安全層面上升一個檔次。
CryptDB項目全揭秘
所謂的CryptDB項目,其實就是用創新的方式來對數據進行加密處理,從而完善用戶在云端的各類使用需求。這個系統通過將請求數據的軟件和存儲加密數據的數據庫之間放置一個代理服務器,來保證對加密數據的分析。 這個代理使用旨在比較和分析加密信息的算法,在某些情況下,代理需要去除不同的加密層來更好的分析數據。
據了解,谷歌是該技術的一大支持者,并使用它在其基于云計算的、搜索大量數據集的BigQuery服務中提供加密查詢。增加一個額外的設備,比如在搜索和檢索過程中的代理服務器,通常會減慢速度。
擺脫對加密的“依賴”
我們是時候擺脫單純的對數據加密技術的依賴了,這種所謂的擺脫并不是用戶不再需要加密技術,而是我們應該將數據安全的主動權掌握在自己的手里,其實目前這種想法是可以實現的。
有差異的隱私是一種替代的匿名數據,用這種方法能夠強化數據管理者對于數據安全的把控和使用,能夠在數據提供者提供數據信息的時候將數據進行集中隱私保護,相當于從一開始用戶的數據就被很安全的保護起來了。
差異化的私人數據發布算法允許研究人員提問關于有敏感信息數據庫的任何問題,同時提供經過模糊化處理的答案,因此,實際上不會暴露任何私人數據。
編輯的話
數據是當前這個時代最有價值的東西,不單是對于企業用戶,對于像我們這種個人用戶也同樣具有很高的利用價值,對于當前數據安全關注程度不斷提高的事實用戶該如何把控自己數據的安全問題就變得尤為重要了,同時對于企業來說,對于平臺上各類數據的管理、分類和保護也正在上升一個層次。