“我點擊了自己的名字,頁面上出現了一張熟悉的照片是我穿著一件藍色襯衫的照片,旁邊配有我的基本履歷資料……我點開了一個最近更新的鏈接,地點是波士頓的馬薩諸塞大街……兩秒鐘后,我在視頻中看到了自己推開了地鐵站那厚重的大門……每次看到自己出現在視頻中,我都會渾身不自在。但現在可好,我的一舉一動已經被LifeLinear網的系統給記錄了下來……”
以上是出自美國作家艾伯特-拉斯洛·巴拉巴西今年的新書《爆發》中的片段,其中出現的能夠每時每刻記錄人們行蹤的“LifeLinear系統”只是作者杜撰出來,并非真實存在。但是作者同時認為,在科技發達的今天,借助大數據的平臺,“LifeLinear系統”并非不能實現。這樣的場景又讓人毛骨悚然:如果真有這樣一套系統面世,我們的隱私豈不是要暴露在光天化日之下?大數據堪稱一把雙刃劍。不論是企業還是個人,都會因大數據的爆發獲益匪淺,但同時個人隱私也無處遁形。隨之而來的問題是:這些數據應當屬于誰?誰有權利利用這些數據進行分析?這種利用能否有個限度?
大數據改變世界
大數據概念相對“年輕”,但是對于很多人并不陌生。數據的爆發歸功于社交網絡、電子商務和物聯網的快速發展。以前,人們只是將上網當做娛樂方式之一,現在,人們更多的是生活在網絡平臺上。這使得每18個月,數據量就會翻一番。海量數據的影響力是不可小覷的。麻省理工學院斯隆管理學院的經濟學教授埃里克·布呂諾爾夫松(Erik Brynjolfsson)曾經指出,在商業、經濟及其他領域中,決策行為將日益基于數據和分析而作出,而并非基于經驗和直覺。“我們的決策能夠開始變得更加科學化。”他這樣說。
越來越多的企業希望借助數據存儲、數據分析等為自身帶來更多利益。最典型的一個案例就是,華爾街有炒家利用電腦程序分析當時全球3.4億微博賬戶的留言來判斷民眾情緒,再以1到50為其打分,根據分數高低處理手中的股票。判斷原則很簡單:如果多數人表現興奮,那就買入;如果大家的焦慮情緒上升,那就拋售。這一數據分析軟件幫助該炒家在今年第一季度獲得了7%的收益率。
當然,消費者也會享受到更方便和更具個性化的服務。網購狂人李雪(化名)每天早上打開郵件,首先映入眼簾的就是各大電子商務網站發出的訂閱郵件和個性化推薦的郵件,著實方便了她在網上進行目標性極強的有選擇的“掃蕩式”購物。這是商家根據對用戶的頁面停留時間、瀏覽與購買商品的分類等數據的分析作出的推薦。
另外,還可以通過數據分析來為人們的提供健康保障。總部位于美國加州的醫療管理財團Kaiser Permanente,收集并分析所有的臨床分析和成本數據,發現了美國默沙東公司的神經和肌肉、骨骼系統藥“萬絡”能夠引發心臟病的副作用,最終成功使其退出市場。《爆發》一書中提出,如果大數據被充分利用,在流行病的控制等方面也會發揮奇效。
誰來掌控屬于你的大數據
每個人都期待獲得個性化服務。但是,在大數據時代,想要獲得個性化服務,就一定會在某種程度上犧牲自己的隱私。
當你在使用電子郵件、社交網絡的時候,你大概也會知道你的信息正在被記錄下來,你發表的言論或者分享的照片、視頻等都決定著互聯網運營商即將向你推薦什么樣的資源和廣告;當你拿著iPhone滿世界跑的時候,蘋果早已通過定位系統把你的全部信息收羅在自己的數據庫里,利用這些信息來構建地圖和交通信息等;當你在享受著視頻監控帶來的安全感的同時,別忘了你也是被監控的一分子,你的一舉一動都會暴露在鏡頭下面;你用手機通話時,運營商不僅知道你打給誰,打了多久,還知道你是在哪里進行的通話。
以前,這些記錄幾乎不會對普通人造成影響,因為它的數量如此巨大,除非刻意尋找,人們不會注意其中的某些信息。但是,隨著大數據技術的不斷進步,這一狀況正在發生改變。本文之前提到的懸而未決的問題隨之而來,造成了很多尷尬的局面。例如,Facebook公司內部的科學家已經利用這些數據進行了大量研究并發表了超過30篇論文,但Facebook顧慮到隱私問題,并未公布原始數據,使得這些論文無法被業界承認并應用在廣泛的社會學和心理學領域。同時,外界的研究者苦于沒有數據,進行相關研究時遠遠沒有Facebook得心應手。今年8月,Facebook公司表示正計劃向社會學家開放有限的數據訪問權限,這又會帶來更多爭議。此外,谷歌也和美國政府就數據利用問題產生了多次沖突。美國政府以各種理由不斷要求谷歌提供用戶數據并時常遭到谷歌拒絕。同時,美國政府也對街景等應用進行調查,限制谷歌收集更多數據以制衡谷歌。
微軟研究院的高級研究員博伊德(Danah Boyd)曾經表示:“如今,我們社交網絡化的社會絕對有制造恐慌的天分。在大數據時代,對隱私泄露的擔憂就是強大的緊張和焦慮的源泉。人們普遍認為,最令人焦慮的在于你根本不知道什么時候自己的隱私就無意中被泄露出去。”她認為,這并不是我們希望建立的社會。
人們最擔心的,是對這種數據的無限制利用。《爆發》一書中更指出,人的行為看似隨機無序,但實際上是存在某種規律的。社交網絡如此發達的今天,大數據把人的行為進行放大分析,從而能夠相對準確地預測人的性格和行程。所以,不排除有這樣一種可能:在忙完了一天的工作之后,你還沒有決定要去哪兒,數據中心卻早就先于你準確預測了接下來的目的地。
人們是否存在真正的隱私
當前,數據的數量時刻都在飛速增長。信息分享在全世界范圍內越廣泛,確保數據安全和保護人們隱私的任務就越難完成。現如今,人與人之間交流產生的流量遠遠大于文件傳輸產生的流量,但是,人與人之間的交流可以界定為隱私,屬于比較敏感的范疇。由此看來,整個互聯網都是隱私的,是不可公開的。但是,現有的互聯網結構下,你的所有應用對于服務提供商,其實都是透明的。那么,人們既想要借助互聯網的平臺與別人交流,又想要自己的空間不被窺探,這是完全不可能的。
《爆發》一書中指出,為獲得便利,人們未來會接受匿名的隱私泄露。但是,在過去的幾年中,計算機專家一再表示,即使是匿名的數據也可以被重新確定,并且歸屬到具體的個人。例如,如果一筆超市購物記錄中的零食全都和你的愛好相符、提供記錄的超市正好位于你公司到家里的路上、購物時間剛好是你下班和到家之間的時間,這筆購物就很有可能與你相關,如果單子里剛好有你之前微博上表示感興趣的商品,那就更有可能了。曾經,谷歌的一位工程師在解釋“為什么不收集與人的名字相關的信息”的時候說道:“我們根本就不需要名字,名字對我們來說完全多余。谷歌記錄網民搜索查詢、位置和網上行為的大型數據庫中就有大量信息,這足以讓谷歌間接地了解一個人。” 這意味著人們隱私權的最后一道防線同樣脆弱得不堪一擊。
人們只能寄希望于在政府加大立法制度的同時,企業自身也設定相關規則實現自我管控。在美國北卡羅來納州,曾經有人因為雇主看了他在Facebook上的信息而求職失敗,求職者對雇主起訴并打贏官司。為此,北卡羅來納州專門立法規定雇主不得對雇員進行網上監控。Facebook也專門設立了首席隱私官。不過,政府和企業本身就擁有最多的數據,它們會真正限制自己對數據的應用嗎?這將是未來大數據時代頭上的一把達摩克利斯之劍。