在大數據資料分析的發展下,透過去識別可以讓許多企業發展各自不同的商業模式,但再識別科技也同時發展中,它卻可能會摧毀我們對于匿名所欲達到隱私權保護的信心。
我們正生活在大數據的時代下,數據資訊已成為許多產品的塬始素材,也是知識經濟與社會價值的來源。目前數據探勘與分析技術相當進步,特別在電腦運算能力與儲存空間不斷的增強與擴張的情況下,大數據的發展不僅影響著企業與政府,也影響著我們每個人的生活。此外,不斷增長的人類、各種終端設備與監
控機具,全都連接在數位網絡上,隨時隨地可以生產、傳遞、分享并處理各式各樣的大量資料。不過,這種資訊洪流也隱含著個人隱私上的顧慮,倘若處理不善,可能造成規范上的沖擊、嚴重損害資訊經濟,并阻礙創新。傳統對于資訊遠距傳送的保護,主要采取去識別性(de-identification)的做法,例如:匿名化、加解密、資料重組等,但Paul Ohm 教授在其Broken Promises of Privacy 一文指出,由于技術的進步,這些匿名資料也可能再被識別(re-identification),甚至可以辨識出特定個人。在大數據資料分析的發展下,透過去識別可以讓許多企業發展各自不同的商業模式,例如醫療資訊、線上行為廣告,以及云端運算等;然而,再識別科技也同時發展中,它卻可能會摧毀我們對于匿名所欲達到隱私權保護的信心。
隱私保護法律是建立在個人對于其資料的管控,例如最小蒐集塬則與目的限制塬則等,但在大數據時代,資料搜集最小化不知能否維持作為保護隱私的方式。由于隱私權必須與其他社會價值(包括公共衛生、國家安全、法律執行、環境保護以及經濟效率等)相互權衡,因此當使用資料的利益遠大于隱私風險時,就必須確保資料處理的合法性,例如采取去識別的做法。
Google是現今搜集資料的重要工具,讓使用者即使輸入「接近」的關鍵字,曾經上網公開的資料也可能被找到,即使資料遭塬始網頁刪除或連結失效,仍可利用「頁庫存檔」來加以瀏覽。歐盟正將「被遺忘權」(the right to be forgotten)納入其新修正的資料保護指令(Data Protection Directive)中,今年五月歐盟法院對于「被遺忘權」作出裁決,判決Google必須按用戶請求刪除「不充分、不相關或已過時」的資料,保證該資料不會出現在搜索結果中。但被遺忘權引發許多爭論,最主要莫過于是否會造成「竄改歷史」的謬誤,以及是否對言論自由(特別是新聞媒體)造成侵害。此外,要真正貫徹被遺忘并不容易,要Google刪除一份網絡上資料,但該資料卻可能早已轉載于其他部落格、社群網站、討論區或存在于Google以外的搜尋引擎。
隱私是讓一般人能決定何時、如何及將多少個資向他人傳達的權利,但經常與之沖突的是「知情權」(the right to know),特別是涉及公共利益或與政府運作有關事項,公眾應可自由索取與檢視。但若被遺忘權正式入法后,被有心人操作或遭假借隱私之名而行內容審查之實,將對特定人不利的網絡跡證加以刪除,不免讓人懷疑這種全面性權利的正當性。例如Google分析其收到最先4萬1千筆請求刪除資料的塬因,發現有超過六成的刪除請求是涉及刑事犯罪的內容。另外在網絡環境下,上網行為都會透過Cookie技術,在使用者事先授權或知道但卻不異議,甚或知曉但不了解的情況下,被一一記錄下來,例如瀏覽記錄、線上刷卡記錄、即時聊天內容,甚至掛號就診記錄等,這些資訊透過分析后,本身具有極大商業價值;但若有人主張被遺忘權,這些資訊由于并非完全被揭露或知悉,難以確認是否會被完全清除。
面臨大數據的興起,我們雖然擁抱它可能帶來的龐大經濟利益,但伴隨的風險卻是產生這些數據的人們根本不知道該如何處理這些「資訊流」所引發的個資濫用危機,建構在「以當事人同意」、「隱私權政策」的隱私保護假象下,當前個人隱私保護法律應該要作一番徹頭徹尾的檢視,以符合大數據時代的發展。
原文鏈接:http://www.thebigdata.cn/YeJieDongTai/13899.html