本文作者比爾·弗蘭克斯是Teradata的首席分析官,同時也是international Institute for Analytics的教員。他表達了有關大數據空間及其分析的發展趨勢的見解,著有The Big Data Tidal Wave,并在最近出版了他的第二本書The Analytics Revolution。
窺探人隱私的不是數據,是人。但是這樣簡單的事實,人們往往很難接受。就像NSA(國家安全局)發生的丑聞,經常性的數據泄露事件和頻發的電視臺竊聽私人通話事件,難怪人們會越來越不信任數據。91%的美國人認為,消費者已經無法阻止個人信息被其他企業收集和利用,并有61%的人希望能采取措施保護他們在網上的個人信息。無論數據是被社交媒體故意披露的,或是通過人們在網站和智能手機上留下的痕跡無意中收集的,恐怖的是,個人隱私和信息自由,甚至是民主意識都受到了威脅。
從法院受理的官司和媒體討論的駭人設想可以輕松得出結論,大數據分析總是有害的。但是,真的是這樣的嗎?
利大于弊
最近,我出席了一個會議,與眾多國家立法者和高管商討如何能利用大數據、更先進的分析技術以及升級數據管理系統,從而幫助國家更有效地控制成本,減少欺詐行為并提供更高效的服務,更復雜的分析和更新的數據管理平臺,提供國家服務。會上提出了隱私泄露和數據誤用的問題,并引發了激烈的討論。討論的主題是:鑒于當權者誤用和濫用數據的風險,國家收集大量數據到底是不是個好主意。
我給出了幾個強大數據如何能為人們帶來很多好處的例子。想想那些指派去監控那些有虐童史家庭的社會工作者,如果新來的社工能使用過去搜集的數據,孩子們就可以結束不必要的受傷,甚至死亡。在我的家鄉格魯吉亞,因為社工沒有有關孩子當時面臨的危險的重要信息,很多孩子因此喪失了生命。這一事件在當地引起很多關注。
某國家官員指出,獲得的關注有效度與這些國家工作者收集的高度敏感信息有關。使信息容易獲得意味著低收入、技術水平不高的工人可以輕松獲得高度隱私和敏感的信息。這樣的信息顯然更容易會被濫用。但是,在這種情況下,比起被濫用可能造成的后果,這些信息對保護孩子的生命帶來的好處更大。更重要的是,這些能輕松訪問數據的人都很清楚,如果他們濫用數據,不但會丟了自己的工作,還會受到很嚴重的法律制裁(反抗一次你就沒機會再繼續工作了)。
這有點像駕駛。每次我們開車其實都是冒著生命危險的。在任何時候,都有可能會有人朝我們撞過來撞死我們,即使我們可能什么都沒做錯。發生這樣的事情確實很可悲,但它發生的幾率太小了,以至于我們都可以接受這種風險。而從中我們獲取了許多好處,我們能自由去任何地方,其好處足以彌補可能發生的風險。沒有人會為了阻止每年發生的大量完全可以避免的車禍奪命案而去建議禁止汽車上路。整個社會已經達成共識,相比造成的風險,開車帶來的好處多太多了。
我們在審視大數據及其分析時也應采納同樣的方法。利用大數據帶來的好處無疑是是巨大的,無論我們如何小心,然而,同樣的數據有時可能會被濫用。我們要做的應該是盡量減少數據濫用的發生,讓處罰嚴重到人們因怕懲罰而不敢去嘗試。如果州政府和其他組織能夠發揮利用大數據的積極的部分,社會整體會變得越來越好。