然而,對于那些相信選擇性數(shù)據(jù)集的人來說,其寬泛的筆觸足以作為一個臨時的羅夏測驗,可以提供科學(xué)分離的證明,以尋求確鑿證據(jù)的結(jié)論。
早在2013年,IBM公司發(fā)布的“行業(yè)洞察”報告估計每天全球都會創(chuàng)建2.5PB字節(jié)的數(shù)據(jù)。這些大量的數(shù)據(jù)來自用于收集購物者信息傳感器、社交媒體站點的帖子、數(shù)字圖片和視頻、購買交易和手機GPS信號。
如今在短短五年后,其數(shù)量大幅提高。根據(jù)福布斯公司在2017年的報道,如今產(chǎn)生的數(shù)據(jù)比人類歷史上5000年產(chǎn)生的數(shù)據(jù)還要多,這一數(shù)字令人印象深刻。
大數(shù)據(jù)的助推器
如今的數(shù)據(jù)成為了人們稱之為大數(shù)據(jù)分析這個磨坊所提供的糧食。事實上,App Developer 雜志一位作家最近對其使用情況表示擔憂,他說,“實際上只有不到0.5%的數(shù)據(jù)正在進行業(yè)務(wù)決策分析。”
但是,如果人們發(fā)現(xiàn)這些數(shù)據(jù)點淹沒在PB級、EB級、ZB級龐大的海洋中,它們還沒有被命名,偶爾會被一些技術(shù)管理人員或其他人發(fā)現(xiàn)能夠確定人們是否值得貸款、教育、工作、保險政策等措施和決策?
“人們有可能成為數(shù)據(jù)獨裁統(tǒng)治的受害者,迷信于信息,分析輸出,并最終濫用它。”Viktor Mayer-Schönberger和Kenneth Cukier在大數(shù)據(jù)中提出警告:“一場將改變?nèi)藗兩睢⒐ぷ骱退伎挤绞降母锩磳⒌絹怼H绻撠煹靥幚泶髷?shù)據(jù),可以成為一種理性決策的有用工具。如果不明智地使用它,它可以成為一種破壞巨大的工具,而無論是挫傷客戶和員工的熱情,還是造成傷害,其風險比人們通常承認的還要高。”
這似乎有點輕描淡寫?
人們也提出了這個問題,接下來的新事物是什么?人們在社交媒體用戶協(xié)議中點擊“同意”是一回事,而企業(yè)從社交媒體中收集的信息與手機中的位置數(shù)據(jù),以及廣告中嵌入的面部識別系統(tǒng)結(jié)合起來則是另一回事。
盡管數(shù)字架構(gòu)具有變革速度和抽象性,但人們基本信任那些構(gòu)建或管理這些設(shè)計的人員的善意和良好意圖,而沒有意識到有多少具有創(chuàng)造力的人讓機器所取代。
一旦消失,人們會再次得到它?
業(yè)界廣受贊譽的統(tǒng)計學(xué)家Nassim Nicholas Taleb指出,“豐富的數(shù)據(jù)有可能是一種極其有害的知識。”
他表示,“更多的數(shù)據(jù)可能意味著更多的信息,但它也意味著更多的虛假信息。”
Taleb通過讓人們想象“真實生活與圖書館之間的區(qū)別”來說明他的警告。“有人從圖書館的有利位置看待歷史,然后會發(fā)現(xiàn)比那些在現(xiàn)實生活中觀察到的更為虛假的關(guān)系,就像在現(xiàn)實生活中觀察到的序列一樣。”他解釋說,“人們會受到更多的附帶現(xiàn)象的欺騙,其中之一是超額數(shù)據(jù)與真實信號相比的直接結(jié)果。”
當然,這并不是在談?wù)摯髮W(xué)圖書館,在這個圖書館中,通過復(fù)合人們的共識和多樣性推動了管理過程。這更類似于被引入到一個理論圖書館,這個圖書館里充滿了由一個擁有單一預(yù)設(shè),并致力于一個非常具體的議程所選擇的書籍。任何挑戰(zhàn)或提供相反證據(jù)的數(shù)據(jù)都會被忽略或丟棄。
如果人們對這個思想實驗進一步想像,想象所有這些書籍都是詳細說明人們的生活應(yīng)該如何運轉(zhuǎn),應(yīng)該允許做什么,應(yīng)該給予的信任程度。
“研究人員會獲得好處,而其真相會帶來負面影響。”Taleb假設(shè)說,“研究人員的自由選擇在于,他能夠選擇任何統(tǒng)計數(shù)據(jù)可以證實其信念或者顯示出良好的結(jié)果,并將其余部分拋棄。一旦他有了正確的結(jié)果,就可以選擇停止。”他補充說,“虛假的事物將會浮出水面。”
Taleb認為,“現(xiàn)代性提供了太多的變量(但每個變量的數(shù)據(jù)太少),并且虛假關(guān)系增長要比真實信息快得多,因為其干擾噪聲是上升的,真實信息是下降的。”他擔心的是,人們將會受到“集體暴政”的擺布。
謹防具有魔力公式的數(shù)學(xué)家
“我小時候喜歡注視車窗外的車流,并研究車牌上的數(shù)字。”數(shù)學(xué)家Cathy O’Neil爾在她的文章中寫道。然后她進入了數(shù)學(xué)夏令營,隨后進入大學(xué)讀書,最終獲得了博士學(xué)位。她一直在闡述大數(shù)據(jù)在增加不平等并威脅民主所起到的作用。
O’Neil表示,“數(shù)學(xué)為現(xiàn)實世界的混亂提供了一個完美的避難所。我的論文是關(guān)于代數(shù)數(shù)論的,這個領(lǐng)域扎根于我小時候的興趣。”她最終入職對沖基金D.E. Shaw公司,并將其抽象理論付諸實踐。
“起初,我對在這個新實驗室工作,并對研究全球經(jīng)濟感到興奮和驚訝。”她寫道。“而在一年多之后,2008年的金融危機之后,數(shù)學(xué)研究成為避難所,因為不僅深深地糾纏于世界的問題,而且也加劇了其中的許多問題。”
“住房危機、主要金融機構(gòu)的崩潰,以及失業(yè)率的上升,所有這些都得到了數(shù)學(xué)家使用魔術(shù)配方的幫助和慫恿。”她繼續(xù)說道,“更重要的是,我非常喜歡這種非凡的力量,因為數(shù)學(xué)能夠與技術(shù)相結(jié)合,從而為現(xiàn)在認為有缺陷的系統(tǒng)提高效率和規(guī)模。”
然而,她注意到一些后續(xù)事件。她說,“新的數(shù)學(xué)技術(shù)比以往任何時候都更加熱門,并擴展到更多的領(lǐng)域。”
沒有任何真正的討論和默許,似乎純粹是基于敬畏,人類已經(jīng)迷信于技術(shù)神靈,“像上帝一樣,這些數(shù)學(xué)模型是不透明的,除了數(shù)學(xué)家和計算機科學(xué)家以外,對所有人都是不可見的。”
在人們了解數(shù)學(xué)破壞武器之前,這看起來有些夸張,那么在完成它的時候,人們肯定不會這么認為。
有什么樣的風險
Mayer-Schönberger和Cukier寫道:“關(guān)于大數(shù)據(jù)的關(guān)鍵點是其規(guī)模的變化會導(dǎo)致狀態(tài)的改變。其轉(zhuǎn)變不僅使得保護隱私變得更加困難,而且還帶來了一種全新的威脅:基于傾向性的懲罰。這是使用大數(shù)據(jù)預(yù)測人們在采取行動之前就可以判斷懲罰他們的可能性。這樣做否定了公平、正義和自由意志的想法。”
人們希望采用大數(shù)據(jù)仍然是可以共同抵御風險的普遍理想。