編者按:本文來自微信公眾號“伯凡時間”(ID:bofanstime),作者吳伯凡;36氪經授權發布。
如今,我們時刻都暴露在互聯網的“第三只眼”之下:購物網站監視著我們的購物習慣,搜索引擎監視著我們的網頁瀏覽習慣,而微博似乎什么都知道,不僅偷聽到人們心中的聲音,還能發現人們的社交關系網。
進行大數據分析的人可以輕松地看到大數據的價值潛力,這極大刺激了這些數據“礦工”進一步采集、存儲、循環利用我們個人數據的野心。隨著存儲成本繼續暴跌而分析工具越來越先進,采集和存儲數據的數量和規模將爆發式增長。
隨著越來越多事物被數據化,決策者和商人所做的第一件事就是得到更多數據。“我們相信上帝,除了上帝,其他任何人都必須在用數據說話”,這是現代經理人的信仰,也回響在硅谷的辦公室、工廠和市政廳的門廊里,但是利用數據在進行決策時其實有著極大的局限性。
這正是大數據時代除隱私被侵害之外最令人擔憂之處,如果數據真的成為一種判斷的主宰,拿來做這樣那樣的傾向性判定,那么這實際上是數據的一種濫用,它忽略了公平公正和自由意志,也輕視了決策過程的深思熟慮的重要性。
1
大數據如果應用得當,它是我們合理決策過程中的有力武器,若運用不當,它就可能會帶來誤導。目前美國有30多個州的假釋委員會正在使用數據分析來決定能否保釋,越來越多美國城市都采用了“預測警務”也就是大數據分析來決定哪些街道、群體還有個人需要更嚴密的監控。
這讓人聯想到《少數派報告》電影中的場景,在那部電影描述的未來中,三個超自然人可以預測人們的動向,罪犯在犯罪實施前就會被逮捕,他們為還沒有實際發生的罪行而負責,而少數派報告指的是三個超自然人中的一個做出了跟其他人不一樣,但實際上卻是正確的預測,這部科幻電影深刻的質疑了數據獨裁的合理性。
當大數據成為集體選擇的工具時,我們也放棄了作為人的自由意志。大數據的不利影響并不是大數據本身的缺陷,而是濫用大數據預測所導致的結果。大數據預測是建立在相關性基礎上的,而不是因果性。讓人們為還未實施的未來行為買單是帶來不利影響的主要原因,因為我們把人的罪責判定建立在大數據預測的基礎上是不合理的。
對數據的癡迷不是在大數據時代才有的。美國軍方在越戰時對數據的使用、濫用和誤用給我們提了一個醒,在由“小數據”時代向大數據時代轉變的過程中,我們對信息的一些局限性必須給予高度的重視。
數據不是萬能的,數據可以反映趨勢和潮流,但它抓不住什么才是“大問題”,也催生不了杰作。卓越的洞察力并不依賴于數據,史蒂夫·喬布斯推出iPod、iPhone和iPad這次產品靠的不是數據,而是直覺----他依賴于他的第六感。當記者問喬布斯蘋果在推出iPad之前做了多少市場調查,他那個著名的回答是:“沒做,消費者沒義務去了解自己想要什么。”
數據也不懂背景。詹姆斯·斯科特教授是耶魯大學政治學和人類學教授,他在《國家的視角》一書記錄了美國政府如何因為對量化和數據的盲目崇尚而讓人們陷入困境。比如,政府使用地圖來確定社區重建,卻完全不知道其中民眾的生活狀態,政府使用大量的農收數據來決定采取集體農莊的方式,但是完全不懂農業……
政府把所有人們一直以為用之交流的不建全和系統的方式按照自己的需求改造,只是為了滿足可量化規則的需要。在斯科特看來,大數據使用成了權力的武器。這是數據獨裁放大了的寫照,同樣,這是這種自大導致美國基于死亡人數而不是更理智的標準來擴大越南戰爭的規模。
數據還會制造出更大的“干草垛”。這一觀點是由《黑天鵝:如何應對不可知的未來》等書作者納西姆·塔勒布提出來的,隨著我們掌握的數據越來越多,可以發現的統計上顯著的相關關系也就越來越多,這些相關關系中,有很多都是沒有實際意義的,在真正解決問題時很可能將人引入歧途。這種欺騙性會隨著數據的增多而指數級地增長。在這個龐大的“干草垛”里,我們要找的那根“針”被越埋越深。大數據時代的特征之一就是,“重大”發現的數量被數據擴張帶來的噪音所淹沒。
更尖銳的觀點是,數據掩蓋了價值觀念。《“原始數據”只是一種修辭》提出數據從來都不可能是“原始”的,數據總是依照某人的傾向和價值觀念而被構建出來的。數據分析的結果看似客觀公正,但其實價值選擇貫穿了從構建到解讀的全過程。
2
能源、氣象、醫療、購物、旅行、學術、輿情直至宏觀政治經濟治理,幾乎每一個領域都從大數據中受益。而大數據也帶來從國家安全風險、意識形態操控,到網絡欺詐犯罪、個人隱私侵犯的困擾。尤其是對普通民眾而言,人類前所未有地“透明”。
根據相關方面統計,早在2011年,全球網絡犯罪在個人隱私方面造成的損失,就能夠達到全球經濟總量的0.008%-0.02%。而“棱鏡門”和斯諾登事件,又提醒我們信息世界的“老大哥”在制造對全球公民進行監視的“數字圓形監獄”。
在這種情況下,我們應該做些什么呢?
管理變革1:個人隱私保護,從個人許可到讓數據使用者承擔責任
數十年來,全球范圍內的隱私規范都開始讓人們自主決定是否、如何以及由誰來處理他們的信息,把這種控制權交給人們自己手中,這也是隱私規范的核心準則。而在互聯網時代,這個偉大的理想往往會演變成“告知與許可”的公式化系統。
在大數據時代,因為數據的價值很大一部分體現在二級用途上了,而收集數據時并示作這種考慮,所以“告知與許可”就不能再起到好的作用了。在大數據時代,我們需要設立一個不一樣的隱私保護模式,這個模式應該更著重于數據使用者為其行為承擔責任,而不是將重心放在收集數據之初取得個人同意上。
未來的隱私法應當區分用途,包括不需要或者只需要適當標準化保護的用途。對于一些危險性較大的項目,管理者必須設立規章,規定數據使用者如何評估風險、如何規避或者減輕潛在傷害。這將激發創新再利用,同時也確保個人免受無妄之災。
將責任從民眾轉移到數據使用者很有意義,理由也很充分,因為數據使用者比任何人都明白他們想要如何利用數據。他們的評估(或者由他們所雇用的專家制定的評估)避免了商業機密的泄露,也許更為重要的是,數據使用者是數據二級使用的最大受益者,所以理所當然應該讓他們對自己的行為負責。
此外,與目前大多數隱私保護法所要求的不一樣,數據使用者達到了最初的目的之后,法律上不再規定必須刪除個人信息。相反,數據使用者被允許較長時間地保存數據,雖然不能永遠。這是一個意義重大的變革,因為,就像我們所知道的,只有開發數據的潛在價值,對數據價值進行最大程度的挖掘,近代“網絡海軍”們才能發展繁榮,并促進自身和社會的同步進步。總之,社會必須平衡二次運用的優勢與過度披露所帶來的風險。
為實現這一平衡,監管機制可以決定不同種類的個人數據必須刪除的時間。再利用的時間框架則取決于數據內在風除和社會價值觀的不同。通過這種方式消除個人信息“永久記憶”的恐慌----永不磨滅的數字記錄讓人無法告別過去,時間限制也激勵數據使用者在有權限的時間內盡力挖掘出數據的價值。這就是我們認為更適用于大數據時代的平衡:公司可利用數據的時間更長,但相應地必須為其行為承擔責任,以及負有特定時間之后刪除個人數據的義務。
除了管理上的轉變,即從個人許可到數據使用者承擔相應責任的轉變,我們也需要發明并推行新技術方式來促進隱私保護。一個創新途徑就是“差別隱私”:故意將數據模糊處理,促使對大數據庫的查詢不能顯示精確的結果,而只有相近的結果,這就使得挖出特定個人與特定數據點的聯系變得難以實現并且耗費巨大。
管理變革2:個人動因vs預測分析
身處大數據時代,我們必須拓寬對公正的理解,必須把對個人動因的保護納入進來,就像目前我們為程序公司所做的努力一樣。如若不然,公正的信念就可能被完全破壞。
通過保證個人動因,我們可以確保政府對我們行為的評判是基于真實行為而非單純依靠大數據分析。政府只能依法對我們過去的真實行為進行追究,而不可以追究大數據預測到我們的未來行為,如果他們單純依據大數據預測作出這些決策,特定的防護措施就必須到位。
-
第一,公開原則。因為這將直接影響到個人,所以必須公開來進行預測分析的數據和算法系統;
-
第二,公正原則。具備由第三方專家公證的可靠、有效的算法系統;
-
第三,可反駁原則。明確提出個人可以對其預測進行反駁的具體方式(這類似于科學研究中披露任何可能影響研究結果的因素的傳統);
-
第四,最重要的是,要確保個人動因能防范“數據獨裁”的危害----我們賦予數據本不具備的意義和價值。
保護個人責任也很重要。假設大數據強烈誘使我們隔離那些預言將會犯罪的人們,以減少風險的名義對其進行不斷的審查,如果國家根據“預測警務”算法鑒定某個青少年在未來五年內很可能犯重罪,而派遣一名社會工作者每月定期拜訪核查該少年動態,其親屬、朋友、教師和雇主將此拜訪視為一種恥辱,那么這就起到了懲罰的作用,對未發生行為的懲罰。
然而,社會越是干預、降低風險的方式取代為自己的行為負責,就越會導致個人責任意識的貶值。主張預測的國家是保姆式的國家,而且遠不止如此,否認個人為其行為承擔責任實際上就是在摧毀人們自由選擇行為的權利。如果國家做出的許多決策都是基于預測以及減少風險的愿望,就不存在所謂個人的選擇了,也不用提自主行為的權利。無罪,無清白。如此一來,世界不止不會進步,反而在倒退。
大數據管理的基本支撐是保證我們依然是通過考慮他人的個人責任對其進行評判,而不是借助“客觀”數據處理去決定他們是否違法。只有這樣,我們才把其當作人來對待----當作有行為選擇自由和自主行為被評判的人。這就是從大數據推論到今天的無罪推定原則。
管理變革3:擊碎黑盒子,大數據算法師的崛起
大數據的動作是在一個超出普通大眾正常理解范圍之上的。在這樣的背景下,我們能看到大數據預測、運算法則和數據庫有變為黑盒子的風險,這個黑盒子不透明、不可解釋、不可追蹤,因而我們對其全無信心。
為了防止這些情況出現,大數據將需要被監測并保持透明度,當然還有使之兩項得以實現的新型專業技術和機構。它們將為許多領域提供支持,在這些領域里社會需要檢測預測結果,并能夠為被其錯誤引導的人群提供彌補方法。
社會發展出現過很多這種情況,當一個特定領域變得特別復雜和專門化之后,就會催生出對運用新技術的專門人才的迫切需求。在一個多世紀以前,法律、醫學、會計以及工程學領域都經歷過這種轉型。不久前,計算機安全和隱私顧問的突然興起,證實了公司都在遵循由一些組織確立的行業最佳做法,如國際標準化組織,它是為滿足這個領域對準則的需要而自發形成的。
大數據將要求一個新的人群來扮演這種角色,也許他們會被稱作為“算法師”。這種人有兩種形式:在機構外部工作的獨立實體和機構內部的工作人員----正如公司有內部會計人員和進行鑒證的外部審計師。
這些新的專業人員會是計算機科學、數學和統計學領域的專家,他們將擔任大數據分析和預測的評估專家。他們必須保證公正和保密。他們可以評估數據源的挑選,分析和預測工具的選取,甚至包括運算法則和模型,以及計算結果的結果是否正確合理。一旦出現爭議,他們有權考察與分析結果相關的運算法則、統計方法以及數據集。
變革4: 反數據壟斷大亨
數據之于信息社會就如同燃料之于工業革命,是人們進行創新的力量源泉。沒有大量鮮活的數據和健全的服務市場,這些創新就實現不了。
剛剛提到的三個變革如果完成,相信會讓大數據的不利影響得到控制。然而,隨著尚未成熟的大數據產業的不斷發展,另一個重要的挑戰將會是如何保護極具競爭力的大數據市場。我們必須防止21世紀數據大亨的崛起,它相當于19世紀的強盜大亨的現代翻版,那些強盜大亨曾經壟斷了美國的鐵路、鋼鐵生產和電報網絡。
當時為了管理這些新興行業,美國制定了適應性極強的反壟斷條例。反壟斷法遏制了權力的濫用。然而令人驚奇的是,這些條例能從一個領域完全轉移到另外一個領域,并且適用于不同類型的網絡產業。這種不帶任何偏袒的規章非常實用,因為它提供了一個平等的競爭平臺,一開始便沒有任何優劣之分。
因此,為了促進大數據平臺上的良性競爭,政府必須運用反壟斷條例。就像世界上一些大型的數據擁有者那樣,政府也應該公布其數據。好在這些變化已經在發生,伴隨著核技術到生物工程學其他領域的發展,人類總是創造出可能危害自身的工具,然后才著手建立保護自己、防范危險的安全機制,在這方面,大數據也和其他領域的新技術一樣,先提出問題,才會有答案。
3
正如印刷機的發明引發了社會自我管理的變革,大數據也是如此。它迫使我們借助新方式來應對長期存在的挑戰,并且通過借鑒基本原理對新的隱患進行應對。不過,推進科學技術進步的同時,應確保人類自身的安全。因此,我們不能讓大數據的發展超出我們可以控制的范圍。
大數據并不是一個充斥著算法和機器的冰冷世界,人類的作用依然無法被完全替代。大數據為我們提供的不是最終答案,只是參考答案,幫助是暫時的,而更好的方法和答案還在不久的將來。
大數據是一種資源,也是一種工具。大數據讓我們試驗的速度更快,發現的線索更多,這理應能夠產生更多的創新成果,但發明的火花卻往往存在于數據未曾彰顯的信息之中,因為它并非真實存在,是多大量的數據都永遠無法確定或證實的。
在沒有汽車的年代,如果亨利·福特問大數據他的顧客想要的是什么,大數據將回答:“一匹更快的馬”。在大數據的世界中,包括創意、直覺、冒險精神和知識野心在內的人類特性的培養顯得尤為重要,因為進步正是源于我們的獨創性。正如莎士比亞所言:“凡是過去,皆為序曲”。
編者按:本文來自微信公眾號“伯凡時間”(ID:bofanstime),作者吳伯凡;36氪經授權發布。
如今,我們時刻都暴露在互聯網的“第三只眼”之下:購物網站監視著我們的購物習慣,搜索引擎監視著我們的網頁瀏覽習慣,而微博似乎什么都知道,不僅偷聽到人們心中的聲音,還能發現人們的社交關系網。
進行大數據分析的人可以輕松地看到大數據的價值潛力,這極大刺激了這些數據“礦工”進一步采集、存儲、循環利用我們個人數據的野心。隨著存儲成本繼續暴跌而分析工具越來越先進,采集和存儲數據的數量和規模將爆發式增長。
隨著越來越多事物被數據化,決策者和商人所做的第一件事就是得到更多數據。“我們相信上帝,除了上帝,其他任何人都必須在用數據說話”,這是現代經理人的信仰,也回響在硅谷的辦公室、工廠和市政廳的門廊里,但是利用數據在進行決策時其實有著極大的局限性。
這正是大數據時代除隱私被侵害之外最令人擔憂之處,如果數據真的成為一種判斷的主宰,拿來做這樣那樣的傾向性判定,那么這實際上是數據的一種濫用,它忽略了公平公正和自由意志,也輕視了決策過程的深思熟慮的重要性。
1
大數據如果應用得當,它是我們合理決策過程中的有力武器,若運用不當,它就可能會帶來誤導。目前美國有30多個州的假釋委員會正在使用數據分析來決定能否保釋,越來越多美國城市都采用了“預測警務”也就是大數據分析來決定哪些街道、群體還有個人需要更嚴密的監控。
這讓人聯想到《少數派報告》電影中的場景,在那部電影描述的未來中,三個超自然人可以預測人們的動向,罪犯在犯罪實施前就會被逮捕,他們為還沒有實際發生的罪行而負責,而少數派報告指的是三個超自然人中的一個做出了跟其他人不一樣,但實際上卻是正確的預測,這部科幻電影深刻的質疑了數據獨裁的合理性。
當大數據成為集體選擇的工具時,我們也放棄了作為人的自由意志。大數據的不利影響并不是大數據本身的缺陷,而是濫用大數據預測所導致的結果。大數據預測是建立在相關性基礎上的,而不是因果性。讓人們為還未實施的未來行為買單是帶來不利影響的主要原因,因為我們把人的罪責判定建立在大數據預測的基礎上是不合理的。
對數據的癡迷不是在大數據時代才有的。美國軍方在越戰時對數據的使用、濫用和誤用給我們提了一個醒,在由“小數據”時代向大數據時代轉變的過程中,我們對信息的一些局限性必須給予高度的重視。
數據不是萬能的,數據可以反映趨勢和潮流,但它抓不住什么才是“大問題”,也催生不了杰作。卓越的洞察力并不依賴于數據,史蒂夫·喬布斯推出iPod、iPhone和iPad這次產品靠的不是數據,而是直覺----他依賴于他的第六感。當記者問喬布斯蘋果在推出iPad之前做了多少市場調查,他那個著名的回答是:“沒做,消費者沒義務去了解自己想要什么。”
數據也不懂背景。詹姆斯·斯科特教授是耶魯大學政治學和人類學教授,他在《國家的視角》一書記錄了美國政府如何因為對量化和數據的盲目崇尚而讓人們陷入困境。比如,政府使用地圖來確定社區重建,卻完全不知道其中民眾的生活狀態,政府使用大量的農收數據來決定采取集體農莊的方式,但是完全不懂農業……
政府把所有人們一直以為用之交流的不建全和系統的方式按照自己的需求改造,只是為了滿足可量化規則的需要。在斯科特看來,大數據使用成了權力的武器。這是數據獨裁放大了的寫照,同樣,這是這種自大導致美國基于死亡人數而不是更理智的標準來擴大越南戰爭的規模。
數據還會制造出更大的“干草垛”。這一觀點是由《黑天鵝:如何應對不可知的未來》等書作者納西姆·塔勒布提出來的,隨著我們掌握的數據越來越多,可以發現的統計上顯著的相關關系也就越來越多,這些相關關系中,有很多都是沒有實際意義的,在真正解決問題時很可能將人引入歧途。這種欺騙性會隨著數據的增多而指數級地增長。在這個龐大的“干草垛”里,我們要找的那根“針”被越埋越深。大數據時代的特征之一就是,“重大”發現的數量被數據擴張帶來的噪音所淹沒。
更尖銳的觀點是,數據掩蓋了價值觀念。《“原始數據”只是一種修辭》提出數據從來都不可能是“原始”的,數據總是依照某人的傾向和價值觀念而被構建出來的。數據分析的結果看似客觀公正,但其實價值選擇貫穿了從構建到解讀的全過程。
2
能源、氣象、醫療、購物、旅行、學術、輿情直至宏觀政治經濟治理,幾乎每一個領域都從大數據中受益。而大數據也帶來從國家安全風險、意識形態操控,到網絡欺詐犯罪、個人隱私侵犯的困擾。尤其是對普通民眾而言,人類前所未有地“透明”。
根據相關方面統計,早在2011年,全球網絡犯罪在個人隱私方面造成的損失,就能夠達到全球經濟總量的0.008%-0.02%。而“棱鏡門”和斯諾登事件,又提醒我們信息世界的“老大哥”在制造對全球公民進行監視的“數字圓形監獄”。
在這種情況下,我們應該做些什么呢?
管理變革1:個人隱私保護,從個人許可到讓數據使用者承擔責任
數十年來,全球范圍內的隱私規范都開始讓人們自主決定是否、如何以及由誰來處理他們的信息,把這種控制權交給人們自己手中,這也是隱私規范的核心準則。而在互聯網時代,這個偉大的理想往往會演變成“告知與許可”的公式化系統。
在大數據時代,因為數據的價值很大一部分體現在二級用途上了,而收集數據時并示作這種考慮,所以“告知與許可”就不能再起到好的作用了。在大數據時代,我們需要設立一個不一樣的隱私保護模式,這個模式應該更著重于數據使用者為其行為承擔責任,而不是將重心放在收集數據之初取得個人同意上。
未來的隱私法應當區分用途,包括不需要或者只需要適當標準化保護的用途。對于一些危險性較大的項目,管理者必須設立規章,規定數據使用者如何評估風險、如何規避或者減輕潛在傷害。這將激發創新再利用,同時也確保個人免受無妄之災。
將責任從民眾轉移到數據使用者很有意義,理由也很充分,因為數據使用者比任何人都明白他們想要如何利用數據。他們的評估(或者由他們所雇用的專家制定的評估)避免了商業機密的泄露,也許更為重要的是,數據使用者是數據二級使用的最大受益者,所以理所當然應該讓他們對自己的行為負責。
此外,與目前大多數隱私保護法所要求的不一樣,數據使用者達到了最初的目的之后,法律上不再規定必須刪除個人信息。相反,數據使用者被允許較長時間地保存數據,雖然不能永遠。這是一個意義重大的變革,因為,就像我們所知道的,只有開發數據的潛在價值,對數據價值進行最大程度的挖掘,近代“網絡海軍”們才能發展繁榮,并促進自身和社會的同步進步。總之,社會必須平衡二次運用的優勢與過度披露所帶來的風險。
為實現這一平衡,監管機制可以決定不同種類的個人數據必須刪除的時間。再利用的時間框架則取決于數據內在風除和社會價值觀的不同。通過這種方式消除個人信息“永久記憶”的恐慌----永不磨滅的數字記錄讓人無法告別過去,時間限制也激勵數據使用者在有權限的時間內盡力挖掘出數據的價值。這就是我們認為更適用于大數據時代的平衡:公司可利用數據的時間更長,但相應地必須為其行為承擔責任,以及負有特定時間之后刪除個人數據的義務。
除了管理上的轉變,即從個人許可到數據使用者承擔相應責任的轉變,我們也需要發明并推行新技術方式來促進隱私保護。一個創新途徑就是“差別隱私”:故意將數據模糊處理,促使對大數據庫的查詢不能顯示精確的結果,而只有相近的結果,這就使得挖出特定個人與特定數據點的聯系變得難以實現并且耗費巨大。
管理變革2:個人動因vs預測分析
身處大數據時代,我們必須拓寬對公正的理解,必須把對個人動因的保護納入進來,就像目前我們為程序公司所做的努力一樣。如若不然,公正的信念就可能被完全破壞。
通過保證個人動因,我們可以確保政府對我們行為的評判是基于真實行為而非單純依靠大數據分析。政府只能依法對我們過去的真實行為進行追究,而不可以追究大數據預測到我們的未來行為,如果他們單純依據大數據預測作出這些決策,特定的防護措施就必須到位。
第一,公開原則。因為這將直接影響到個人,所以必須公開來進行預測分析的數據和算法系統;
第二,公正原則。具備由第三方專家公證的可靠、有效的算法系統;
第三,可反駁原則。明確提出個人可以對其預測進行反駁的具體方式(這類似于科學研究中披露任何可能影響研究結果的因素的傳統);
第四,最重要的是,要確保個人動因能防范“數據獨裁”的危害----我們賦予數據本不具備的意義和價值。
保護個人責任也很重要。假設大數據強烈誘使我們隔離那些預言將會犯罪的人們,以減少風險的名義對其進行不斷的審查,如果國家根據“預測警務”算法鑒定某個青少年在未來五年內很可能犯重罪,而派遣一名社會工作者每月定期拜訪核查該少年動態,其親屬、朋友、教師和雇主將此拜訪視為一種恥辱,那么這就起到了懲罰的作用,對未發生行為的懲罰。
然而,社會越是干預、降低風險的方式取代為自己的行為負責,就越會導致個人責任意識的貶值。主張預測的國家是保姆式的國家,而且遠不止如此,否認個人為其行為承擔責任實際上就是在摧毀人們自由選擇行為的權利。如果國家做出的許多決策都是基于預測以及減少風險的愿望,就不存在所謂個人的選擇了,也不用提自主行為的權利。無罪,無清白。如此一來,世界不止不會進步,反而在倒退。
大數據管理的基本支撐是保證我們依然是通過考慮他人的個人責任對其進行評判,而不是借助“客觀”數據處理去決定他們是否違法。只有這樣,我們才把其當作人來對待----當作有行為選擇自由和自主行為被評判的人。這就是從大數據推論到今天的無罪推定原則。
管理變革3:擊碎黑盒子,大數據算法師的崛起
大數據的動作是在一個超出普通大眾正常理解范圍之上的。在這樣的背景下,我們能看到大數據預測、運算法則和數據庫有變為黑盒子的風險,這個黑盒子不透明、不可解釋、不可追蹤,因而我們對其全無信心。
為了防止這些情況出現,大數據將需要被監測并保持透明度,當然還有使之兩項得以實現的新型專業技術和機構。它們將為許多領域提供支持,在這些領域里社會需要檢測預測結果,并能夠為被其錯誤引導的人群提供彌補方法。
社會發展出現過很多這種情況,當一個特定領域變得特別復雜和專門化之后,就會催生出對運用新技術的專門人才的迫切需求。在一個多世紀以前,法律、醫學、會計以及工程學領域都經歷過這種轉型。不久前,計算機安全和隱私顧問的突然興起,證實了公司都在遵循由一些組織確立的行業最佳做法,如國際標準化組織,它是為滿足這個領域對準則的需要而自發形成的。
大數據將要求一個新的人群來扮演這種角色,也許他們會被稱作為“算法師”。這種人有兩種形式:在機構外部工作的獨立實體和機構內部的工作人員----正如公司有內部會計人員和進行鑒證的外部審計師。
這些新的專業人員會是計算機科學、數學和統計學領域的專家,他們將擔任大數據分析和預測的評估專家。他們必須保證公正和保密。他們可以評估數據源的挑選,分析和預測工具的選取,甚至包括運算法則和模型,以及計算結果的結果是否正確合理。一旦出現爭議,他們有權考察與分析結果相關的運算法則、統計方法以及數據集。
變革4: 反數據壟斷大亨
數據之于信息社會就如同燃料之于工業革命,是人們進行創新的力量源泉。沒有大量鮮活的數據和健全的服務市場,這些創新就實現不了。
剛剛提到的三個變革如果完成,相信會讓大數據的不利影響得到控制。然而,隨著尚未成熟的大數據產業的不斷發展,另一個重要的挑戰將會是如何保護極具競爭力的大數據市場。我們必須防止21世紀數據大亨的崛起,它相當于19世紀的強盜大亨的現代翻版,那些強盜大亨曾經壟斷了美國的鐵路、鋼鐵生產和電報網絡。
當時為了管理這些新興行業,美國制定了適應性極強的反壟斷條例。反壟斷法遏制了權力的濫用。然而令人驚奇的是,這些條例能從一個領域完全轉移到另外一個領域,并且適用于不同類型的網絡產業。這種不帶任何偏袒的規章非常實用,因為它提供了一個平等的競爭平臺,一開始便沒有任何優劣之分。
因此,為了促進大數據平臺上的良性競爭,政府必須運用反壟斷條例。就像世界上一些大型的數據擁有者那樣,政府也應該公布其數據。好在這些變化已經在發生,伴隨著核技術到生物工程學其他領域的發展,人類總是創造出可能危害自身的工具,然后才著手建立保護自己、防范危險的安全機制,在這方面,大數據也和其他領域的新技術一樣,先提出問題,才會有答案。
3
正如印刷機的發明引發了社會自我管理的變革,大數據也是如此。它迫使我們借助新方式來應對長期存在的挑戰,并且通過借鑒基本原理對新的隱患進行應對。不過,推進科學技術進步的同時,應確保人類自身的安全。因此,我們不能讓大數據的發展超出我們可以控制的范圍。
大數據并不是一個充斥著算法和機器的冰冷世界,人類的作用依然無法被完全替代。大數據為我們提供的不是最終答案,只是參考答案,幫助是暫時的,而更好的方法和答案還在不久的將來。
大數據是一種資源,也是一種工具。大數據讓我們試驗的速度更快,發現的線索更多,這理應能夠產生更多的創新成果,但發明的火花卻往往存在于數據未曾彰顯的信息之中,因為它并非真實存在,是多大量的數據都永遠無法確定或證實的。
在沒有汽車的年代,如果亨利·福特問大數據他的顧客想要的是什么,大數據將回答:“一匹更快的馬”。在大數據的世界中,包括創意、直覺、冒險精神和知識野心在內的人類特性的培養顯得尤為重要,因為進步正是源于我們的獨創性。正如莎士比亞所言:“凡是過去,皆為序曲”。