——大數據越來越被視為一種戰略性資產,它可以通過其強大的預測技術來改造組織。
據社會研究人員小組研究,大數據對公眾和社會的影響,當涉及到幫助系統做出決定時,應用方法可能并不總是公正的。
最近,紐約大學組織的學生為社會刑事司法改革的活動,集中使用大數據在機器學習和數據挖掘,以推動公共和私人部門的行政決定問題。
其中包括政策研究人員、技術人員和記者,討論在使用大數據的同時,拋開固有的偏見和歧視,通過無意中設置的規則和流程來增加我們的決策能力。
在這種情況下,使用規則的數學程序編碼來實現特定的目標。批評者認為這些算法可能會延續偏見和加強內置的假設。
最近,政府機構開始仔細觀察新興領域。上周,白宮發布的一份報告警告稱,如果沒有正確的應用數據收集可能會損害公民的權利。該報告呼吁,“如何最好的鼓勵這些技術的潛力,同時最大限度的減少對隱私、公平對待和其他美國核心價值的風險”。
2014年的報告題為“大數據的不同影響”,普林斯頓大學信息技術政策中心的程序員梭倫巴洛克斯指出,“數據挖掘算法技術的倡導者認為,他們是消除人類偏見的決策過程。但是,數據的算法與它所使用的數據一樣好。”
巴洛克斯研究新興的應用機器學習來提高道德認識問題的影響。他補充道,“數據挖掘可以繼承之前決策者的偏見或社會上持續存在的普遍偏見。”
換句話來說,人類產生的機器學習系統上運行的數據是由人類設計的算法。因此,人類創造的數據隱含偏見。
在兩年前的研究中,美國聯邦貿易委員會(Federal Trade Commission)提出類似的問題。盡管監管部門承認大數據所帶來的好處,但濫用數據編譯此類信息的公司存在歧視某些群體的風險。
數據歧視的指控
哈佛大學的數據隱私實驗室負責人Latanya Sweeny表示,大數據歧視指向幾年前開展的一項案例研究。
此案涉及到谷歌在互聯網上某些種類的搜索結果。Sweeny在她的研究中發現,出現黑人名字的逮捕記錄比例比白人多18%。谷歌已經解決了這個問題,盡管他們從未公開表示他們做了什么來糾正這個問題。
在過去幾年中,大數據的擴散已經看到指控其他的不當使用和偏見。這些指控是五花八門的,從網上的價格歧視和地理定位結果到犯罪預測技術,在一些公共工程決策中缺乏足夠代表性的數據樣本。
大數據的優勢是可以平衡應用現代技術以解決社會問題的風險。然而,一些質疑者認為,民主化數據在本質上影響著人們,從數據從業者到專家。
大數據將停留在這里
一些擁護者表示,問題不在于“大數據歧視”,但失敗的數據會讓專業人員曲解數據挖掘的結果的風險和統計學習的核心。他們還補充表示,帶來的好處遠遠大于擔憂。
紐約大學斯特恩商學院的分析中心主任Anindya Ghose說,“在我的學術研究和行業咨詢中,我已經看到了企業、組織和消費者使用數據驅動決策、利用數據科學和業務分析的巨大利益。”
Ghose還表示:“老實說,我不理解這些人在大數據的運用中關于對數據分析影響的恐懼和憤世嫉俗。
她表示,兌憤世嫉俗者和我們自己的一些忠告是:“大家仍有必要處理好大數據技術引發的這些倫理糾紛問題,否則大數據分析的應用層次就很難再進一步。”