基于大數(shù)據(jù)所做的決策真能做到絕對的“公正無私”嗎?在專注研究大數(shù)據(jù)對公共生活以及社會(huì)產(chǎn)生影響的一些研究人員看來,這個(gè)問題的答案似乎并不是肯定的。
在信息化時(shí)代,憑借著對強(qiáng)大預(yù)測技術(shù)的使用,大數(shù)據(jù)業(yè)務(wù)正逐漸成為越來越多機(jī)構(gòu)轉(zhuǎn)型過程中的核心資產(chǎn),但大數(shù)據(jù)的流行也令依托其而生的決策機(jī)制成為了研究人員們關(guān)注的重點(diǎn)。基于大數(shù)據(jù)所做的決策真能做到絕對的“公正無私”嗎?在專注研究大數(shù)據(jù)對公共生活以及社會(huì)產(chǎn)生影響的一些研究人員看來,這個(gè)問題的答案似乎并不是肯定的。
據(jù)美國CNBC網(wǎng)站5月9日報(bào)道,日前,紐約大學(xué)就組織了一場這方面的研究活動(dòng),該活動(dòng)關(guān)注的重點(diǎn)包括大數(shù)據(jù)在機(jī)器學(xué)習(xí)過程中的運(yùn)用,以及數(shù)據(jù)挖掘技術(shù)在幫助公眾以及私營企業(yè)管理者進(jìn)行決策的過程中引發(fā)的問題等。
報(bào)道稱,參與該研究活動(dòng)的專家包括政策研究者、技術(shù)員以及新聞?dòng)浾叩鹊取_@些人集中探討了大數(shù)據(jù)在幫助人們依托事實(shí)做出決策的同時(shí),是如何“無心地”設(shè)定了具有偏見性、歧視性的規(guī)則,從而催生相對應(yīng)的篩選過程的。
在這一場景中,所謂的規(guī)則其實(shí)也就是通常我們所說的“算法”,即為了實(shí)現(xiàn)某一特定目標(biāo)而催生的一系列在程序代碼設(shè)定下運(yùn)作的數(shù)學(xué)計(jì)算。批評(píng)人士認(rèn)為,許多的算法其實(shí)都蘊(yùn)含著偏見,并在不斷強(qiáng)化其內(nèi)置的假設(shè)。
目前政府機(jī)構(gòu)已經(jīng)開始審查因大數(shù)據(jù)的應(yīng)用而催生的一些道德問題。上周,美國白宮發(fā)布的一份報(bào)告就認(rèn)為,如果運(yùn)用不得當(dāng),一些數(shù)據(jù)的收集極有可能潛在地引發(fā)對公民權(quán)利的侵犯,該報(bào)告呼吁應(yīng)盡快建立對話機(jī)制,以確定如何在將對發(fā)揮技術(shù)潛力的同時(shí),盡可能地縮小侵犯公民隱私、引發(fā)不公正待遇等方面的風(fēng)險(xiǎn)。
本次研究活動(dòng)參與者之一、同時(shí)現(xiàn)任普林斯頓大學(xué)信息技術(shù)政策研究中心(the Center for Information Technology Policy at Princeton University)研究員的梭倫·巴羅卡(Solon Barocas)在2014年發(fā)表的名為《大數(shù)據(jù)的差異性影響》的報(bào)告中就指出,“推崇數(shù)據(jù)挖掘等依賴算法的技術(shù)的人們認(rèn)為,這類的決策過程完全摒棄了人類偏見,但事實(shí)上,算法到底有多準(zhǔn)確,完全要看數(shù)據(jù)本身。”
巴羅卡研究的正是機(jī)器學(xué)習(xí)等領(lǐng)域在實(shí)際應(yīng)用中產(chǎn)生的影響,以及其可能引發(fā)的道德以及認(rèn)知問題。他還強(qiáng)調(diào),數(shù)據(jù)的挖掘很有可能受到上一次決策過程的影響,或者反映一些社會(huì)廣義范圍內(nèi)存在的偏見。
換句話來說,巴羅卡認(rèn)為,機(jī)器學(xué)習(xí)的系統(tǒng),就是在運(yùn)用人類所設(shè)計(jì)的算法計(jì)算人類所制造的數(shù)據(jù),因此,每一個(gè)數(shù)據(jù)中都有可能蘊(yùn)含著這份數(shù)據(jù)制造者所懷有的一些潛在偏見。
在因大數(shù)據(jù)而生的“歧視”中,最經(jīng)常被引用的一個(gè)案例來自于哈佛大學(xué)數(shù)據(jù)隱私實(shí)驗(yàn)室(Data Privacy Lab at Harvard University)負(fù)責(zé)人拉坦婭·斯威尼(Latanya Sweeny)所進(jìn)行的一項(xiàng)研究,該案例引用了在互聯(lián)網(wǎng)上搜索一些特定姓名時(shí),包括谷歌等渠道所反饋給搜索人的結(jié)果。斯威尼發(fā)現(xiàn),比較生僻、容易和黑人聯(lián)系在一起的名字,搜索后顯示結(jié)果中包含的逮捕記錄數(shù)量,要明顯高于用白種人常見名搜索所得。谷歌隨后修正了這一問題,但他們究竟是如何做到的,這一點(diǎn)從來沒有對外公開過。
大數(shù)據(jù)的廣泛應(yīng)用,在過去幾年里還引發(fā)了其他一些對于該技術(shù)使用不當(dāng)以及具備偏見性的指控,這些指控來自于方方面面。這其中也包括執(zhí)法部門使用的犯罪預(yù)測技術(shù)等等。很顯然,在一些人眼中,運(yùn)用大數(shù)據(jù)技術(shù)給人們帶來的便利,需要和使用該項(xiàng)技術(shù)解決社會(huì)問題時(shí)可能引發(fā)的風(fēng)險(xiǎn)放在一起均衡地考慮。
但大數(shù)據(jù)技術(shù)的推崇者們認(rèn)為,問題其實(shí)并不在于“大數(shù)據(jù)歧視”,只是因?yàn)閿?shù)據(jù)專家們誤讀了數(shù)據(jù)挖掘和統(tǒng)計(jì)學(xué)習(xí)所得的結(jié)果。他們認(rèn)為,大數(shù)據(jù)帶來的福利,要遠(yuǎn)比它所引發(fā)的擔(dān)憂重要。
“在我學(xué)術(shù)研究以及從事咨詢的生涯中,我已經(jīng)見證了無數(shù)個(gè)運(yùn)用大數(shù)據(jù)進(jìn)行決策、分析,給企業(yè)、機(jī)構(gòu)以及消費(fèi)者帶來便利的案例,”紐約大學(xué)斯特恩商學(xué)院商業(yè)分析中心(Center for Business Analytics at New York University's Stern School of Business)主任德亞·高斯(Anindya Ghose)表示,“說句實(shí)話,我不太能理解那些大數(shù)據(jù)技術(shù)的批評(píng)者們兜售的數(shù)據(jù)分析應(yīng)用有多 恐怖 的觀點(diǎn)。”
“對那些批評(píng)者,以及對我們心存警惕的人們,我要說一句,處理好你的情緒,大數(shù)據(jù)分析將常青不朽,”高斯說。