當(dāng)前位置：人工智能 → 行業(yè)動(dòng)態(tài) → 正文

9個(gè)備受關(guān)注的由數(shù)據(jù)分析和AI的錯(cuò)誤引發(fā)的事件

責(zé)任編輯：cres 作者：Thor Olavsrud |來源：企業(yè)網(wǎng)D1Net 2023-09-26 15:32:00 原創(chuàng)文章企業(yè)網(wǎng)D1Net

2017年，《經(jīng)濟(jì)學(xué)人》宣布，數(shù)據(jù)已成為世界上最有價(jià)值的資源，而不是石油。從那以后，各個(gè)行業(yè)的企業(yè)一直并將繼續(xù)在數(shù)據(jù)和分析方面投入巨資，但與石油一樣，數(shù)據(jù)和分析也有其陰暗面。

《2023年CIO狀況報(bào)告》的數(shù)據(jù)顯示，34%的IT領(lǐng)導(dǎo)者表示，數(shù)據(jù)和業(yè)務(wù)分析將推動(dòng)其企業(yè)今年的最大IT投資。26%的IT領(lǐng)導(dǎo)者表示，ML/AI將推動(dòng)最大的IT投資。從ML算法驅(qū)動(dòng)的分析和行動(dòng)中獲得的見解可以為企業(yè)帶來競(jìng)爭(zhēng)優(yōu)勢(shì)，但錯(cuò)誤可能會(huì)給聲譽(yù)、收入甚至生命帶來代價(jià)。

了解你的數(shù)據(jù)及其告訴你的信息很重要，同時(shí)，了解你的工具、了解你的數(shù)據(jù)并牢記你企業(yè)的價(jià)值觀也很重要。

以下是過去十年的幾個(gè)備受矚目的數(shù)據(jù)分析和AI領(lǐng)域中發(fā)生的錯(cuò)誤，以說明可能會(huì)出什么問題。

Gannett利用AI撰寫的體育方面的文章出現(xiàn)錯(cuò)誤

2023年8月，報(bào)業(yè)連鎖店Gannett宣布將暫停使用一種名為L(zhǎng)edeAI的AI工具，此前AI撰寫的幾篇新聞稿因重復(fù)、糟糕和缺乏關(guān)鍵細(xì)節(jié)而在網(wǎng)上瘋傳。

美國(guó)有線電視新聞網(wǎng)舉了一個(gè)例子，由互聯(lián)網(wǎng)檔案館的Wayback Machine保存，它的開頭是：“沃辛頓基督徒在周六的一場(chǎng)俄亥俄州男孩足球比賽中以2：1擊敗了韋斯特維爾北部。”

CNN在其他Gannett當(dāng)?shù)貓?bào)紙上發(fā)現(xiàn)了LedeAI寫的類似故事，包括路易斯維爾信使日?qǐng)?bào)、今日佛羅里達(dá)州亞利桑那州中心和密爾沃基日?qǐng)?bào)哨兵報(bào)。

在這些故事在社交媒體上遭到嚴(yán)厲嘲諷后，Gannett選擇暫停在所有使用LedeAI服務(wù)的當(dāng)?shù)厥袌?chǎng)使用LedeAI。

在給CNN的一份聲明中，LedeAI的CEO杰伊·奧爾雷德表達(dá)了歉意，并承諾將全天候努力糾正這些問題。

ITutorGroup利用AI進(jìn)行招聘時(shí)AI因年齡原因拒絕申請(qǐng)者

2023年8月，輔導(dǎo)公司iTutorGroup同意支付36.5萬(wàn)美元了結(jié)美國(guó)平等就業(yè)機(jī)會(huì)委員會(huì)(EEOC)提起的訴訟。聯(lián)邦機(jī)構(gòu)表示，該公司為中國(guó)的學(xué)生提供遠(yuǎn)程輔導(dǎo)服務(wù)，使用AI招聘軟件，自動(dòng)拒絕55歲及以上的女性申請(qǐng)者和60歲及以上的男性申請(qǐng)者。

平等就業(yè)機(jī)會(huì)委員會(huì)表示，該軟件已自動(dòng)拒絕了200多名符合條件的申請(qǐng)者。

“年齡歧視是不公正和非法的，”平等就業(yè)機(jī)會(huì)委員會(huì)主席夏洛特·A·伯羅斯在一份聲明中說。“即使技術(shù)使歧視行為自動(dòng)化，雇主仍負(fù)有責(zé)任。”

ITutorGroup否認(rèn)有任何不當(dāng)行為，但確實(shí)決定了結(jié)這起訴訟。作為和解和同意法令的一部分，它同意采取新的反歧視政策。

ChatGPT讓法庭案件產(chǎn)生幻覺

大型語(yǔ)言模型在2023年取得的進(jìn)展，引發(fā)了人們對(duì)AIGC在幾乎每個(gè)行業(yè)的變革潛力的廣泛興趣。OpenAI的ChatGPT一直處于這股興趣激增的中心，預(yù)示著富于創(chuàng)造力的AI將如何在幾乎商業(yè)的每一個(gè)角落顛覆工作性質(zhì)。

但這項(xiàng)技術(shù)在能夠可靠地接管大多數(shù)業(yè)務(wù)流程之前還有很長(zhǎng)的路要走，律師史蒂文·A·施瓦茨在2023年發(fā)現(xiàn)自己在使用ChatGPT研究哥倫比亞航空公司Avianca訴訟的先例后，遇到了美國(guó)地區(qū)法官P.Kevin Castel的麻煩。

施瓦茨是Levidow，Levidow&Oberman律師事務(wù)所的律師，他使用OpenAIAIGC聊天機(jī)器人找到了之前的案例，以支持Avianca員工羅伯托·馬塔在2019年因受傷而提起的訴訟。唯一的問題是?在案情摘要中提交的案件中，至少有六起不存在。在5月份提交的一份文件中，卡斯特爾法官指出，施瓦茨提交的案件包括假姓名和案卷編號(hào)，以及虛假的內(nèi)部引用和引用。施瓦茨的伴侶彼得·洛杜卡是馬塔的記錄律師，并在案情摘要上簽字，這讓他自己也處于危險(xiǎn)之中。

在一份宣誓書中，施瓦茨向法庭表示，這是他第一次使用ChatGPT作為法律研究來源，他“沒有意識(shí)到其內(nèi)容可能是虛假的。”他承認(rèn)，他沒有證實(shí)AI聊天機(jī)器人提供的消息來源。他還表示，他“非常后悔利用產(chǎn)生式AI來補(bǔ)充本文所進(jìn)行的法律研究，在沒有對(duì)其真實(shí)性進(jìn)行絕對(duì)核實(shí)的情況下，今后永遠(yuǎn)不會(huì)這樣做。”

2023年6月，卡斯特爾法官對(duì)施瓦茨和洛杜卡處以5000美元的罰款。在6月份的另一項(xiàng)裁決中，卡斯特爾法官駁回了馬塔對(duì)Avianca的訴訟。

AI算法可以識(shí)別除新冠肺炎以外的所有東西

自新冠肺炎疫情爆發(fā)以來，許多企業(yè)尋求應(yīng)用機(jī)器學(xué)習(xí)(ML)算法來幫助醫(yī)院更快地診斷或分流患者。但根據(jù)英國(guó)國(guó)家數(shù)據(jù)科學(xué)和AI中心圖靈研究所的說法，預(yù)測(cè)工具幾乎沒有作用。

《麻省理工學(xué)院技術(shù)評(píng)論》記錄了一系列的失敗，其中大部分源于工具訓(xùn)練或測(cè)試方式的錯(cuò)誤。使用錯(cuò)誤標(biāo)簽的數(shù)據(jù)或來自未知來源的數(shù)據(jù)是常見的罪魁禍?zhǔn)住?/div>

劍橋大學(xué)的機(jī)器學(xué)習(xí)研究員Derek Driggs和他的同事在《自然機(jī)器智能》雜志上發(fā)表了一篇論文，探索了深度學(xué)習(xí)模型在診斷病毒方面的使用。本文認(rèn)為該技術(shù)不適合臨床應(yīng)用。例如，Driggs的團(tuán)隊(duì)發(fā)現(xiàn)他們自己的模型是有缺陷的，因?yàn)樗窃谝粋€(gè)數(shù)據(jù)集上訓(xùn)練的，該數(shù)據(jù)集包括掃描時(shí)躺著的患者和站著的患者的掃描結(jié)果。躺著的患者更有可能患上重病，所以算法學(xué)會(huì)了根據(jù)掃描中人的位置來識(shí)別冠狀病毒感染的風(fēng)險(xiǎn)。

一個(gè)類似的例子包括一個(gè)用數(shù)據(jù)集訓(xùn)練的算法，該數(shù)據(jù)集包括對(duì)健康兒童的胸部掃描。該算法學(xué)會(huì)了識(shí)別兒童，而不是高危患者。

Zillow減記數(shù)百萬(wàn)美元，因利用算法購(gòu)房造成的災(zāi)難而大幅裁員

2021年11月，在線房地產(chǎn)市場(chǎng)Zillow告訴股東，將在未來幾個(gè)季度結(jié)束Zillow提供的業(yè)務(wù)，并裁員25%-約2000名員工。房屋翻轉(zhuǎn)單元的困境是它用來預(yù)測(cè)房?jī)r(jià)的機(jī)器學(xué)習(xí)算法錯(cuò)誤率的結(jié)果。

Zillow Offers是一個(gè)項(xiàng)目，通過該項(xiàng)目，該公司根據(jù)從機(jī)器學(xué)習(xí)算法得出的房屋價(jià)值的“Z估計(jì)”，對(duì)房產(chǎn)進(jìn)行現(xiàn)金報(bào)價(jià)。他們的想法是對(duì)房產(chǎn)進(jìn)行翻新，并迅速將其轉(zhuǎn)手。但Zillow的一位發(fā)言人告訴CNN，該算法的錯(cuò)誤率中值為1.9%，對(duì)于非市場(chǎng)房屋來說，錯(cuò)誤率可能要高得多，高達(dá)6.9%。

美國(guó)有線電視新聞網(wǎng)報(bào)道，自2018年4月推出以來，Zillow通過Zillow優(yōu)惠購(gòu)買了2.7萬(wàn)套住房，但截至2021年9月底僅售出1.7萬(wàn)套。新冠肺炎疫情和房屋翻修勞動(dòng)力短缺等黑天鵝事件導(dǎo)致了該算法的準(zhǔn)確性問題。

Zillow表示，該算法導(dǎo)致其無意中以高于目前對(duì)未來售價(jià)的估計(jì)的價(jià)格購(gòu)買了房屋，導(dǎo)致2021年第三季度的庫(kù)存減記3.04億美元。

在宣布這一消息后與投資者舉行的電話會(huì)議上，Zillow聯(lián)合創(chuàng)始人兼首席執(zhí)行官里奇·巴頓表示，或許可以調(diào)整算法，但最終風(fēng)險(xiǎn)太大。

醫(yī)療保健算法未能標(biāo)記黑人患者

2019年，發(fā)表在《科學(xué)》雜志上的一項(xiàng)研究顯示，全美醫(yī)院和保險(xiǎn)公司用來識(shí)別需要高風(fēng)險(xiǎn)護(hù)理管理計(jì)劃的患者的醫(yī)療保健預(yù)測(cè)算法，挑出黑人患者的可能性要小得多。

高風(fēng)險(xiǎn)護(hù)理管理方案為慢性病患者提供訓(xùn)練有素的護(hù)理人員和初級(jí)保健監(jiān)測(cè)，以努力預(yù)防嚴(yán)重并發(fā)癥。但該算法更有可能推薦白人患者參加這些項(xiàng)目，而不是黑人患者。

研究發(fā)現(xiàn)，該算法使用醫(yī)療支出作為確定個(gè)人醫(yī)療需求的指標(biāo)。但根據(jù)科學(xué)美國(guó)人的數(shù)據(jù)，病情較重的黑人患者的醫(yī)療成本與較健康的白人患者的成本持平，這意味著即使他們的需求更大，他們獲得的風(fēng)險(xiǎn)分?jǐn)?shù)也更低。

這項(xiàng)研究的研究人員表示，可能有幾個(gè)因素起到了作用。首先，有色人種更有可能收入較低，即使在有保險(xiǎn)的情況下，這也可能使他們更難獲得醫(yī)療保健。隱含的偏見也可能導(dǎo)致有色人種接受質(zhì)量較低的護(hù)理。

雖然這項(xiàng)研究沒有透露算法或開發(fā)者的名字，但研究人員告訴《科學(xué)美國(guó)人》，他們正在與開發(fā)者合作解決這種情況。

DataSet訓(xùn)練微軟聊天機(jī)器人發(fā)出種族主義推文

2016年3月，微軟了解到，使用Twitter互動(dòng)作為機(jī)器學(xué)習(xí)算法的訓(xùn)練數(shù)據(jù)可能會(huì)產(chǎn)生令人沮喪的結(jié)果。

微軟在社交媒體平臺(tái)上發(fā)布了AI聊天機(jī)器人Tay。該公司將其描述為“對(duì)話理解”的一次實(shí)驗(yàn)。當(dāng)時(shí)的想法是，聊天機(jī)器人將扮演少女的角色，并通過機(jī)器學(xué)習(xí)和自然語(yǔ)言處理相結(jié)合的方式通過Twitter與個(gè)人互動(dòng)。微軟為它播種了匿名的公共數(shù)據(jù)和一些喜劇演員預(yù)先編寫的材料，然后讓它自由發(fā)揮，從它在社交網(wǎng)絡(luò)上的互動(dòng)中學(xué)習(xí)和進(jìn)化。

在16個(gè)小時(shí)內(nèi)，聊天機(jī)器人發(fā)布了超過9.5萬(wàn)條推文，這些推文迅速變成了公開的種族主義、厭女者和反猶太主義者。微軟很快暫停了這項(xiàng)服務(wù)，進(jìn)行了調(diào)整，并最終取消了這項(xiàng)服務(wù)。

事件發(fā)生后，微軟研究與孵化公司副總裁(時(shí)任微軟醫(yī)療保健公司副總裁)彼得·李在微軟官方博客上發(fā)帖稱：“我們對(duì)泰的無意識(shí)冒犯和傷害性推文深表歉意，這些推文并不代表我們是誰(shuí)，我們代表的是什么，也不代表我們是如何設(shè)計(jì)泰伊的。”

Lee指出，Tay的前任小冰，由微軟于2014年在中國(guó)發(fā)布，在Tay發(fā)布之前的兩年里，已經(jīng)成功地與4000多萬(wàn)人進(jìn)行了對(duì)話。微軟沒有考慮到的是，一群Twitter用戶會(huì)立即開始向Tay發(fā)布種族主義和厭惡女性的言論。機(jī)器人很快就從這些材料中吸取了教訓(xùn)，并將其納入了自己的推文。

盡管我們已經(jīng)為許多類型的濫用系統(tǒng)做好了準(zhǔn)備，但我們對(duì)這次特定的攻擊進(jìn)行了嚴(yán)重的疏忽。因此，泰在推特上發(fā)布了極其不恰當(dāng)和應(yīng)受譴責(zé)的文字和圖片。

亞馬遜AI招聘工具僅推薦男性

像許多大公司一樣，亞馬遜渴望能夠幫助其人力資源部門篩選出最佳應(yīng)聘者的工具。2014年，亞馬遜開始研發(fā)AI招聘軟件來實(shí)現(xiàn)這一目標(biāo)。只有一個(gè)問題：這一制度大大偏愛男性候選人。2018年，路透社爆出亞馬遜放棄該項(xiàng)目的消息。

亞馬遜的系統(tǒng)給應(yīng)聘者打出了從1到5的星級(jí)。但系統(tǒng)核心的機(jī)器學(xué)習(xí)模型是根據(jù)提交給亞馬遜的10年簡(jiǎn)歷進(jìn)行訓(xùn)練的，其中大部分是男性簡(jiǎn)歷。作為培訓(xùn)數(shù)據(jù)的結(jié)果，該系統(tǒng)開始懲罰簡(jiǎn)歷中包含“女性”一詞的短語(yǔ)，甚至降低了全女子大學(xué)的候選人的等級(jí)。

當(dāng)時(shí)，亞馬遜表示，亞馬遜招聘人員從未使用過該工具來評(píng)估應(yīng)聘者。

該公司試圖對(duì)該工具進(jìn)行編輯，使其保持中立，但最終決定不能保證不會(huì)學(xué)習(xí)其他一些歧視性的排序候選人的方法，并終止了該項(xiàng)目。

Target的分析侵犯了隱私

2012年，零售業(yè)巨頭塔吉特(Target)的一個(gè)分析項(xiàng)目展示了公司可以從數(shù)據(jù)中了解到多少客戶信息。據(jù)《紐約時(shí)報(bào)》報(bào)道，塔吉特的市場(chǎng)部在2002年開始考慮如何確定客戶是否懷孕。這一系列調(diào)查導(dǎo)致了一個(gè)預(yù)測(cè)性分析項(xiàng)目，眾所周知，該項(xiàng)目將導(dǎo)致這家零售商無意中向一名十幾歲女孩的家人透露她懷孕了。這反過來會(huì)導(dǎo)致各種文章和營(yíng)銷博客將這一事件作為避免“令人毛骨悚然的因素”的建議的一部分。

塔吉特的市場(chǎng)部想要識(shí)別懷孕的人，因?yàn)樵谏钪械哪承r(shí)期--尤其是懷孕--人們最有可能從根本上改變他們的購(gòu)買習(xí)慣。例如，如果塔吉特能夠在這段時(shí)間接觸到客戶，它就可以培養(yǎng)這些客戶的新行為，讓他們轉(zhuǎn)向塔吉特購(gòu)買食品雜貨、服裝或其他商品。

像所有其他大型零售商一樣，塔吉特一直在通過購(gòu)物者代碼、信用卡、調(diào)查等方式收集客戶數(shù)據(jù)。它將這些數(shù)據(jù)與人口統(tǒng)計(jì)數(shù)據(jù)和它購(gòu)買的第三方數(shù)據(jù)混合在一起。通過對(duì)所有這些數(shù)據(jù)的分析，Target的分析團(tuán)隊(duì)確定了Target銷售的大約25種產(chǎn)品，這些產(chǎn)品可以一起分析，以生成“懷孕預(yù)測(cè)”分?jǐn)?shù)。然后，營(yíng)銷部門可以通過優(yōu)惠券和營(yíng)銷信息瞄準(zhǔn)得分較高的客戶。

進(jìn)一步的研究將揭示，研究客戶的生殖狀況可能會(huì)讓其中一些客戶感到毛骨悚然。根據(jù)《泰晤士報(bào)》的報(bào)道，該公司并沒有放棄定向營(yíng)銷，但確實(shí)開始在他們知道孕婦不會(huì)購(gòu)買的東西的廣告中加入——包括割草機(jī)廣告和尿布廣告——讓消費(fèi)者感覺廣告組合是隨機(jī)的。

關(guān)于企業(yè)網(wǎng)D1net(hfnxjk.com)：

國(guó)內(nèi)主流的to B IT門戶，同時(shí)在運(yùn)營(yíng)國(guó)內(nèi)最大的甲方CIO專家?guī)旌椭橇敵黾吧缃黄脚_(tái)-信眾智(www.cioall.com)。同時(shí)運(yùn)營(yíng)19個(gè)IT行業(yè)公眾號(hào)(微信搜索D1net即可關(guān)注)。

版權(quán)聲明：本文為企業(yè)網(wǎng)D1Net編譯，轉(zhuǎn)載需在文章開頭注明出處為：企業(yè)網(wǎng)D1Net，如果不注明出處，企業(yè)網(wǎng)D1Net將保留追究其法律責(zé)任的權(quán)利。

關(guān)鍵字：AI 數(shù)據(jù)分析