大數據分析在為某些企業帶來商業利益的同時,也會構成對個體的歧視,并可能觸犯消費者數據保護條例。
對企業來說,大數據意味著難以抗拒的商業機會。但是,其中也蘊含著極大的風險,比如對特定群體或個體的歧視。2012年,當桑迪颶風肆虐時,在10月27日到11月1日之間,推特上產生了超過2千萬條相關的消息,其中包含了大量關于颶風和受災人群的信息。通過對這類信息的分析,有助于形成救災資源配置方面的決策。但是,由于來自于受災最重地區的推特消息較少,造成了一定程度上的誤導和延遲。當時,隨著颶風的推進,所到之處電力供應受到嚴重影響,導致重災區人群無法發出大量的網絡消息。
最近,聯邦貿易委員會在名為《Big data: Tool for Exclusion or Inclusion?》的報告中指出,與桑迪颶風相關的推特消息形成了不準確的數據視圖,無法正確指向受災最重的地區以及最需要幫助的人群。在報告中,該委員會對目前熱衷于用戶大數據分析的企業提出了警告,希望不要因為大數據的運用而形成對特定群體和個人的歧視,從而觸犯相關的法律法規。同時,報告中還列出了一系列的問題供企業進行自我審查,防止大數據分析違反消費者數據保護或平權法案。
下面是關于這方面問題的FAQ。
大數據分析如何會觸犯與歧視相關的聯邦法律?大數據分析與風險同行,包括錯誤的預測。在信貸、雇傭或教育等方面,企業的實踐對特定群體形成了歧視,就會面臨著觸犯相關法律法規的風險。
聯邦貿易委員會在其報告中指出,如果基于某些群體共性特征來指導針對特定個體的業務決策,則可能會導致機會提供方面的不平等性。更進一步,可能會加深不同群體之間待遇的差異性,或者造成新的歧視現象。傳統上,業界是基于信用相關的信息來構建信用評分模型。但是,如果利用大數據分析,對信用相關信息的依賴性就會大大降低,比如基于郵政編碼或社交媒體使用量來對信用水平進行預測分析。這些信息,顯然是具有歧視性的。
相關內容
聯邦貿易委員會報告
報道:大數據分析是否危害消費者?
當運用大數據分析時,需要特別注意哪部法律法規?《公平信用報告法案》(Fair Credit Reporting Act)、《聯邦貿易委員會法案》(Federal Trade Commission Act)以及一些可能會對大數據分析起到規制作用的平權類聯邦法案。
《公平信用報告法案》(The Fair Credit Reporting Act,FCRA):消費者報告服務機構的主要業務模式是收集和售賣個人數據,所影響的領域包括征信、雇傭、保險、租房等。這些機構處于公平信用報告法案的監管范疇之內,比如要通過合理的流程來確保信用報告的準確性,同時為信息主體提供訪問自身數據并提出異議的服務渠道。
《聯邦貿易委員會法案》(Federal Trade Commission Act,FTCA):聯邦貿易委員會法案的第5部分對從事大數據分析的企業形成了一定的約束。如果企業的大數據實踐可能會導致對消費者的傷害(只要這種傷害并非不可避免,或總體來說對消費者弊大于利),則就會被認定為違規。企業不能違背在信息共享方面對用戶的承諾,同時必須確保所披露的信息是客觀真實的。
確保機會公平性的相關法律:在關于機會的公平性方面,某些聯邦法律是從事大數據實踐的企業必須遵守的,比如《公平信貸法》(Equal Credit Opportunity Act,ECOA)、《美國殘疾人法》(Americans with Disabilities Act)、《就業年齡差異法》(Age Discrimination in Employment Act)、《公平住房法》(Fair Housing Act)、《基因歧視法案》(Genetic Information Nondiscrimination Act)、《1964年民權法》第二章(Title VII of the Civil Rights Act of 1964)等。在這些法律的監管下,企業不能因種族、膚色、性別、宗教、年齡、身體、出生國、婚姻狀況和基因信息等因素形成對個人或群體的歧視。
《公平信貸法》規定,征信機構不得基于上述因素對消費者差別對待,并遵守關于數據保存和信息公開方面的規定。
《公平信用報告法》保障信用報告的準確和公平
彭博:大數據分析所導致的法律問題
在避免歧視或差別化方面,從事大數據分析的企業應注意哪些問題?那些運用大數據分析的企業應該進行自審,判斷是否有與種族或宗教等因素相關的歧視性業務實踐?是否對某類受法律保護的人群有負面作用?是否信守了數據保護方面的承諾?大數據實踐過程是否對用戶透明?數據安全保障的機制是否有效?
大數據相關的安全防護措施應該與敏感程度、數據規模、處理過程的復雜度以及安全保護的成本相匹配。比如,與僅僅保留個人姓名數據的企業相比,保存有個人醫療數據或社會安全號的企業就應該采取更為嚴格和全面的監管措施。
聯邦貿易委員會建議,在進行分析之前,首先要確保數據具有代表性。有些特定人群的數據,可能相對稀缺,比如,遠離技術的人群、未參與到主流經濟生態的人群以及不愿意過多分享個人信息的人群。對此,委員會建議,企業必須謹防數據模型中隱藏的偏差,厘清統計關聯性和因果性之間的區別。因此,企業需要詳盡審視相關模型所依賴的因子,把握好預測分析與公平性之間的平衡關系。
相關內容
聯邦貿易委員會對大數據時代用戶數據的保護提示
消解大數據偏差的關鍵之處
在合規方面,運用大數據分析的企業應該注意哪些具體的對應細則?將大數據分析用于形成征信、雇傭、承保、租房、社會福利等方面的企業,必須審查自己是否遵守了《聯邦貿易委員會法案》的隱私和公平類條款。在流程建設上,必須盡可能確保數據的準確性,并允許消費者能訪問自身數據并就錯誤或遺漏提出異議。而且,企業還要防止大數據分析被用于欺詐或歧視性的目的。
另一方面,從外部引入數據或技術用于上述領域的企業同樣需要注意遵守《聯邦貿易委員會法案》。比如,將大數據運用于招聘的公司,必須確保自身接收數據是合法的,沒有觸犯相關的平權法案,并主動告知信息主體。