2016年1月6日美國聯邦貿易委員會(FTC)發布了一份題為《大數據:包容工具抑或排斥工具》(Big Data: A Tool for Inclusion or Exclusion?)的研究報告,介紹了大數據的生命周期、大數據技術應用給消費者帶來的利益和風險,探討了應當如何利用大數據,使人們既能充分享受其給社會帶來的利益,又能最小化其法律和道德風險。
一、大數據技術利用爭論
智能手機、電腦和其他聯網設備的普及以及隨之而來的消費者數據的體量劇增和大范圍流動,將我們推入大數據時代。大數據分析技術能夠引導新產品和服務研發、預測個人偏好、幫助定制服務和機會并指導個性化營銷方案,因此它對于企業和消費者都十分有價值,越來越多的公司開始積極使用大數據技術。
一些人認為,大數據分析技術為提高消費者福利提供了無數機會。例如,大數據正在幫助將教育、信貸、醫療和就業機會定位到低收入和缺乏服務的人群,使之獲得傳統技術條件下所無法獲得的機會。另一些人認為,大數據生命周期(收集、匯編和整合、分析、使用)的各階段都可能產生錯誤和偏見,這些都可能導致潛在的歧視并進而對消費者產生不利。另外,還有人既承認大數據利用不可避免地會產生歧視問題,但是也相信充分的市場競爭能夠糾正那些出現錯誤的數據分析及其應用。
二、美國對大數據的政策態度
自大數據挖掘技術及其應用環境成熟以來,美國一直對大數據技術應用持積極支持和鼓勵的政策態度,并主張利用大數據提高消費者福利。自2010年起,奧巴馬政府發動了一系列“我的數據”(My Data)行動以使美國公民能夠安全的獲取其個人數據,并鼓勵能夠使用和分析這些數據的私人部門發展,使之更好地為公民提供應用和服務,這些行動目的在于使消費者能夠安全地獲得其健康、稅務、能源使用和教育等信息,為其更好地管理其工作和生活、高效獲取社會福利提供便利。然而在這一過程,公民個人由于技術條件和知識水平限制難以取得行動的主動權,其數據權利處于容易受到政府和企業侵犯的風險之中。
自計算機技術產生以來,制定法律防止公權力和其他私主體侵犯個人信息就成為了美國的立法重點。與許多國家制定專門法律保護個人數據權利的立法模式(典型如歐盟及其成員國)不同,美國采取分散式立法的模式,即在公共部門范疇下,通過制定《信息自由法》和《隱私法案》限制公權力侵犯個人信息權利;在私人部門范疇下,在金融、電信、醫療等行業領域的市場管理規則中針對不同情況嵌入了個人信息保護條款。同時,作為高度重視新技術發展和創新的國家,美國在個人信息保護方面推行行業自律,包括通過網絡隱私權保護的自律組織制定行業指引或提供隱私認證;同時,通過與歐盟簽署數據共享協議(即“安全港協議”),以便利企業在歐盟和美國之間傳輸和利用數據。然而這些制度架構與快速發展的大數據實踐相比,顯得有些滯后了,無法很好地在技術利用與非經濟價值的保護之間取得平衡。
2014年5月,美國總統執行辦公室發布2014年全球“大數據”白皮書——《大數據:把握機遇,守護價值》(Big Data: Seize Opportunities, Preserving Values),從政策調整、法律制定、法律解釋和技術革新幾個方面對大數據時代下完善公民個人數據保護提出了建議,試圖解決大數據利用與公民信息保護價值之間的沖突,以釋放大數據為經濟社會發展帶來的新動能。
這種通過改進政策框架、法律規則及法律解釋,解決利益沖突、釋放新技術動能的規制思維,也延續到美國當前對于如何正確利用大數據以充分保護消費者的討論中。
三、應考慮的消費者保護法律問題
大數據在收集、匯編和分析過程中的技術性和操作性偏差,以及大數據分析報告的使用不當,可能導致對某些消費者群體進行不當分類,并進而對其不當采取歧視措施。因此,FTC建議美國企業應當與時俱進地理解大數據時代下的消費者保護法,包括《公平信用報告法》(Fair Credit Reporting Act)、公平機會法律以及《聯邦貿易委員會法》(Federal Trade Commission Act)等可能會適用于大數據實踐的法律。
(一)合理界定消費者征信機構
美國的《公平信用報告法》適用于消費者征信機構(Consumer Reporting Agencies, CRA),并規定了這些機構應當遵守的合理程序,以確保消費者征信報告最大程度的精確性。消費征信機構,指收集并出售消費者報告,為在貸款、就業、保險、住房或其他特定利益或交易中判斷消費者是否合格提供決策依據。傳統上,消費者征信機構僅包括信貸部門、就業背景審查公司等為消費者合格決定提供特別服務的特殊公司。但在大數據時代下,一些數據中間商也被認為是消費者征信機構(尤其是當這些中間商打出其提供合格性征信服務的廣告的情況下),因此應當接受《公平信用報告法》的管轄,履行該法律項下的法定義務。
近來,有一種預測性的大數據分析報告受到歡迎,即與傳統的征信報告主要考察債務償還歷史不同,這種預測性分析報告使用一些非傳統的參數(例如如郵政編碼、社交網絡使用情況、購物歷史等),以分析消費者的信用風險。FTC認為,《公平信用報告法》也以同樣的標準適用于這種類型報告,其涉及的消費者征信機構應當履行相應的法定義務,以確保消費者獲得公正的評價。
(二)確保公平機會法律得到有效執行
FTC認為美國企業也應當考慮其利用大數據的過程中是否充分遵循了數項聯邦公平機會法律,包括《公平信貸機會法》(Equal Credit Opportunity Act, ECOA)、《1964年民權法》第2章(Title VII of the Civil Rights Act of 1964)、《美國殘疾人法》(Americans with Disabilities Act)、《就業年齡差異法》(Age Discrimination in Employment Act)、《公平住房法》(Fair Housing Act)、《反基因歧視法》(Genetic Information Nondiscrimination Act),這些法律禁止基于種族、膚色、性別、宗教、年齡、殘疾狀態、出生國籍、婚姻狀況、基因信息的歧視。其中,FTC負責執行《公平信貸機會法》,這部法律禁止信貸歧視行為。如果信貸機構對信貸申請人采取了“差別待遇”(disparate treatment)或“差別影響”(disparate impact)措施,那么FTC將認定該信貸機構違反了《公平信貸機會法》。其中,“差別影響”指企業所采取的財務上中立的政策或實踐但是對于受保護群體產生了不成比例的不利影響,除非這種政策和實踐在商業上必要并且沒有其他歧視性影響更小的替代性措施。
另外,FTC還對廣告行為是否涉及公平機會法律給予了關注。在大多數情況下,信貸機構發送的吸引貸款的廣告是公開的,所有人都可以申請貸款。《公平信貸機會法》的“規則B”禁止貸款機構對以口頭或數據形式在廣告或其他實踐中阻止特定消費者合理的貸款申請選擇,并要求信貸機構保存其挑選潛在的廣告接受者的選擇標準和廣告文案。在大數據時代下,即使相關的廣告行為是公開的,但是在一些案例中,美國司法部仍然將信貸機構的投放廣告的選擇方式作為其采取了歧視措施的證據,這是因為廣告和營銷實踐可能影響信貸機構后續的貸款模式和貸款者獲得貸款條件。
(三)防止大數據分析中采取不公平行為
《聯邦貿易委員會法》第5節禁止在大數據分析中采取不公平或欺騙性的行為或實踐。參與大數據分析的企業應當考慮其行為是否違反了對消費者的重要承諾(包括避免與第三方機構分享數據,向消費者提供數據分享選擇,保護消費者個人信息等),以及其是否未能向消費者披露重要信息。另外,保存涉及消費者信息大數據的企業應當采取合理措施確保消費者數據的安全。
進一步地,作為一個最低限度的標準,如果大數據分析機構知道或者應當知道其顧客將為了欺騙或歧視性的目的而使用大數據分析報告,《聯邦貿易委員會法》禁止其應當出售相關分析報告。
四、FTC對企業實踐提出的建議
為了最大化大數據利用帶來的利益并限制其可能對受保護人群帶來的不利影響,FTC鼓勵企業在大數據利用實踐中考慮以下幾個問題:
(一)數據集是否具有代表性?
企業應當考慮其數據集是否遺漏了有關特定人群的信息,并采取步驟解決此種代表性不足或代表性過度問題。例如,如果某個企業將其服務鎖定為通過某種應用或社交網絡進行交流的群體,這家公司可能會忽略那些對科技產品并不精通的人群。
(二)使用的數據模型是否導致偏見?
在大數據生命周期的收集和分析階段,企業應當注意偏見是否被予以了適當考慮,并采取措施克服它們。例如,如果某家公司使用的算法只將那些來自頂尖大學的學生納入計算范圍,以幫助其做出雇傭選擇,那么它在招募過程中就可能存在預設的偏見。
(三)基于大數據進行預測的準確性如何?
應當牢記的是,雖然大數據在檢測相關性上十分有效,但它無法解釋這些相關性是否有意義。“谷歌流感趨勢”(Google Flu Trends)——一款基于谷歌搜索關鍵詞預測流感病例數量的機器學習算法——很好地說明了這種局限。一開始這種算法似乎總能準確預測哪些地方流感更流行,但是時間一長,其錯誤率變得十分高。這可能是因為谷歌流感趨勢的算法未能考慮某些特定參數,例如,在當地新聞報道流感爆發的時候人們比平時更可能去搜索流感信息,即使流感爆發地點遠在十萬八千里以外。
(四)對大數據的依賴是否導致道德或公平性問題?
企業應當評估那些納入分析模型的因素,并在這些模型的預測性價值和公平性考量之間取得平衡。例如,某家公司可能會認為那些住所離公司近的員工的流動性更小。但是,另一家公司很有可能基于種族歧視的原因不將員工住所遠近作為其雇傭算法的參數,尤其是在那些不同社區有不同的種族構成的地區。而這兩種做法都可能導致公平或道德問題,都不應當受到鼓勵。
五、結論
在美國,深化發展大數據的利用、為經濟增長提供新動能已成為一項既定政策,其最終目的在于通過經濟增長提高消費者的整體福利。在這一過程中,涉及如何在充分開發大數據經濟價值的同時保護重要的社會價值,包括保護公民個人數據權利以及保護弱勢群體的交易機會。通過政策調整、規則制定、法律解釋和技術完善,解決大數據利用與非經濟價值之間的沖突是美國的一貫政策態度。針對不加管理的大數據利用可能會對特定消費者群體產生不利、排除其交易機會這一問題,美國聯邦貿易委員會從消費者保護法律的適用和技術優化方向兩個角度,對大數據中間商和使用企業的實踐提出建議,促使其在充分利用大數據的同時避免相應的法律風險和道德風險,從而促進更具有社會包容性的大數據實踐。