數(shù)字從來不會自己說話。數(shù)據(jù)必須經(jīng)過分析才能產(chǎn)生意義。數(shù)據(jù)必須要清理、加權(quán)、整理。 很多時候,大數(shù)據(jù)被輸入到算法中,產(chǎn)生可指導行動的測量數(shù)據(jù)。個性化給人們帶來的最大擔憂是,它讓用戶撤回到舒服的飛地,其結(jié)果是用戶的視野變窄,偏見增強。
測量中的偏見
所有的媒介測量都具有偏見。這并不是說,它們?yōu)榱诉_到某個不道德的目的而故意歪曲——雖然也存在這個可能。意思是說,它們永遠無法提供一個完全客觀的現(xiàn)實圖像。在收集和整理數(shù)據(jù)的過程中,偏見是固有的。能被觀測到的東西是無限的。記錄這些東西的方法各不相同。而且,正如我們所見,有很多不同的方法可以將所有數(shù)據(jù)凝縮為可用的測量標準。在這個過程中,有些東西未被探索到,有些東西則犧牲在“剪輯室”。
主導這個過程的是人類。他們決定什么是有用的、可行的或可以營銷的。這樣的判斷已經(jīng)烙入到所有的測量中,并從此產(chǎn)生偏見。重要的是識別最常見的偏見形式,并了解它們是如何影響市場運行的。有三種偏見值得一提:行為偏見、個性化偏見和流行度偏見。
行為偏見
絕大多數(shù)數(shù)字媒體的測量手段是通過記錄人們的行為建構(gòu)的。從廣播的最初歲月開始就是這樣,直至今日未曾改變。第一個視聽率測量機構(gòu)決定通過記錄聽眾的收聽行為來測量廣播接觸。這并不是理解媒介使用的唯一方式——它也可以被定義為聽眾關(guān)注或參與,但是接觸迅速成為業(yè)界共識。歷史學家馬克·巴爾內(nèi)夫斯及其同事解釋道:“出于買賣廣告時段或買賣節(jié)目的目的,一種能顯示收聽某個節(jié)目和收聽時間的測量標準具有某種簡潔性,這對高競爭性環(huán)境中的議價十分重要。” 數(shù)字電視的現(xiàn)代測量技術(shù)與此并無二致。個人收視記錄儀和機頂盒記錄下人們所選擇的內(nèi)容或頻道,并從這些選擇中推斷接觸。
Web 2.0 機構(gòu)對行為數(shù)據(jù)的依賴并沒有減少。雖然有些機構(gòu)從用戶評論中獲得見解,但是大多數(shù)被采集的信息都是作為行為數(shù)據(jù)被加以解釋的。服務器追蹤人們買了什么、訪問了什么網(wǎng)站、索取了什么信息、下載了什么材料、鏈接到了什么網(wǎng)頁、分享了什么東西。實際上,每一天的每一秒鐘都有海量的行為數(shù)據(jù)被制造出來。它的優(yōu)點是價格低廉、數(shù)量豐富,從而成為一種具有誘惑力的資源。但是,即便測量得精確,行為也很難被解釋。
人們面臨的最大誘惑是將選擇當作偏好的替身。其實,經(jīng)濟學中有一個正式的假設,即,選擇是“顯示性偏好”的度量。在推薦機制中,這種思路十分常見。甚至這些機制的批評者似乎也忽略了二者的區(qū)別。“新一代的互聯(lián)網(wǎng)過濾機制盯著你看起來喜歡的東西——你實際的所作所為,或者與你類似的人們所喜歡的東西,并試圖做出推斷。”但是,我們有理由懷疑,選擇是不是先有偏好的直接反映。媒介使用并不總是我們個人偏好的良好體現(xiàn)。我們所屬社交網(wǎng)絡的特質(zhì)、我們用來尋找內(nèi)容的工具和日常生活的結(jié)構(gòu)都影響了媒介使用。
因此,通過行為進行推斷時必須要謹慎。觀看一段視頻意味著你喜歡它嗎?亞馬遜上的每次購買都應該被理解為向“像你一樣的人”做出的無聲推薦嗎?鏈接到某個網(wǎng)頁或分享某個鏈接代表的是贊許還是譴責?轉(zhuǎn)發(fā)某條推特信息是對其創(chuàng)新性的判斷,還是身份表達和“社交紐帶”?點擊“喜歡”按鈕意味著你真正喜歡它,還是僅僅為了獲取免費的東西?行為的意義并不總是直白明了。然而,當我們將它們簡化為“人頭數(shù)量”或推薦時,往往認為行為的意義就是這樣簡明。
個性化偏見
可選擇的東西如此之多,可用于選擇的時間如此之少。媒介測量的一項重要功能是為人們的選擇提供向?qū)А€性化推薦在一定程度上能夠預見我們認為有用或有趣的東西。它意味著我們無須在搜索上浪費時間,無須考慮每個選項。獲取提供這些推薦的技能,一直是在網(wǎng)絡上取得成功的處方。然而,商業(yè)平臺并非唯一具有個性化偏見的平臺。接下來我將論證,測量手段讓我們以個性化的方式接觸數(shù)字媒體,這在一定程度上是由我們社交網(wǎng)絡的本質(zhì)屬性造成的。
營利網(wǎng)站具有追求個性化的欲望,這并不難理解。這個被帕里澤稱為“為相關(guān)性而進行的競賽”,驅(qū)動著大多數(shù)硅谷企業(yè)。因為它們意識到創(chuàng)造忠誠客戶的最好方法是,“提供真正對應每個人獨特興趣、欲望和需求的內(nèi)容”。 正如我們所看到的,這也正是協(xié)同過濾的存在理由。谷歌從 2009 年開始提供個性化搜索結(jié)果。Facebook 的圖譜搜索提供了另一種個性化方法。根據(jù)《紐約時報》的說法,“在用戶的 Facebook 好友中哪一個與用戶最親密,在搜索結(jié)果中用戶最想看到誰的答案,這些都是由算法審定的”。
社交網(wǎng)絡和親密小組也在無意中造成了個性化偏見,幾乎所有的社交網(wǎng)絡都是同質(zhì)化的。社交網(wǎng)絡的成員傾向于擁有相似的背景、興趣和性情。在這些網(wǎng)絡之中,照顧到相關(guān)群體興趣、規(guī)范和偏見的媒介更容易得到廣泛傳播。社交新聞網(wǎng)站,如紅迪網(wǎng)(Reddit)或頂客(Digg),通過推導、綜合和排名向人們推薦值得關(guān)注的東西,從而鼓勵了這種選擇性。
其實,社交網(wǎng)絡呈現(xiàn)給我們的推薦,可能比我們想象的還要自動化。Facebook 通過一種名為“刀鋒排名”(EdgeRank)的算法,為每個用戶提供個性化的動態(tài)新聞。刀鋒排名是 Facebook 的專利,但是與圖譜搜索類似,它也是優(yōu)先呈現(xiàn)來自與我們關(guān)系密切的人們的最新消息。換句話說,在所有的 Facebook 好友中,我們更可能聽到像我們一樣的人們的消息。在一定程度上,這種定制內(nèi)容造成了社交媒體上普遍存在的個性化偏見。
個性化給人們帶來的最大擔憂是,它讓用戶撤回到舒服的飛地,其結(jié)果是用戶的視野變窄,偏見增強。例如,個性化可能會鼓勵保守主義者收看“紅媒”,自由主義者收看“藍媒”。帕里澤將這些飛地稱作“過濾氣泡”。他認為用戶往往并沒意識到過濾氣泡的存在。
然而,我們很難確定這些來自朋友的推薦所產(chǎn)生的社會效應。區(qū)分社交傳染效應與同質(zhì)性效應,對我們來說是一項挑戰(zhàn)。人們可能會看到同樣的東西,做同樣的事情,這不是因為推薦,而是因為他們彼此相同。然而,也有證據(jù)證明,朋友的督促能夠促使人們?nèi)ネ镀保瑥亩绊戨y分伯仲的選舉結(jié)果。而且,似乎來自熟人的推薦壓倒了選擇性接觸的傾向。穆茨和楊猜測,自動化的“非人類”推薦,例如協(xié)同過濾——或許不如“人類”推薦更具潛在影響力。然而在當今世界,隨著 Facebook 和推特使用算法濾出個人信息和推薦,人類推薦和非人類推薦之間的界限也變得日益模糊。
流行度偏見
幾乎所有上述方法都產(chǎn)生一個推薦排序表。搜索引擎根據(jù)內(nèi)向鏈接的數(shù)量和重要性進行網(wǎng)頁篩選。社交網(wǎng)絡和內(nèi)容提供者將用戶指向閱讀最多的故事、觀看最多的視頻或者大多數(shù)90“像你一樣的人們”所購買的、租賃的或喜愛的東西。用戶信息機制經(jīng)常使用的方法,都特別倚重流行度。《華爾街日報》的“數(shù)字先生”卡爾·比亞利克有一句妙語:“互聯(lián)網(wǎng)促進了流行度競賽的爆發(fā)。” [“Numbers Guy”是由卡爾·比亞利克創(chuàng)辦并供稿的《華爾街日報》專欄,這個專欄是關(guān)于新聞所使用(特別是誤用)的數(shù)字和統(tǒng)計的。
盡管在歷史上,大眾文化的批判者曾經(jīng)質(zhì)疑被當作質(zhì)量指標的流行度,但是推薦機制基本上能夠免于此類質(zhì)疑。相反,用戶和社會評論家都贊賞這些機制,認為它們體現(xiàn)了“群眾的智慧”——意思是說眾多普通決策者能夠創(chuàng)造優(yōu)于專家的集體判斷。這個流行概念給那些自私機構(gòu)和告訴人們什么最好的自認權(quán)威提供了誘人的修正。然而,即使接受這個假設,用戶信息機制也往往不能滿足做出優(yōu)秀決定所需的前提條件。
根據(jù)詹姆斯·索羅維基(他是幫助這個概念流行開來的作者)的說法,當大量不同個體獨立做出決定或預測時,智慧得以實現(xiàn)。將這些自主決定加在一起,通常可以產(chǎn)生一個明顯優(yōu)于專家意見的結(jié)果。不幸的是,大多數(shù)用戶信息機制違反了這些規(guī)則,這一點連索羅維基自己也承認。
首先,推薦通常以相對較小的同質(zhì)群體為基礎。如我們所見,社交網(wǎng)絡或親密小組的成員是同質(zhì)的。在大多數(shù)群組中,成員的數(shù)量是有限的。人類學家羅賓·鄧巴認為,人類最多能夠維持150多個有意義的人際關(guān)系,因此社交網(wǎng)絡的規(guī)模是有限的。有些人找到證據(jù)證明社交媒體使用中存在天花板,另外一些社交網(wǎng)絡分析者卻認為,“鄧巴數(shù)”太低了。不管怎樣,社交網(wǎng)絡,作為推薦實體,通常并不具備做出聰明判斷所需的規(guī)模和多樣性。協(xié)同過濾也不能糾正這個問題。最好的推薦機制橫跨多個數(shù)據(jù)庫。它們必須這樣做,因為相對來說,只有少數(shù)人在進行推薦時最終具備價值。也就是說,過濾算法搜索并優(yōu)先考慮與你“最親密的人”或離你“最近的人”。這些人通常只占數(shù)據(jù)庫的極小一部分。
其次,在上面提到的用戶信息機制中,沒有一個促進了最佳推薦所需的那種獨立決策。搜索引擎為用戶提供有關(guān)其他人所作所為的信息,有效引導接下來的決策,整合并報告某個網(wǎng)站的訪問者選擇了什么或者某個社交網(wǎng)絡的成員推薦了什么,為追隨者提供了強烈的社會期望信號。人類有隨大流的傾向,見到他人在做什么,能夠引發(fā)狂亂沖動行為。
例如,哥倫比亞大學的社會學家進行了一項基于互聯(lián)網(wǎng)的大規(guī)模實驗。在實驗中,人們被允許從一些不知名樂隊中選擇一個,并下載它的音樂。在實驗條件下,人們能夠看到有關(guān)別人所下載內(nèi)容的信息越多,他們越傾向于追隨領(lǐng)導者。歌曲的質(zhì)量相對來說并不重要。在不同的實驗條件下,用戶信息產(chǎn)生的結(jié)果都是“贏者通吃”。然而,你還是無法事先預知誰會成為贏者。
如果自主決策產(chǎn)生最佳結(jié)果,傳染和從眾似乎是“智慧自群眾中來”(這個觀點的持有者)最不喜歡的。正如預測專家納特·西爾弗所警告的:“這是信息時代的另一個風險:我們分享如此多的信息,以至于我們的獨立性被降低了。相反,我們尋找和我們一樣思考的人們,
但是,這些以流行度為基礎的排名比比皆是,所以,我們應該謹慎對待測量中的流行度偏見。這樣的測量標準能夠告訴我們什么在吸引注意力——同時也提升流行度,但是它們并非找到真正價值所在的無誤向?qū)А?/p>
透過大數(shù)據(jù)看世界
很多評論家和顧問早就指出,大數(shù)據(jù)的出現(xiàn)將促使我們革新一切,從制造到市場營銷、到醫(yī)藥、到天氣預測、到股票交易、到科學自身的每項實踐。我曾間接提到服務器所產(chǎn)生的數(shù)據(jù)對媒介測量的影響,但是我們還是應該認真考慮,大數(shù)據(jù)是否從根本上改變了我們看待注意力市場的方式,是否在此過程中改變了市場的運行方式。
大數(shù)據(jù)這個詞模糊得讓人喜歡。對有些人來說,它是一切電子計算表中大到無法處理的數(shù)據(jù);對另一些人來說,它只不過是一個需要超級計算機進行運算的數(shù)據(jù)集。它通常包括兩個截然不同卻又經(jīng)常合在一起的話題:數(shù)據(jù)與分析。為了掌握大數(shù)據(jù)的貢獻和局限,我們應該對二者分別對待。
大數(shù)據(jù)的擁護者們經(jīng)常表示,越大一定越好。我曾指出,大多數(shù)媒介測量都有一個行為偏見,行為偏見讓它們的解釋存在問題。但是在克里斯·安德森(他曾長期擔任《連線》雜志編輯)看來,日益增加的數(shù)據(jù)以某種方式消除了這個問題。“誰知道為什么人們?yōu)槠渌鶠椤⒆銎渌?重點是他們做了,而且我們能夠追蹤,并以前所未有的保真度測量他們的活動。有了足夠的數(shù)據(jù),數(shù)字自己就會說話。”然而,大多數(shù)知道數(shù)據(jù)包括什么、不包括什么的人們卻得出截然不同的結(jié)論。微軟研究院的研究員們將真實世界中大數(shù)據(jù)的不足進行了分類,從代表性問題到顯而易見的錯誤。他們得出的結(jié)論是:“大數(shù)據(jù)為我們提供了海量數(shù)據(jù),但這并不意味著方法問題不再重要。例如,對樣本的理解,現(xiàn)在比以往任何時候都更重要。”
數(shù)字從來不會自己說話。數(shù)據(jù)必須經(jīng)過分析才能產(chǎn)生意義。數(shù)據(jù)必須要清理、加權(quán)、整理。 很多時候,大數(shù)據(jù)被輸入到算法中,產(chǎn)生可指導行動的測量數(shù)據(jù)。正如克里斯·斯坦納所指出的:“在華爾街和其他地方,所有因算法而實現(xiàn)的革命,只有一個核心的、執(zhí)著的目標:預測——更精確地說,預測其他人會做什么。”
然而,預測人們會做什么,要什么或?qū)κ裁礉M意,比物理世界的預測更難。想一想用大數(shù)據(jù)預測天氣。預測并不能改變天氣。預測一英寸的雨水并不能讓此成真。假如真的下雨,你就可以對預測的精確度進行測量。你只需到雨水測量器前看一看就知道你預測的對不對。人類世界并不總是按照同樣的規(guī)則運行。
對社交活動的預測會影響他們所預測的東西。如果谷歌預測某個網(wǎng)站會有價值并因為這個預測促進了網(wǎng)站流量,似乎就能夠進一步證明這個推薦的正確性。如果《紐約時報》網(wǎng)站將某篇文章吹捧為閱讀量最多的文章,就會引誘人們?nèi)ラ喿x它。如果我們接受這個間接推薦,它對其他人的誘惑力就會增強。如果亞馬遜預測我們將會喜歡某本書,因為“像我們一樣的人們”購買了該書,我們可能就會將該書加入到購物車,從而使銷售增長。倘若不是這樣,這個增長是不存在的。測量并沒有與它們所要測量的現(xiàn)實相互分離,測量重塑了現(xiàn)實。
職業(yè)媒體人手中的測量可能也是這樣的。例如,媒體都想在新人出名之前發(fā)現(xiàn)他們。《廣告時代》如此描述這個挑戰(zhàn):“很多年以來,品牌一直在和 YouTube 明星合作——賈斯汀,謝伊·卡爾,米歇爾·潘等等,但是,如果你能夠在明星成為大腕之前就發(fā)現(xiàn)他們,又會怎樣呢?”為了做到這一點,代理機構(gòu)要在 YouTube 上追蹤 5 萬個頻道、2500 萬個視頻,從而預測誰處在成名的臨界點,表現(xiàn)優(yōu)秀的那些可以簽下合約。以這種方式發(fā)現(xiàn)的人才可能無須干預便獲得成功。但是,使用測量發(fā)現(xiàn)贏者的同時也能創(chuàng)造贏者。與天氣不一樣,社會預測能夠改變結(jié)果。
在很多大數(shù)據(jù)支持者的眼中,預測物理世界與預測人類世界的區(qū)別似乎不再存在。在人類社會,由大數(shù)據(jù)驅(qū)動的算法有可能創(chuàng)造“自我應驗的預言”。偉大的社會學家羅伯特·K·默頓解釋道:“某個情況(預言或預測)的公共定義成為這個情況的組成部分,因此影響到事態(tài)的后續(xù)發(fā)展。這是人類事務特有的。自然界中并不存在。”自我應驗的預言產(chǎn)生兩個問題,一個是分析者的問題,另一個是我們其他人的問題。
算法的預測質(zhì)量應該根據(jù)預測的準確性判斷。但是,任何評估都取決于我們能否很好地測量我們所預測的東西。在大數(shù)據(jù)的世界里,比起其他事情,有些事情更容易知道。我們也許能判斷出某種模式在多大程度上決定了電視節(jié)目的收視率,或者操控推銷辭令如何影響了購買行為。但是,當谷歌預測我們會覺得某個網(wǎng)站有價值,或者奈飛預測我們會喜歡某部電影時,我們怎能知道這些預測真正找到了具有價值或令人喜愛的東西呢?我們可能發(fā)現(xiàn)這些推薦有價值,但是我們無法確定它們是否為最佳選擇。將人們對某個建議的接受當作質(zhì)量高的證據(jù),或許只會讓自我應驗的預言繼續(xù)存在。在人類世界中判斷預測的質(zhì)量,并不像看一眼雨水測量器那樣簡單。
自我應驗預言的更大后果是,它們能夠影響文化消費本身的性質(zhì)。公共測量可能會與其所測量的世界“發(fā)生反應”,從而改變社會現(xiàn)實。 兩種偏見:個性化偏見和流行度偏見,可能都有這個能力(改變社會現(xiàn)實)。
個性化推薦將我們引向那些關(guān)心我們興趣和偏見的媒體。通常,推薦者需要從我們過去的行為進行推斷,從而猜測我們是誰、喜歡什么。伊萊·帕里澤將此稱為“你循環(huán)”,并對其機制作出如下解釋:“你點擊一個鏈接,說明你喜歡其中某個東西,這意味著你接下來很有可能會看到與那個話題相關(guān)的文章,然后它進一步為你啟動了那個話題。你陷入了‘你循環(huán)’,如果你的身份被誤表達,就會產(chǎn)生一些奇怪的模式,就像擴音器中出現(xiàn)的回響。”有一種可能是,某些東西被啟動,而其他東西未被啟動,我們可能會培養(yǎng)起一種對所推薦東西的品位。正如我們所看到的,很多社會評論家擔心個性化可能會使社會極化,但是如果這些機制迎合并創(chuàng)造偏好的話,其效果可能會更加顯著。
然而,流行度偏見可能會緩解這種效果。它不是將我們撕裂,而是傾向于使公眾注意力集中。流行度并非找到最高價值或最高質(zhì)量的安全法則。然而,似乎顯而易見的是,推薦流行的東西會驅(qū)動流量,并進一步提高流行度。將海量數(shù)據(jù)轉(zhuǎn)化成簡單的數(shù)人頭活動,包括將此公布于眾,會夸大最終的計數(shù)結(jié)果。
在這些傾向中,沒有一個由于大數(shù)據(jù)的大而得到緩解。與所有媒介測量手段一樣,新的測量手段也是人類創(chuàng)造的。正因為如此,它們也不能免于偏見和誤用。但是,它們現(xiàn)在無處不在。這不是原來就有的,因此它們成為人們必須考慮的日益重要的力量。它們能夠為機構(gòu)和個人提供超級有用的工具。然而,它們并不是注意力市場上的中立者。媒介測量以強有力的方式進入注意力市場。這種進入方式并沒有得到足夠重視,往往也很難被普通用戶識別出來。顯然,人類世界會與數(shù)據(jù)所鼓勵我們看到的十分相似。