古希臘哲學(xué)家畢達(dá)哥拉斯曾經(jīng)提出“數(shù)是萬物的本源”的思想,認(rèn)為世界萬物歸根結(jié)底都是由某種數(shù)量關(guān)系決定的。在歷史上,人類量化世界的野心和嘗試從未停止,而科技的進(jìn)步則不斷為這一目標(biāo)提供越來越快捷的技術(shù)條件。2012年,技術(shù)詞匯“大數(shù)據(jù)”進(jìn)入人們的視野,不同于傳統(tǒng)意義上“數(shù)據(jù)=數(shù)字”的是,在互聯(lián)網(wǎng)、物聯(lián)網(wǎng)高速發(fā)展的今天,網(wǎng)購經(jīng)歷、視頻節(jié)目、微信語音都是數(shù)據(jù)。大數(shù)據(jù)技術(shù)量化一切的優(yōu)勢,使其在幾年內(nèi)成為每一個行業(yè)不可或缺的生產(chǎn)力,擁抱大數(shù)據(jù)時代到來的言論甚囂塵上。大數(shù)據(jù)時代,也意味著信息大爆炸時代的到來,是信息大傳播的時代。在傳媒業(yè),與其他傳播技術(shù)相似,大數(shù)據(jù)的出現(xiàn)促進(jìn)了整個行業(yè)的發(fā)展與變革。新聞從業(yè)人員通過數(shù)據(jù)采集與挖掘獲得了大量新聞素材,這不僅是人類認(rèn)知世界的新角度與新方式,而且變革了新聞生產(chǎn)的全流程,“數(shù)據(jù)新聞”被視為新聞業(yè)未來發(fā)展的一大趨勢。智能化時代,能在分秒間生成新聞產(chǎn)品的“機(jī)器人記者”誕生了,受到了廣泛關(guān)注。同時,基于大數(shù)據(jù)的個性化推薦服務(wù),不僅實現(xiàn)了新聞信息的精確定位,節(jié)省了用戶搜索信息的時間,而且也重構(gòu)了整個廣告業(yè)格局,數(shù)據(jù)成為廣告營銷業(yè)實現(xiàn)精確定位消費(fèi)者的重要依據(jù)。
然而,值得令人反思的是,在傳媒業(yè)廣為追捧大數(shù)據(jù)的今天,相關(guān)的管理規(guī)范、制度、法律卻相對滯后,甚至缺失,由此帶來了許多新的問題。從數(shù)據(jù)分析角度來看,理論上講,大數(shù)據(jù)應(yīng)當(dāng)是有別于抽樣調(diào)查得到的小數(shù)據(jù),是全樣本數(shù)據(jù)。然而,事實上大數(shù)據(jù)的采集與分析過程都難以窮盡所有數(shù)據(jù)。而且這些收集到的數(shù)據(jù)還存在著混亂、真假難辨、可利用度低等新問題,需要傳媒業(yè)重新審視它們的價值。同時,通過數(shù)據(jù)追蹤和收集,隱私問題成為大數(shù)據(jù)時代面臨的最大問題和挑戰(zhàn)。盡管以Cookie技術(shù)為基礎(chǔ)的匿名化信息可能給用戶的生活帶來許多便利,如亞馬遜網(wǎng)站根據(jù)用戶個人喜好推薦相關(guān)書籍。但是多個實例證明,他人借助這些匿名數(shù)據(jù)同樣可以追蹤到用戶本人,只要用戶連網(wǎng),便無真正隱私可言。新技術(shù)的誕生與發(fā)展也帶來了許多令人擔(dān)憂的社會影響,甚至可能威脅人類的安全與發(fā)展。大數(shù)據(jù)不是完美的,大數(shù)據(jù)是一把雙刃劍。在促進(jìn)行業(yè)快速發(fā)展的同時,也存在著種種隱患,亟待解決的問題非常多。因此,對傳媒業(yè)大數(shù)據(jù)熱進(jìn)行審慎、理性的反思非常必要。
一、大數(shù)據(jù)無法取代傳統(tǒng)的新聞傳播科研方法
從簡單的算數(shù)、度量,到如今的各種移動終端,數(shù)據(jù)向來是人類感知、認(rèn)識以及表達(dá)世界的一種重要方式。在小數(shù)據(jù)時代,由于技術(shù)手段有限,人們只能采用抽樣的調(diào)查方法對事物進(jìn)行分析,并將局部的研究結(jié)果延伸至總體。傳統(tǒng)的郵寄調(diào)查、電話調(diào)查、攔截面訪等新聞傳播學(xué)科的研究方法均是基于這個原理展開。然而每一種抽樣方法都存在一定不足,難以反映總體樣本的全貌,調(diào)查人員一般會增加抽樣的數(shù)量,以提高統(tǒng)計的精確度,但這也意味著調(diào)查成本的增加。大數(shù)據(jù)技術(shù)輕而易舉收集大量數(shù)據(jù)的能力,引發(fā)了人們對全樣本、全數(shù)據(jù)的想象。大數(shù)據(jù)的確具有不可替代的優(yōu)勢,但就此認(rèn)為一種新興的技術(shù)將完全取代人類數(shù)千年積累下來的科學(xué)發(fā)展成果,這無疑走進(jìn)了大數(shù)據(jù)自大的怪圈。隨著大數(shù)據(jù)的不斷發(fā)展,越來越多的實例證明,全數(shù)據(jù)分析具有不可替代優(yōu)勢的夢想在現(xiàn)實中并不容易實現(xiàn),大數(shù)據(jù)只能對傳統(tǒng)的新聞傳播調(diào)研方法進(jìn)行補(bǔ)充,卻無法取而代之。大數(shù)據(jù)對傳媒業(yè)的價值有待重新考量。
(一)全數(shù)據(jù)是“烏托邦”
在大數(shù)據(jù)浪潮勢不可擋的今天,互聯(lián)網(wǎng)應(yīng)用推進(jìn)了社會各個組織機(jī)構(gòu)的信息化進(jìn)程,物聯(lián)網(wǎng)技術(shù)的發(fā)展得以讓各種移動設(shè)備連接在一起,每一天都能輕易存儲下令人驚嘆的數(shù)據(jù)量,全球數(shù)據(jù)量平均每兩年翻一番。因此,區(qū)別于傳統(tǒng)的抽樣調(diào)查方法,有人提出全數(shù)據(jù)模式,它指的是借助大數(shù)據(jù)技術(shù),獲取樣本量等于調(diào)查總體的數(shù)據(jù)總量,并進(jìn)一步進(jìn)行研究分析的方法。但在現(xiàn)實中,全數(shù)據(jù)的實現(xiàn)遇到了許多問題,具有一定的理想性。
在我國,“信息孤島”普遍存在。除了考慮安全因素以外,更多的是因為組織部門之間的利益驅(qū)使而導(dǎo)致的。目前,數(shù)據(jù)正在滲透各個行業(yè),成為所有行業(yè)重要的戰(zhàn)略資產(chǎn)和核心競爭力。在“互聯(lián)網(wǎng)+”、“大數(shù)據(jù)+”概念的引導(dǎo)下,幾乎所有行業(yè)都意識到數(shù)據(jù)資產(chǎn)的重要性。市場先進(jìn)入者占據(jù)了大量數(shù)據(jù)資源,由于生怕日后被后進(jìn)入者趕超,各個市場主體彼此之間不愿進(jìn)行共享,形成數(shù)據(jù)割據(jù)的局面,甚至在同一個組織內(nèi)的不同部門也是如此。不同領(lǐng)域、行業(yè)、部門為了在“孤島”內(nèi)更完整地捕捉用戶的信息,重復(fù)收集數(shù)據(jù),既增加了數(shù)據(jù)采集的成本,又因為不同部門分析標(biāo)準(zhǔn)的不統(tǒng)一導(dǎo)致了分析結(jié)論的南轅北轍,造成數(shù)據(jù)過剩而分析結(jié)果卻不準(zhǔn)確的問題。這個特征在科技公司領(lǐng)域尤為明顯,例如:三大科技巨頭公司BAT(百度、阿里、騰訊)之間經(jīng)常發(fā)生互相屏蔽的事件:微信和淘寶之間進(jìn)行相互屏蔽,用戶的興趣產(chǎn)品和購買記錄等數(shù)據(jù)便無法跨平臺進(jìn)行共享。每個公司據(jù)此得出的用戶信息圖景都是不完整的,這與理想中的全數(shù)據(jù)模式有根本的背離。全數(shù)據(jù)應(yīng)當(dāng)具有數(shù)據(jù)量大且完整的優(yōu)勢,而“信息孤島”帶來的后果卻是變相的大樣本抽樣調(diào)查,而且抽樣的樣本還不一定具有精確性和代表性,結(jié)果的準(zhǔn)確性甚至不如傳統(tǒng)的市場調(diào)查方法。除了科技領(lǐng)域以外,隨著大數(shù)據(jù)應(yīng)用逐漸滲透到非科技領(lǐng)域,其他傳統(tǒng)行業(yè)、部門也紛紛設(shè)立數(shù)據(jù)壁壘,進(jìn)一步阻止了全數(shù)據(jù)模式的實現(xiàn)。例如:政府部門之間的數(shù)據(jù)不流通,造成了公共服務(wù)領(lǐng)域和政府監(jiān)管市場中協(xié)商與決策的不便與困擾。所有的這些信息壁壘,及其帶來的相關(guān)數(shù)據(jù)分析問題,不僅成為本行業(yè)發(fā)展的阻礙,也同時使傳媒業(yè)喪失了大量潛在的新聞源。
大數(shù)據(jù)浪潮雖已呈不可逆轉(zhuǎn)之勢,但就目前看來,全數(shù)據(jù)模式的確是技術(shù)發(fā)展衍生的一個“烏托邦”,因此,不能盲目地相信大數(shù)據(jù)的分析結(jié)果,對這些結(jié)果采取審慎的態(tài)度非常必要。促進(jìn)數(shù)據(jù)的開放也是不斷將“烏托邦”轉(zhuǎn)化為現(xiàn)實的一個重要途徑。開放性本是大數(shù)據(jù)時代的應(yīng)有之義,也是全數(shù)據(jù)模式得以成立的重要前提。自2009年以來,美國奧巴馬政府接二連三地簽署、頒布了與開放數(shù)據(jù)相關(guān)的政策,這既提高了政府的執(zhí)政效率,也為科技創(chuàng)新產(chǎn)業(yè)的發(fā)展添加源動力,數(shù)據(jù)的“二次利用”是一片更為廣闊的藍(lán)海。
(二)大數(shù)據(jù)處理過程中存在一定問題和風(fēng)險
大數(shù)據(jù)意味著信息爆炸,數(shù)據(jù)繁雜、混亂,這既加大了數(shù)據(jù)處理與分析的難度,也增加了出現(xiàn)數(shù)據(jù)錯誤的可能性。在互聯(lián)網(wǎng)領(lǐng)域,無價值數(shù)據(jù)遠(yuǎn)遠(yuǎn)多于有價值數(shù)據(jù),這就需要分析人員對相關(guān)數(shù)據(jù)進(jìn)行一系列的處理,主要包括數(shù)據(jù)采集、存儲、清洗、分析、展現(xiàn)等若干步驟。由于其中許多環(huán)節(jié)都存在一定的問題和風(fēng)險,因此數(shù)據(jù)分析的最終結(jié)果也受到了一定影響。
首先,數(shù)據(jù)采集環(huán)節(jié)存在多樣混亂、可靠性差、系統(tǒng)性低等問題。大數(shù)據(jù)時代是一個信息過載的時代,人們從多個渠道、多種方式獲取數(shù)據(jù)。在互聯(lián)網(wǎng)中,每一秒鐘產(chǎn)生的信息量都是令人咋舌的。每一天互聯(lián)網(wǎng)產(chǎn)生800EB的數(shù)據(jù)量,需要1.68億個DVD光盤才可容納(蔣均牧,2012)。數(shù)據(jù)來源多元化導(dǎo)致許多依據(jù)不同標(biāo)準(zhǔn)收集的數(shù)據(jù)混雜在一起,而數(shù)據(jù)量極大又造成人工排查的困難。同時數(shù)據(jù)的可靠性也難以保證,真假信息魚龍混雜,致使數(shù)據(jù)分析結(jié)果的不確定。虛擬空間的匿名性特點(diǎn)為謠言的傳播提供了條件,網(wǎng)絡(luò)空間中充斥著大量假消息,一些消息甚至是許多未經(jīng)專業(yè)培訓(xùn)的人都難以分辨的,以這種數(shù)據(jù)出發(fā)而獲得的分析結(jié)果也不具備真實性。互聯(lián)網(wǎng)中相當(dāng)一部分的信息、評論是由“水軍”、“自動發(fā)帖機(jī)”等發(fā)出的,不僅真假難辨,這種數(shù)據(jù)也是無意義的。利益中的一方利用技術(shù)手段提升“好評度”,則難保另一方不會利用同樣的手段增加“差評度”,數(shù)據(jù)統(tǒng)計便成為一種既無意義且耗成本的行為。另外,目前網(wǎng)絡(luò)媒體充斥著大量非結(jié)構(gòu)性及半結(jié)構(gòu)化數(shù)據(jù),比如圖片、視頻、音頻等數(shù)據(jù),系統(tǒng)性較低。傳統(tǒng)的數(shù)據(jù)分析范式難以對其進(jìn)行解釋,新的數(shù)據(jù)分析范式仍然未有較為統(tǒng)一及有效的標(biāo)準(zhǔn),數(shù)據(jù)分析更多的停留在平面,可利用價值較差,而更多的“數(shù)據(jù)寶藏”則深埋其中,未被發(fā)掘。
其次,數(shù)據(jù)存儲面臨能力薄弱、安全隱患等問題。許多學(xué)者習(xí)慣上認(rèn)為,與傳統(tǒng)數(shù)據(jù)相比,大數(shù)據(jù)具有以下四個鮮明的特點(diǎn):規(guī)模性(Volume)、高速性(Velocity)、多樣性(Variety)和價值稀疏性(Value),其中規(guī)模性是大數(shù)據(jù)區(qū)別于小數(shù)據(jù)的重要特征。海量的數(shù)據(jù)要求數(shù)據(jù)庫存儲能力的提升,而數(shù)據(jù)來源的豐富性、數(shù)據(jù)類型的多樣性以及歷史數(shù)據(jù)的再利用性又進(jìn)一步對數(shù)據(jù)庫的存儲能力有了更高的要求。目前我國大數(shù)據(jù)的存儲能力比較有限,許多傳統(tǒng)的數(shù)據(jù)庫仍然難以存儲、整合如此龐大的信息量,數(shù)據(jù)庫、數(shù)據(jù)倉庫等領(lǐng)域的技術(shù)均落后于美國等國。在信息的大傳播時代,有效的數(shù)據(jù)得不到儲存,則數(shù)據(jù)處理過程中斷,意味著無法進(jìn)一步發(fā)掘數(shù)據(jù)的價值,也就喪失了數(shù)據(jù)的產(chǎn)能優(yōu)勢。在數(shù)據(jù)存儲這一環(huán)節(jié),還面臨著安全隱患的問題。政府、金融、醫(yī)療等特定領(lǐng)域?qū)?shù)據(jù)信息的安全性有較高的要求,但目前由于整個行業(yè)正處于初始發(fā)展階段,對此類數(shù)據(jù)的保護(hù)能力以及保護(hù)意識都比較弱,數(shù)據(jù)泄露事件時有發(fā)生,國家安全與用戶隱私時刻面臨風(fēng)險。例如,2016年4月,土耳其國家數(shù)據(jù)庫爆發(fā)重大數(shù)據(jù)泄露事件,約有5000萬土耳其公民受到波及,占其國家總?cè)丝诘?成左右。攻擊土耳其國家數(shù)據(jù)庫的黑客獲得了這些土耳其公民的姓名、身份證號碼、父母姓名、出生地址及年月日等隱私信息,并指出了該數(shù)據(jù)庫的三大漏洞,這說明土耳其政府對國家數(shù)據(jù)庫的保護(hù)及安全防范意識都是非常薄弱的。又如,2015年10月,國家互聯(lián)網(wǎng)應(yīng)急中心發(fā)布信息,網(wǎng)易郵箱的用戶數(shù)據(jù)庫遭到泄露,這導(dǎo)致許多用該郵箱進(jìn)行支付寶注冊或蘋果ID注冊的用戶面臨著用戶密碼被重置的風(fēng)險。在數(shù)據(jù)存儲環(huán)節(jié),無論是技術(shù)公司,又或是從“大數(shù)據(jù)+”概念中衍生出來的其他行業(yè),都不僅應(yīng)在安全意識上有所防范,而且更應(yīng)在技術(shù)上持續(xù)提升數(shù)據(jù)庫的存儲能力和安保能力。
最后,數(shù)據(jù)分析存在邏輯不統(tǒng)一、輕易歸因、機(jī)械性等問題。盡管在過去的幾十年間,科學(xué)技術(shù)的發(fā)展實現(xiàn)了對海量數(shù)據(jù)的收集、整合和儲存,但大數(shù)據(jù)也不是萬能的。其中,數(shù)據(jù)分析環(huán)節(jié)是整個大數(shù)據(jù)處理過程中受到爭議最大的一個環(huán)節(jié)。首先,由于數(shù)據(jù)采集過程是不斷進(jìn)行的,但是大數(shù)據(jù)服務(wù)的主營業(yè)務(wù)的架構(gòu)可能總是在變,收集數(shù)據(jù)的標(biāo)準(zhǔn)也可能隨著時間總是在改變,這就容易在數(shù)據(jù)分析過程中出現(xiàn)前后邏輯不統(tǒng)一的問題。相比之下,傳統(tǒng)的科研范式要嚴(yán)謹(jǐn)?shù)枚啵瑲v史數(shù)據(jù)和新數(shù)據(jù)的采集標(biāo)準(zhǔn)有何異同,一目了然。其次,采集的大數(shù)據(jù)是客觀存在的,無法進(jìn)行自我處理和分析,需要編寫一定的算法,或者人腦直接對其進(jìn)行進(jìn)一步解釋和分析。在這個過程中,人為主觀性將可能導(dǎo)致事實客觀性的偏頗,進(jìn)而產(chǎn)生對新聞客觀性的挑戰(zhàn)。人們在翻譯數(shù)據(jù)信息時存有偏見……記者群體容易濫用因果推理邏輯或相關(guān)性分析。記者群體的輕易歸因,容易導(dǎo)致許多“假規(guī)律”的產(chǎn)生,反而讓人難以發(fā)現(xiàn)事件背后的真正規(guī)律和問題。此外,大數(shù)據(jù)分析更多的不在于對事情因果關(guān)系的分析,而是對其相關(guān)性的體現(xiàn),進(jìn)而對未來發(fā)展趨勢做出預(yù)測,并最終進(jìn)行決策判斷。比如:通過用戶數(shù)據(jù)的反饋,程序化廣告系統(tǒng)發(fā)現(xiàn)某用戶近來多次瀏覽某一品牌廠商的廣告,因此判斷他有可能購買該產(chǎn)品,并進(jìn)而對該用戶進(jìn)行更大力度的宣傳。這種“人工智能”看似神奇,但也可能會導(dǎo)致許多機(jī)械性結(jié)果和決策的產(chǎn)生。在進(jìn)行某項決策時,人類會綜合多種因素,包括聯(lián)系前后情景,感性、理性雙重的作用等,最終形成判斷,這是人腦如此發(fā)達(dá)的原因。然而,沒有情感的機(jī)器卻無法做到這一點(diǎn),許多通過算法自動生成的預(yù)測和決策都具有一定的機(jī)械性。紐約大學(xué)的兩位教授加里·馬庫斯(Gary Marcus)和歐尼斯特戴維斯(Ernest Davis)曾經(jīng)指出,沒有經(jīng)過因果關(guān)系邏輯判別的相關(guān)關(guān)系很可能處處是陷阱(Marcus &Davis,2016)。比如:2006年至2011年之間,美國的謀殺率與微軟自帶瀏覽器Internet Explorer的市場份額成正相關(guān)關(guān)系:兩者都呈現(xiàn)極速下滑的趨勢,但是讓人頭疼的是,它們兩者之間究竟存在怎樣的因果關(guān)系呢?再比如:1998年至2007年之間,新診斷的孤獨(dú)癥患者人數(shù)與有機(jī)食物的銷量呈非常良好的相關(guān)關(guān)系:兩者都急劇上增,但是獲得這樣的相關(guān)關(guān)系并不會告訴我們,健康飲食與孤獨(dú)癥之間有什么必然關(guān)系。因此,在統(tǒng)計學(xué)中,這種沒有因果關(guān)系支撐的假性相關(guān)關(guān)系被稱為“相關(guān)不蘊(yùn)含因果”(Correlation does not imply causation)。
(三)傳統(tǒng)調(diào)研方法具有不可替代的價值
如今的數(shù)據(jù)科學(xué)家們認(rèn)為,傳統(tǒng)科研方法最明顯的劣勢在于對精確性的追求。在傳統(tǒng)科研領(lǐng)域,為了提升一項調(diào)查的精確性,調(diào)查者通常需要增加樣本,而這會耗費(fèi)大量的成本。相比之下,大數(shù)據(jù)能讓調(diào)查者在短期內(nèi)獲得龐大的數(shù)據(jù)量,這增加了調(diào)查的容錯率,精確性便不再如此重要了。《大數(shù)據(jù)時代》一書的作者維克托·邁爾—舍恩伯格(Viktor Mayer-Schnberger)提到:“有時候,當(dāng)我們掌握了大量新型數(shù)據(jù)時,精確性就不那么重要了,我們同樣可以掌握事情的發(fā)展趨勢。”然而,事實真的如此嗎?“谷歌流感趨勢”一直被視為大數(shù)據(jù)應(yīng)用的典范之一。2008年,谷歌推出一個名為“谷歌流感趨勢”的系統(tǒng),能夠根據(jù)用戶在谷歌上搜索流感的行為和數(shù)量預(yù)測美國不同地區(qū)的流感疫情。《自然》雜志記者德克蘭·巴特勒(Butler,2013)撰文指出,該系統(tǒng)對2012年年底美國流感疫情患者數(shù)目的分析,大大高估了美國疾病控制與預(yù)防中心給出的實際數(shù)據(jù)的峰值水平。而且,這已經(jīng)不是這個系統(tǒng)第一次出現(xiàn)預(yù)估錯誤了。雖然大數(shù)據(jù)帶來的優(yōu)勢遠(yuǎn)遠(yuǎn)超過了它因為不精確而產(chǎn)生錯誤導(dǎo)致的代價,但數(shù)據(jù)錯誤帶來的代價不容小覷。
大數(shù)據(jù)的處理過程中存在種種問題,一是由于這項技術(shù)尚未成熟,人才也不足夠,可以發(fā)展和完善的空間仍然很大;二是由于人們過高地估計了大數(shù)據(jù)的作用,認(rèn)為這項技術(shù)具有顛覆性意義,能夠直接取代傳統(tǒng)科研方法,從而走上了“大數(shù)據(jù)自大”的道路。傳統(tǒng)科研方法經(jīng)歷了長時間的學(xué)術(shù)沉淀,具有較強(qiáng)的邏輯性、科學(xué)性和規(guī)范性,這是新誕生的大數(shù)據(jù)研究方法難以相比的。2014年,大衛(wèi)·拉澤(David Lazer)等學(xué)者在《科學(xué)》雜志發(fā)表文章,報告谷歌流感趨勢預(yù)測系統(tǒng)近年來的不佳表現(xiàn),指出:“龐大的數(shù)據(jù)量不代表我們能夠忽視研究中測量的基本問題、結(jié)構(gòu)效度、可靠性以及數(shù)據(jù)之間的依賴關(guān)系”(Lazer,Kennedy,King &Vespignani,2014)。關(guān)于谷歌流感趨勢系統(tǒng)在2012年年底出錯的問題,包括拉澤(Lazer)、巴特勒(Butler)等學(xué)者指出,該系統(tǒng)之所以高估流感的峰值,是因為政府部門以及媒體對流感出現(xiàn)的預(yù)警及廣泛報道。這種歸因思路的運(yùn)用,正是基于傳統(tǒng)科研方法而來。此外,大數(shù)據(jù)應(yīng)用還存在許多其他問題,需要依靠傳統(tǒng)科研方法進(jìn)行甄別。例如:雖然大數(shù)據(jù)可以極其全面、細(xì)致地描繪其所抓取數(shù)據(jù)的信息圖景,但是這些數(shù)據(jù)——也即是樣本,對總體而言是否具有代表性并不可知,數(shù)據(jù)所能反映的,僅僅是所有信息中的一部分。在瞬息萬變的信息環(huán)境下,樣本總體總是處于動態(tài)變化之中。拉澤(Lazer)提出了“算法動力學(xué)”的概念,認(rèn)為如谷歌這樣的搜索引擎不斷更新的算法可能致使系統(tǒng)無法穩(wěn)定的反映流感趨勢。如果沒有傳統(tǒng)調(diào)研方法、思維和經(jīng)驗的基礎(chǔ),這些問題都不可能被提出。可見,大數(shù)據(jù)并不能完全替代傳統(tǒng)調(diào)查研究方法。
在筆者看來,大數(shù)據(jù)應(yīng)用與傳統(tǒng)科研方法是否互為替代關(guān)系,這是一個偽命題。龐大的數(shù)據(jù)量是新興的大數(shù)據(jù)技術(shù)賦予人類認(rèn)知世界的又一手段:傳統(tǒng)的抽樣調(diào)查方法能幫助人們更全面、高效地了解樣本總體的大致面貌,而作為對傳統(tǒng)科研方法的補(bǔ)充,大數(shù)據(jù)能幫助人們放大其中某一部分信息的詳細(xì)內(nèi)容,更為細(xì)致地觀察個體的所有情況。因此,對于某一項調(diào)查而言,數(shù)據(jù)量并非越大越好,而應(yīng)視情況而定;相比龐大的數(shù)據(jù)量,數(shù)據(jù)質(zhì)量更為重要。在保證數(shù)據(jù)質(zhì)量的基礎(chǔ)上,采用既規(guī)范又創(chuàng)新的分析方法能挖掘出數(shù)據(jù)本身的價值,幫助人們更好地認(rèn)識世界——這才是大數(shù)據(jù)時代數(shù)據(jù)分析的核心所在。
值得注意的是,大數(shù)據(jù)是絕大多數(shù)媒體人的弱項。今年5月,筆者在北京做了一個針對媒體從業(yè)人員及高校新聞傳播院系的教師,進(jìn)行了500人規(guī)模的問卷調(diào)查,有效回收問卷353份。數(shù)據(jù)表明,高達(dá)85.55%的被訪者只是知道大數(shù)據(jù)這個名詞,只有7.08%的被訪者知道大數(shù)據(jù)的概念和特征,1.98%的被訪者知道大數(shù)據(jù)技術(shù)所涉及的軟件;5.39%的被訪者完全不知道大數(shù)據(jù),包括不知道這個名詞。究其原因:(1)與我國的新聞傳播學(xué)教育有關(guān),在我國幾乎所有的高校的新聞傳播院系,都是所謂的文科,開設(shè)的技術(shù)課程是十分有限。(2)中國的傳統(tǒng)媒體從業(yè)人員,技術(shù)出身的人所占比例偏低,絕大多數(shù)是所謂的文科出身。
對于新聞傳播學(xué)的研究者而言,存在同樣的問題。邏輯性、科學(xué)性和規(guī)范性,這是新誕生的大數(shù)據(jù)研究方法難以相比的。
二、用戶隱私安全成為最大的問題與挑戰(zhàn)
在大數(shù)據(jù)時代,用戶隱私安全面臨巨大的挑戰(zhàn)。一方面,大數(shù)據(jù)應(yīng)用不僅為企業(yè)帶來收益,而且也為用戶帶來好處。例如:程序化廣告能夠更好地實現(xiàn)廣告主與目標(biāo)用戶的對接,既增加了廣告的投放效果,也讓用戶更方便地找到所需要的產(chǎn)品。另一方面,數(shù)據(jù)的采集、存儲、分析、交易和棄用環(huán)節(jié)都存在一定的風(fēng)險,這讓個人用戶數(shù)據(jù)隨時隨地可能暴露于極不安全的網(wǎng)絡(luò)空間之中,致使用戶面臨前所未有的隱私與安全威脅。這個問題的解決牽涉許多利益集團(tuán)。宏觀來看,需要權(quán)衡新經(jīng)濟(jì)的發(fā)展與個人隱私安全之間的關(guān)系;微觀來看,這個問題需要依靠政府、立法機(jī)關(guān)、互聯(lián)網(wǎng)行業(yè)、傳媒行業(yè)等多個機(jī)構(gòu)和行業(yè)共同解決,涉及面非常廣。用戶隱私安全成為大數(shù)據(jù)時代最大的問題與挑戰(zhàn)。
(一)多數(shù)用戶對數(shù)據(jù)收集不知情
2013年的“3·15”晚會,央視爆出高德地圖、愛聊、公信衛(wèi)士等軟件竊取用戶隱私信息,并且,多家互聯(lián)網(wǎng)廣告公司涉嫌借助Cookie等技術(shù)侵犯用戶的個人隱私。一時間,技術(shù)詞匯“Cookie”成為當(dāng)時的熱詞。Cookie是每一個網(wǎng)站存儲在用戶瀏覽器中的小文本數(shù)據(jù)包,每當(dāng)用戶訪問網(wǎng)站時,這些數(shù)據(jù)便會傳送至該網(wǎng)站,幫助網(wǎng)站識別使用者的身份,以方便推送與使用者用戶相關(guān)的信息。一些網(wǎng)站,如電子郵箱的個人可識別信息,也被包含在這個數(shù)據(jù)包中。對于普通人而言,日新月異的互聯(lián)網(wǎng)技術(shù)一直都是相對復(fù)雜的技術(shù),在媒體曝光之前,許多人甚至不知道Cookie及其他相關(guān)技術(shù)的存在,通常在不知情的情況下被各大互聯(lián)網(wǎng)企業(yè)收集了數(shù)據(jù)。
“2912189271158★★★★★★★★★★,這是位于山東煙臺的一個女性互聯(lián)網(wǎng)用戶“冰”的cookie代碼……2月份,冰總共有42次點(diǎn)擊百度上京東的廣告,而且點(diǎn)擊幾乎都是在早上或晚上10到12點(diǎn)發(fā)生,1、2、3日她每天都到達(dá)“我的購物車”,但沒有下單,2月4日她下了第一個訂單1403983,8日16點(diǎn)下訂單1515991,17點(diǎn)下訂單1516321,10日0點(diǎn)下定單1554465。之后只是張望。”這個案例清晰的顯示出Cookie代碼記錄用戶行為信息的詳細(xì)程度。
如今,互聯(lián)網(wǎng)企業(yè)能通過包括Cookie、郵箱、賬戶、快遞、定位等方法工具掌握個人用戶的行為與愛好,用戶只要在網(wǎng)絡(luò)世界中有所行為,便會在不知不覺中暴露了自己的相關(guān)信息。雖然目前絕大部分?jǐn)?shù)據(jù)收集技術(shù)都經(jīng)過了匿名化處理,但是人們?nèi)匀挥袡C(jī)會通過信息中的蛛絲馬跡追溯到現(xiàn)實中具體的個人,更不必說網(wǎng)絡(luò)上各種惡意程序和黑客對個人數(shù)據(jù)的蓄意收集。用戶對數(shù)據(jù)收集行為知情權(quán)的缺失,致使維護(hù)用戶隱私安全的第一道防線被攻破,所有與用戶行為、喜好相關(guān)的數(shù)據(jù)因而流向各大企業(yè)的數(shù)據(jù)庫,等待被進(jìn)一步分析、處理或交易。
(二)多數(shù)用戶沒有對自身數(shù)據(jù)被處置說“不”的機(jī)會
伴隨著大數(shù)據(jù)技術(shù)的興起,數(shù)據(jù)成為所有行業(yè)和公司的重要資源,催生了大數(shù)據(jù)交易市場的出現(xiàn)和發(fā)展。如今,用戶的數(shù)據(jù)都能得到永久保存,用戶的數(shù)據(jù)甚至能夠比用戶的生命留存得更為長久。當(dāng)用戶的數(shù)據(jù)被企業(yè)數(shù)據(jù)庫存儲起來后,互聯(lián)網(wǎng)企業(yè)將進(jìn)一步最大化利用、處置這些用戶數(shù)據(jù),以達(dá)到為自身盈利的目的。不可否認(rèn),數(shù)據(jù)的“二次利用”是極具積極意義的,許多富含創(chuàng)意性的產(chǎn)業(yè)因而誕生。
但多數(shù)用戶對自身數(shù)據(jù)的保存、分析、處理、交易、丟棄都不具有決定權(quán)。用戶自身的數(shù)據(jù)流向何方,自己并不清楚。在用戶個人承擔(dān)隱私安全風(fēng)險的時候,互聯(lián)網(wǎng)企業(yè)卻從一次次的交易和挖掘中創(chuàng)造了巨大的經(jīng)濟(jì)財富,用戶卻沒有在這個過程中獲取任何利益。首先,通過對所有用戶數(shù)據(jù)的保存,互聯(lián)網(wǎng)企業(yè)能了解這些用戶的整體狀況、發(fā)展態(tài)勢和其他人口統(tǒng)計學(xué)的信息。其次,通過數(shù)據(jù)分析,互聯(lián)網(wǎng)企業(yè)能重點(diǎn)關(guān)注目標(biāo)用戶的信息,并進(jìn)一步進(jìn)行跟蹤或利用,從中挖掘價值。最后,為了實現(xiàn)企業(yè)數(shù)據(jù)庫的擴(kuò)大,許多互聯(lián)網(wǎng)企業(yè)會通過交換、交易等方式獲得更多的用戶數(shù)據(jù),用戶的數(shù)據(jù)因此流向更多不同的數(shù)據(jù)庫之中,這增加了用戶數(shù)據(jù)被泄露的風(fēng)險。總之,由于用戶對自身數(shù)據(jù)沒有處置知情權(quán)和決定權(quán),相應(yīng)地也就沒有拒絕被處置的權(quán)利。
(三)用戶數(shù)據(jù)泄露的風(fēng)險無處不在
在大數(shù)據(jù)時代,網(wǎng)絡(luò)用戶的行為暴露在“第三只眼”底下,幾乎沒有任何隱私可言。在大數(shù)據(jù)應(yīng)用為人們帶來巨大的經(jīng)濟(jì)效益,方便人們?nèi)粘I畹耐瑫r,它卻是以用戶承擔(dān)數(shù)據(jù)泄漏風(fēng)險為代價的,隱藏著“定時炸彈”一般的隱私安全問題。
首先,大數(shù)據(jù)時代存在存儲風(fēng)險,海量數(shù)據(jù)的急速傳播和增長無疑為硬件存儲和處理數(shù)據(jù)帶來一定風(fēng)險。而且,如果一個數(shù)據(jù)庫的安防設(shè)置不強(qiáng),便很有可能導(dǎo)致類似土耳其國家數(shù)據(jù)庫泄漏事件的發(fā)生。其次,黑客和病毒的攻擊,不僅可能影響用戶的財產(chǎn)安全,更有可能在未來威脅生命。許多惡意程序偽裝成殺毒軟件進(jìn)入用戶電腦,掃描用戶電腦中的程序,并佯裝詢問用戶是否需要支付費(fèi)用購買正版的殺毒軟件。一旦用戶點(diǎn)擊確認(rèn),用戶便會直接將錢財送入網(wǎng)絡(luò)犯罪分子的口袋。第三,非法的、未經(jīng)許可的商業(yè)利用和交易都會導(dǎo)致個人信息被犯罪分子掌握。2015年7月,中國香港地區(qū)高發(fā)電信詐騙案,涉款高達(dá)1.2億港幣,該案件的主要源頭便是個人信息泄露。最后,許多用戶對互聯(lián)網(wǎng)隱私的自我保護(hù)力度不強(qiáng),例如:過度暴露自身信息,設(shè)置的密碼過于簡單等,都會加大這個問題帶來的風(fēng)險。2014年年底,黑客瑞恩·科林斯(Ryan Collins)制造了震驚世界的好萊塢艷照門事件。起初,人們以為黑客是借助蘋果iCloud的系統(tǒng)漏洞對iCloud用戶進(jìn)行攻擊,調(diào)查后發(fā)現(xiàn),真正的原因是這些好萊塢影星設(shè)置的密碼過于簡單易猜,導(dǎo)致了黑客對她們的賬號發(fā)起定向攻擊。而將過于私密的照片上傳至云儲存平臺,本身也有一定的風(fēng)險性。
大數(shù)據(jù)的發(fā)展態(tài)勢已經(jīng)不可逆轉(zhuǎn),用戶在網(wǎng)絡(luò)中的一言一行都將被記錄,用戶隱私安全將是一項長期而又重要的研究課題。為了信息不被泄露而停止使用網(wǎng)絡(luò),無疑是因噎廢食的行為。國家和社會在鼓勵大力發(fā)展大數(shù)據(jù)產(chǎn)業(yè)的同時,也不應(yīng)將隱私安全的風(fēng)險最后全部落在個人用戶身上。如何權(quán)衡產(chǎn)業(yè)發(fā)展與用戶隱私之間的關(guān)系,如何創(chuàng)新用戶隱私保護(hù)的技術(shù)和機(jī)制,將是大數(shù)據(jù)產(chǎn)業(yè)可持續(xù)發(fā)展中不可回避的問題。
三、基于大數(shù)據(jù)技術(shù)的機(jī)器人容易產(chǎn)生“冰冷的”新聞
(一)“冰冷的”新聞
機(jī)器人寫新聞的技術(shù)基礎(chǔ)是大數(shù)據(jù)技術(shù)。
2015年年末,許多媒體機(jī)構(gòu)傳出機(jī)器人代替記者寫稿的消息,例如:新華社迎來一位“機(jī)器人記者”——“快筆小新”,騰訊財經(jīng)使用“Dreamwriter”寫稿,能在第一時間運(yùn)用算法生成新聞稿件,這些都讓人感嘆“記者即將下崗”。美國西北大學(xué)研發(fā)了新一代智能寫作軟件Narrative Science,宣稱將新聞報道和大數(shù)據(jù)技術(shù)進(jìn)行了一次新時代的結(jié)合,這款軟件通過對給定主題的數(shù)據(jù)分析,能夠自動地選擇合適的寫作角度,快速完成一篇具有標(biāo)準(zhǔn)新聞報道結(jié)構(gòu)的文章。雖然在新聞報道中自動增加了一些形容詞以提高可讀性,但寫出來的文章依然明顯缺乏新聞溫度,這是因為機(jī)器本身沒有辦法判斷情緒,它們只是單純地從數(shù)據(jù)庫中抽取形容詞,用法正確與否暫且不論,但與“手工打造”的飽含情感、責(zé)任和人文諸因素的新聞稿相比,從機(jī)器人手中傳遞出來的新聞雖然是新鮮的卻是冰涼的。技術(shù)的進(jìn)步加快了生產(chǎn)力的發(fā)展,“機(jī)器人寫稿”雖好,但卻缺少“溫度”。雖然大數(shù)據(jù)看似解決了新聞客觀性問題,但新聞的角度同樣重要。新聞是“有溫度”的,它嵌入記者的思考,倡導(dǎo)一種理念,體現(xiàn)人文關(guān)懷。然而,機(jī)器人“記者”卻只能“冷冰冰”地將數(shù)據(jù)中反映的事實全盤托出,難以體現(xiàn)人文精神。而且,機(jī)器人難以做到歸因、舉證,無法引導(dǎo)人們對某一則新聞的深入思考。由于機(jī)器人是根據(jù)特定算法生成稿件的,沒有加入記者的個性,千篇一律,長此以往,容易令人厭倦。
當(dāng)前新聞寫作軟件只能生成特定類型的報道,且只能采用單一來源的數(shù)據(jù),遵循這類報道常用的固定模式,大批量“生產(chǎn)”出有限類別的短新聞。具體的生產(chǎn)過程是機(jī)器人中固化的軟件事先被設(shè)定了算法,通過軟件整理數(shù)據(jù)事實,并與歷史數(shù)據(jù)和其他背景信息相結(jié)合,再遣詞造句呈現(xiàn)出描述性的新聞。機(jī)器人撰寫報道就如同做完型填空題一樣,只需要在設(shè)定好的語境中進(jìn)行簡單的填充即可。雖然現(xiàn)今這類寫作軟件變得更加“聰明”,算法更加先進(jìn),如將讀者喜好的語氣、角度甚至幽默融入一篇報道之中,以機(jī)器人報道籃球賽事為例,可能機(jī)器人會用同樣的數(shù)據(jù)生成兩個版本的新聞:一個版本為獲勝球隊的粉絲所寫,充滿歡天喜地的氣氛;另一個版本則是為失敗的球隊準(zhǔn)備的,讀起來讓粉絲沮喪低落。但無論如何,機(jī)器人無法理解兩個球隊所有粉絲的感受。讀者并不是因為獲勝就完全滿足,可能球隊通過比賽還是反映出存在的一些問題;而失敗一方也不一定完全是失落的,因為他們也許看到了同強(qiáng)隊交手中顯示出來的球隊進(jìn)步。因此,機(jī)器人是無法同創(chuàng)造力旺盛、想象力豐富的人類作者相比擬的。
作為面向普羅大眾的新聞媒體,要增強(qiáng)新聞宣傳和輿論引導(dǎo)的吸引力、感染力、親和力和影響力,就必須采制出有現(xiàn)場溫度及人情溫度的報道內(nèi)容。評判一條新聞的質(zhì)量好壞有多重標(biāo)準(zhǔn),但真正能打動受眾的往往是有溫度的新聞。新聞的溫度源于媒體人的社會責(zé)任感,源于媒體人對普通受眾的感情積累。做新聞不能只站在媒體的角度來反映民眾的生活,更重要的是在情感上實現(xiàn)與受眾的相互交融。
(二)依賴大數(shù)據(jù)技術(shù)還容易使人缺失新聞敏感度
通過新聞敏感度,不但能夠?qū)π侣剰臉I(yè)者的采寫能力進(jìn)行判定,同時也能對新聞價值進(jìn)行判定。新聞實踐是新聞從業(yè)者職業(yè)新鮮感、新聞寫作創(chuàng)新感的體現(xiàn),在新聞實踐過程中,如新聞敏感度缺失,則直接降低了新聞價值。一個具備很強(qiáng)新聞敏感度的新聞從業(yè)者,可以從平凡的事件中發(fā)現(xiàn)有價值的新聞,從很小的細(xì)節(jié)中洞見真實和深度,從而挖掘出有價值的新聞;而新聞敏感度較弱的新聞從業(yè)者,則會存在漠視現(xiàn)象和反應(yīng)遲鈍問題,從而與有新聞價值的線索擦肩而過,錯失好的新聞題材。
機(jī)器人將數(shù)據(jù)直接轉(zhuǎn)化為文章,成本較為低廉,因此機(jī)器人可用以提供對不同讀者的新聞定制服務(wù)。但是,基于大數(shù)據(jù)技術(shù)的機(jī)器人寫新聞,存在新聞敏感度缺失的問題,機(jī)器畢竟是機(jī)器,盡管美聯(lián)社表示機(jī)器人寫作軟件按照程序使用不同語氣的能力越來越強(qiáng),但新聞畢竟出自機(jī)器人之手,它不具備對新聞線索進(jìn)行挖掘的觀察能力,也不具備對新聞事件進(jìn)行取舍的決斷能力,而這兩種能力是新聞敏感度的重要體現(xiàn)。
就機(jī)器人撰寫新聞的過程而言,一些具有固定模式的行業(yè)性文章更符合它的本能,因為既不需煉字鍛句,又不需深度分析。如果有一天記者真的被冷冰冰的機(jī)器人取代,新聞恐將淪為諸多報道模式的生硬“拼盤”。人們很難期望機(jī)器人會像人類一樣,能夠根據(jù)不同的采訪對象,變換不同的采訪語氣與被訪者進(jìn)行觀點(diǎn)和思維的交鋒。我們在認(rèn)可機(jī)器人存在技術(shù)上的優(yōu)勢之外,也承認(rèn)機(jī)器人是無法同人類一樣具有足夠的應(yīng)變能力和創(chuàng)造能力的。人類的思維至少在短時間內(nèi)無法被機(jī)器人模仿,分析和觀點(diǎn)性的報道需要消息來源、知識積累、邏輯思維等眾多的能力在里面,在這些方面,機(jī)器人寫手無法與記者一決高下。通過機(jī)器人撰寫的稿件,會因為內(nèi)容的生硬和重復(fù)而影響稿件的質(zhì)量。“機(jī)器人記者”能寫的文章種類有限,無法進(jìn)行深度分析,更不會煉字鍛句。
記者工作是一種復(fù)雜的、高級的腦力勞動。機(jī)器人也是人類發(fā)明的。機(jī)器人的構(gòu)思再精巧,也無法替代人腦。機(jī)器人搶不走記者的飯碗。人們不能指望機(jī)器人在鏡頭前隨機(jī)應(yīng)變或深入背街小巷明察暗訪。新聞作為一種文字和圖像的藝術(shù),字里行間與鏡頭之下,都包含著記者的判斷、價值觀與人文關(guān)懷。機(jī)器人寫手雖有其技術(shù)優(yōu)勢,但卻無法完全具備人的靈活性和創(chuàng)造力。機(jī)器人寫手只是一種輔助形式,它可以節(jié)省時間,把記者從一堆基礎(chǔ)數(shù)據(jù)和信息中解放出來。
四、大數(shù)據(jù)帶來的社會憂慮
大數(shù)據(jù)技術(shù)變革了所有產(chǎn)業(yè),不僅改變了我們的生活、生產(chǎn)等多個領(lǐng)域,而且改變了我們認(rèn)知世界的方式。在這個過程中,不可否認(rèn),大數(shù)據(jù)的確帶來了許多積極影響,這也是它能夠成為時代焦點(diǎn)的原因之一。但是,不可忽視的是,正如“蝴蝶效應(yīng)”一般,大數(shù)據(jù)技術(shù)的發(fā)展也衍生出一系列新的社會現(xiàn)象,如用戶閱讀行為的改變,人文精神的衰退,社會歧視和個人自由的喪失,引發(fā)了人們的思考、爭議和擔(dān)憂。大數(shù)據(jù)正處于初始發(fā)展階段,若是對這些現(xiàn)象和影響不加以探討和警惕,便有可能在未來對人類社會造成一定的傷害。
(一)用戶閱讀習(xí)慣的改變
在信息過剩的大數(shù)據(jù)時代,人們每日能夠接觸到海量的信息,加上移動設(shè)備的普及,讓人們不再限于一個場景進(jìn)行閱讀,閱讀習(xí)慣也隨之改變。雖然如今手機(jī)用戶能夠24小時不斷接收信息,但是也帶來了一系列問題,主要體現(xiàn)在三個方面:淺閱讀、碎片化閱讀和同質(zhì)化閱讀。
首先,2015年4月,亞馬遜發(fā)布“中國2015‘全民閱讀’調(diào)查報告”,顯示以社交媒體為主的淺閱讀已經(jīng)成為很多讀者生活的重要組成部分(亞馬遜中國,2015)。淺閱讀,也就是快速瀏覽內(nèi)容信息而不加深思,不求甚解,是大數(shù)據(jù)時代用戶閱讀習(xí)慣改變的主要趨勢之一。它可能造成經(jīng)典著作少人問津,使人們的視野變得狹窄,進(jìn)而失去獨(dú)立和批判思考的能力。第二,用戶碎片化閱讀趨勢也十分明顯。隨著人們的生活節(jié)奏逐漸加快,許多人只能利用零散的時間在移動設(shè)備上進(jìn)行閱讀。盡管有不少人認(rèn)為碎片化閱讀能擴(kuò)充人的知識面,但它不過是增加一點(diǎn)表面常識,難以讓人形成對某一問題系統(tǒng)化、深層次的理解和看法。最后,個性化新聞推送如今已成為新聞界的一大發(fā)展方向,伴隨而來的是對同質(zhì)化閱讀和群體極化的思考。在互聯(lián)網(wǎng)領(lǐng)域,盡管表面上網(wǎng)民用戶能接觸所有信息資源,但事實上,由于信息的海量性和相關(guān)個性化推送技術(shù)的成熟,用戶只能針對性地選擇與自己相關(guān)的內(nèi)容,人們接觸信息的同質(zhì)化傾向比傳統(tǒng)媒體時代要高,容易加深群體極化的趨勢。
(二)社會歧視
大數(shù)據(jù)時代,也可能在社會上導(dǎo)致潛在的“大數(shù)據(jù)歧視”。2015年初,微信朋友圈出現(xiàn)廣告,引發(fā)網(wǎng)友熱議。微信應(yīng)用特定的大數(shù)據(jù)算法推送相關(guān)廣告信息,致使部分網(wǎng)友刷到可口可樂廣告,部分網(wǎng)友刷到Vivo手機(jī)廣告,另有一些網(wǎng)友刷到寶馬廣告。在互聯(lián)網(wǎng)企業(yè)面前,個體消費(fèi)者成為一個個“透明人”,所有消費(fèi)者將不再平等,數(shù)據(jù)庫顯示下的“窮人”很可能遭遇歧視服務(wù)。
消費(fèi)歧視是大數(shù)據(jù)時代廣告業(yè)個性化推送附帶的弊病之一,更為令人擔(dān)憂的是,個人隱私信息的泄露可能會帶來更為嚴(yán)重的社會歧視。例如:個人醫(yī)療信息的泄露,如:乙肝患者、艾滋病患者等弱勢群體信息的曝光,可能使這些人群的基本人權(quán)受到侵犯,造成諸如日常生活受阻、就業(yè)困難等問題。大數(shù)據(jù)歧視也可能加深人們的刻板印象。2016年年初,百度大數(shù)據(jù)推出中國偏見地圖,這可能加深人們對某一地區(qū)、族群的刻板印象。比如:河南人都是騙子,廣東人什么都吃,新疆人多為小偷等。這種刻板印象將造成現(xiàn)實生活中職業(yè)歧視、司法歧視、婚姻歧視等一系列歧視問題的發(fā)生。
最重要的是,大數(shù)據(jù)的預(yù)測功能還可能造成對人們潛在行為的懲罰和判斷,進(jìn)而引起社會司法的混亂與不公。通過大數(shù)據(jù),警方可以了解一個人的過去和近期行為,進(jìn)而預(yù)測其未來的行為趨勢。這種預(yù)測行為看似是為社會公眾安全著想,但事實上卻會帶來許多問題。倘若大數(shù)據(jù)顯示某人過去有案底,且近期行蹤可疑,便判斷其可能有作案傾向,警方便將其逮捕歸案,這就剝奪了個人最起碼的自由權(quán)利。這種技術(shù)和思路一旦被擁有公權(quán)力的機(jī)構(gòu)和個人掌握,成為統(tǒng)治社會和打擊敵對勢力的工具,便可能導(dǎo)致許多無辜人員無端受害,造成大量社會不公,進(jìn)而危害人們的自由和生命。
五、結(jié)語
在網(wǎng)絡(luò)傳播技術(shù)高速發(fā)展的今天,“大數(shù)據(jù)”一詞甚囂塵上,在各行各業(yè)中都被熱切地討論。傳媒學(xué)界和業(yè)界對大數(shù)據(jù)具有各種美好的期待,“數(shù)據(jù)新聞”的專業(yè)實踐正在如火如荼地展開。毫無疑問,大數(shù)據(jù)應(yīng)用產(chǎn)業(yè)將產(chǎn)生巨大的經(jīng)濟(jì)效益,筆者并非要全盤否定它的先進(jìn)性,但是大數(shù)據(jù)發(fā)展過程是否也平衡了價值理性,這需要傳媒業(yè)的重新估量。縱觀社會發(fā)展進(jìn)程,一項新興技術(shù)一旦投入使用,便是覆水難收,難以回頭。只有在大數(shù)據(jù)技術(shù)方興未艾的時候,通過對它的理性思考,才能促使政府與立法機(jī)關(guān)規(guī)范大數(shù)據(jù)的使用,促使企業(yè)合理應(yīng)用大數(shù)據(jù),進(jìn)而才能有效避免大數(shù)據(jù)的發(fā)展對傳媒產(chǎn)業(yè)及整個社會帶來的問題與危害。