作為一種技術,大數據只是計算機數據分析技術新發展的一環。但就其對于新聞傳播的影響或者意義而言,國內外研究者對大數據的內涵和外延都已進行了從自然科學到人文社會科學的思想躍遷和現象學式的想象,并將其價值和功能無限延宕。筆者認為,所謂大數據新聞傳播,實質可視為計算社會科學的一個新發展,它要求新聞發現、生產與傳播范式由傳統意義上的以經驗、理論和計算為中心轉變到以數據處理為中心的新范式,這也就是我們所說的用數據思維產制新聞,即電腦化新聞模式,與傳統的人腦(或人工)新聞模式相并立。
與傳統文字敘述為主的新聞報道相比,大數據新聞主要通過數據統計—數據分析—數據挖掘等技術手段發現新聞線索,并用邏輯化的數據拓展既有新聞主題的廣度與深度,最后以圖表、數據為主,輔之以必要的少量文字的可視化方式加以呈現,從而致力于新聞報道的客觀、系統和可視體驗。這種想象和設計十分契合現代科學追求數字化、量化,把一切都還原為數學方程式的思維邏輯。按照這種思維邏輯的設定,新聞文本只要從紛繁蕪雜的數據海洋(現象)中找到某種所謂的本質的東西,比如自然科學的公式,那么信息世界就盡可把握了,如是乎?作為一種認知新聞事物的思維程序,大數據新聞認知的普遍性邏輯必然會抽離個別新聞事物的具體性,其特征是一步一步地撇開個體新聞事物身上道德的、功用的、審美的和哲學的等意義,以還原為最為抽象的同一性。這種新聞生產邏輯必然會遺漏與特定本質屬性缺乏關聯的非本質新聞屬性,從而使個別新聞事物的整體形象和全部意義無法得到認知與傳播,最終導致大數據新聞的本質和客觀性既不能深刻反映社會意義的原型結構,更不能反映超自然的、高位階的社會信息需求。也就是說大數據本身是一種理性的表現,但還需要更大的理性——人文法則的觀照。依據狄爾泰的看法,人文科學乃至生活世界中的客觀性,在于解釋與反思一系列視域和融貫性內的諸種關系。一般認為,這些意義、關系越融貫為一體,生活世界和人文科學中的客觀性便越是客觀的、真實的、具體的。對于大數據新聞而言,如何實現這些關系的內在融合,以實現新聞客觀性、真實性和具體性之人文內涵,必須澄清當下“大數據”給我們在如下關系領域內造成的混亂。
(一)重普遍性而輕個體性。
對于大數據新聞人文與科學態度的劃分,就是以強調個體性還是強調普遍性為基本依據的。因為人文科學強調的是個體性的人生價值意義而自然科學強調的是普遍性的規律。從大數據的實踐層面看,一般認為大數據的時代其實是弘揚理性精神的時代,但如果大數據分析和使用在于滿足非正義的事情,那么,這正好說明大數據本身不完全等同于理性,更大的理性是人文法則。最后,大數據新聞從自然之物到文化之物的轉化過程,實際上就是普遍性本質轉化為個體性本質的過程,也是一個由重共同性到重特異性的轉化過程。因此,對于大數據新聞中的人物或者事物,我們都既可以從自然科學的角度來分析和報道,也可以從人文科學的角度來分析和報道。至于大數據如何推動社會進步,這種進步的速度有多快,或者進步的同時是否還會倒退,這些都取決于我們自己。
(二)重關聯性而輕因果性。
維克托·邁爾·舍恩伯格在《大數據時代》中指出,隨著人們看待數據的方式的變化——從局部變為全部以及從純凈變為凌亂,思維方式也應該轉型,即從因果關系轉向相關性。或者說,只要知道“是什么”,而不需要知道“為什么”。這觀點有些類似于休謨懷疑論的知識論。休謨指出,對象之間并沒有可以發現的聯系,我們之所以能根據一個對象的出現推斷另一個對象的存在,并不是憑著其他的原則,而只是憑著作用于想象上的習慣。這里休謨將因果關系歸因于一種未經反思的心理經驗,認為一切的抽象以及邏輯推理都是這種心理經驗的派生物。這種“想象上的習慣”的關聯方式無異于這個經典的社會學考題:冰淇淋的銷量和強奸案的發生率存在線性關系,即一個增長,另一個也增長。不過,兩者之間顯然沒有因果關系,而只有相關關系。另一個變量,即天氣變暖,才是兩者之間的真正橋梁。所以,舍恩伯格這種放棄因果關系而只考察相關性的思路,與其說是一種進步,倒不如說是一種思維紊亂。因為它不利于我們消除不確定性而進行下一步預測,也無法采取行動。研究者辨明因果關系并非來自統計,而是來自研究者的理論和假設。但是大數據分析更關注數據的相關性測量和商業應用價值。大數據是發現那些不能靠直覺發現的信息和知識,甚至是違背直覺的,有時候越是出乎意料可能越有商業價值。
(三)重信號而輕噪聲。
大數據新聞重要的功能之一就是減少或消除不確定性,以預測未來事態。信息的指數型增長有時被人們視為萬靈藥,以至于人們根本分辨不清大數據中的信號和噪聲。納特·西爾弗在《信號與噪聲》一書中指出,在任何一個數據豐富的領域,尋找預測模式都很容易。關鍵是要分辨出這些模式到底是噪聲還是信號。他舉了天氣預報、政治選舉預測、地震預測、棋牌游戲、股市、恐怖襲擊等多個領域的例子,認為我們對未來的預測,應該基于可能性,以概率的方法思考問題,在不斷試錯中進步。從某種意義上說,大數據新聞傳播也必然在預測和證實(證偽)之間有其獨特的實踐邏輯設計。但該認知邏輯必由兩個組合的構成因素所支配:一個是新聞實踐成功的程度所必須的認知資源,如信息、時間和計算能力。另一個是新聞實踐推理主體所瞄準的認知目標的高度。由于這兩個因素有程度之別,因此,某一具體的新聞實踐行為是一個相對的、可比較的概念,而不是一個絕對的、沒有參照物的死物。按此觀點,只有當大數據新聞推理者心中擁有的認知任務和其可利用的認知資源相匹配時,推理才是正確的。對于傳統新聞主體而言,認知的信息、時間和計算能力資源與作為高層次的大數據新聞推理者相比較而言,相對不豐富,因而,傳統新聞主體的認知目標相對適中。盡管如此,我們可能還會以對自己有利的方式對這些數據進行分析和解釋,而這些方式很可能與這些數據(所代表)的客觀現實不相吻合。數據驅動預測機制可能會成功,也可能會失敗。一旦我們否認數據處理過程中存在著主觀因素,失敗的概率就會增加。因此,在1970年出版的《未來的沖擊》一書中,阿爾文·托夫勒對他所說的“信息超負荷”的一些后果進行了預測。他認為,盡管世界本身正走向分化,變得更加復雜,但人類仍會以堅持自身看法的方式使這個世界變得簡單,這便是我們的防御機制。
(四)用事實說話和用數據說話。
大數據時代既要用事實說話,也要用數據說話,這句話是沒錯,但關鍵在于應該說清楚用事實說話是用具體的、抽樣的個體性事實說話,而用數據說話是用抽象的、普遍性規律說話。前者是必然的理由,后者具有或然性。因為大數據樣本不僅需要更多的時間去分析,它們往往還包含被抽樣的所有個體的許多不同信息,從統計學的角度講,這意味著這些樣本是“高維的”。更多的維度增加了發現欺騙性關聯的風險。比如,在醫學研究中,可能會將某種藥物的療效與病人的身高聯系在一起。但是這可能僅僅是因為大數據包含方方面面的信息,從身高、體重到眼睛的顏色等等。需要考慮的維度如此之多,有些維度顯得重要似乎只是出于偶然。因此,用數據說話是媒體在大數據時代展現權威性、公信力的重要手段,但不是必不可少的手段。
(五)重傳者分析而輕受眾理解。
時下西方媒體慣常于通過對數據挖掘的方式進行新聞報道,通過仔細分析大量數據來揭示有意義的新的關系、趨勢和模式,筆者試問:這些發現的所謂常規新聞中不能體現的邏輯,真的能幫助讀者對新聞事件進行深度解讀嗎?當然,無可厚非的是計算機領域的科學家通過開發出卓越的計算能力和信息存儲技術,讓大數據的積累成為可能。但是收集數據及存儲信息與理解這些內容并不是一回事。了解大數據的真正意義并不等同于對小數據進行解讀。對于廣大非專業的受眾而言,對大數據分析結果的理解絕不應是簡單回憶,而是具有歷史的連續性和非連續性特點,即盡管過去了的東西其本身不可能原樣再現和重演,這是講的非連續性。但歷史事件一旦過去,它總會給后人留下對它的某種理解,這理解就是給出歷史事件的意義,正是這理解才使得一去不復返的歷史事件持存著、繼續著,而這也就是歷史連續性的具體內涵。而大數據新聞因為過多的強調非結構化序列的連續性而割裂新聞事件歷史意義的非連續性傳承,從而使得新聞歷史意義空洞化,從而加大其隨機性定義生成的可能性,使得新聞總體上缺乏歷史必然性的觀照。
綜上,(自然)科學視域下的大數據新聞以探索統一性的、普遍的本質為己任,其新聞客觀性邏輯就是最大普遍性,最大的同一性就是最大的客觀性。而人文科學視域下的傳統新聞在于追求個體性的人生意義,其客觀性訴求在于將普遍意義與豐富的個體性的人文意義統一起來。具言之,大數據新聞客觀性來源于對一個個具體的個體所持有的豐富意義域向普遍性方向進行抽象的結果,其特征是一步一步地撇開個體身上道德的、功用的、審美的和哲學的意義等,以至最終達到最為抽象的同一性。反其道而行之,傳統新聞客觀性則在于首先以抽象的同一性意義為邏輯起點,超越但不拋棄抽象走向具體,通過把功用的、審美的和道德的意義與普遍意義融貫在一起,構建一個包括所有這些意義在內的有機統一體。這就是大數據新聞實踐更大的理性——人文法則所必須遵循的根本邏輯和基本途徑。這無疑也應該是當下大數據新聞研究的基本方向和進路。那些一味堅持大數據新聞普遍本質的自然科學研究范式,既不能深刻反映社會意義的原型結構與超自然的高位階的社會信息需求,也不是大數據理性的完滿表現。因為,對于人類社會而言,超越大數據理性的更大的理性原則是人文法則,是人生的根本意義。