英國人維克托寫了一本《大數據時代》,并由此預言人類生活、工作與思維的大變革。世界的本質就是數據,這是維克托秉持的看法。普通人大可不必如此哲學地認識大數據,只需知道,不管承認不承認、樂意不樂意,海量的數據正不間斷地向我們涌來。很可能,人的生存狀態,社會進步的節奏,就隱藏在這些數據中。
數據的獲取與披露,正在成為一般人關注自己、審視社會的方式。技術的供應與運用已不是問題,八旬老人可以嫻熟上網,七歲幼童也能玩轉手機聊天。但獲取的興趣,披露的選擇,大相徑庭。這可能將人們導向數據的陷阱:獲取或披露的數據,不是整體的而是零星的,不是具有相關性的而是碎片化的,甚至不是源于真實而是蓄意捏造的偽數據。這樣的數據再“大”再多,也無助于人類生活、工作與思維向好的方向變革。
失真的數據往往模糊生活的真相,把人引向歧途。比如正為高血壓、糖尿病困擾的患者,可以經常看到徹底根治的良藥問世,有名有姓的成功病例,讓你以為“不再終身服藥”夢想成真,不惜大把掏錢。比如正為孩子成長操心、害怕輸在起跑線上的家長,就可能及時得到“小學500強排名”的入學指南,甭管這樣的排名實不實,靠不靠譜,是否符合教育規律,舍得花錢的家長,謀求生源的學校,終將借此如愿以償。
通俗地說,數據就是信息,任何人類活動、社會現象都可通過數據呈現量化的表達。觀照自己,關注社會,關心國家大事,就不能不注意一組一組數據的獲取,但獲取數據的能力因人而異。有的人天生對數據無興趣,不認為數據恰是自己生活構成的一部分,寧與數據擦肩而過,也不做數據的有心人;有的人只是孤立地知悉數據,卻沒能力解析數據蘊含的意義。生活中,不關心數據的人很少,但能夠通過數據發現社會問題、洞察社會趨勢的人可能更少。
這次“十一”長假過后,是否取消長假的討論一直很熱。取消派認為,長假集中,交通與景點都不堪重負,而支撐其觀點的數據就是“5億人出游”。我立馬想到,這個數據確實嗎?13億人,除去農民一大塊,享受長假的到底有多少?享受長假者是不是人人都齊步出游了?5億人,多少動車、多少飛機載得下,多少旅館飯店安頓得了?而以我個人在幾個景點(不算小、級別也不太低)的經歷,得到的只是游人寥寥無幾的印象。可以說,如果數據前提是不實的,這個討論就與想要解決的問題沒多大聯系。
在《大數據》推薦序中,中國被定義為“世界上最復雜的大數據國家”。我理解,所謂復雜者,所有社會現象與問題,都不能解釋為數據間簡單的因果聯系;正處于高速發展與社會轉型期的中國,數據與數據之間不是平行或等值的。面對這種復雜,首先需要重視的是涉及公共管理數據的采集與公開,而政府最具能力與資格成為數據采集與公開的實施者與責任者。比如大氣污染、貧富差距等,一組有權威的真實數據的采集、建立并公開,可能意義不止于滿足人民群眾的知情權,更可能有效遏止那些臆想捏造、流言相傳的偽數據,攪亂人的心態,忽悠人的夢想,顛覆社會的價值判斷。