華東師范大學社會學研究所所長、教授文軍在《人民日報》撰文指出,作為新發明和新服務的源泉,大數據正在改變人類的生活乃至理解世界的方式。但我們不應盲目崇拜,而要正視潛藏的風險和挑戰,避免在大數據的洪流中迷失。
一要防止大數據的“去人性化”忽視人的主體價值和數據的社會文化意義。如果人及其各類社會行為都僅僅被看作一個個數據符號,我們就很難從中解讀出充滿朝氣、富有激情的人,也就很難從數據塑造出來的沒有個性特征的人去推導群體樣態和社會構成。現在一些大數據研究存在的一個重大缺陷是,它只關注“客觀數據”的呈現,而缺少對“主觀數據”的反映。從社會學角度看,所有數據說到底都是有關“人”的符號。而符號所蘊含的社會文化意義,是我們真正需要了解和掌握的內容。
二要防止大數據的“巨量化”強化數據霸權。大數據的復雜性不僅在于其數據樣本巨量,更在于其多源異構、多實體和多空間之間的交互動態性。當前只有少數人掌握處理這種復雜的巨量化大數據的技術,因此容易導致“數據暴力”。如何防止大數據霸權,是一個需要認真對待的問題。
三要防止大數據的“碎片化”導致人們難以系統認知復雜事物。當前,許多數據僅停留在“碎片化”階段而難以被真正挖掘和分析。對這些碎片化的數據進行清理,進而形成規整的結構,是大數據能夠得到充分利用的根本所在。在大數據中,其研究范式重在發現而不是推論;不是像傳統的社會調查方法那樣通過假設檢驗來進行推論,而應通過數據的總體歸納來達成對社會現象的總體分析。這不僅要求我們在數據清理技術、存儲結構上進行優化,而且要在數據采集環節盡可能做到規范。
四要防止大數據的“模糊化”產生大量信息垃圾,從而為數據造假和不當傳播打開方便之門。在大數據時代,我們想要獲取的信息資源可能只占數據總體的萬分之一甚至更少。從這個角度說,大量的信息其實都是垃圾。不僅如此,許多大數據本身就是模糊的,其中含有虛假和有害的內容。如果純粹憑借數據來判斷和分析,甚至不假思索地利用和傳播,就會導致許多誤判。因此,未經前期調研論證和規范分析所獲取的信息,其數據量越大可能越模糊,得到的垃圾信息也就可能越多。