5月份宏觀經濟數據一出來,即引來各方專家解讀。略有不同的是,來自統計業內的動向顯示,包括CPI在內的宏觀經濟數據正面臨一場變革。這場變革是大數據時代的一種必然。我國宏觀經濟數據正從自產自析的1.0時代走向借助全社會大數據的2.0時代。
大數據并不是單純的海量數據,它更蘊含著一種計算和思維方式的轉變。我們要通過對海量數據的交換、整合和分析,發現新的知識,創造新的價值,帶來新的發現。
大數據比傳統抽樣調查的優勢就在于,大數據是采集每個可以采集的數據點,用全面數據代替了抽樣、片面、局部的數據。分析數據,就是為了從數字中尋找可能的規律。一個真實過硬的數據體系,更有益于科學決策,造福于社會。歷史學家黃仁宇在《萬歷十五年》中有過一個著名論斷:中國人不善于用數目字管理,對古幣存世量的討論,大多含糊其辭。
我國現行的《統計法》歷經1996年和2009年兩次修訂。社會各方越來越重視分析比較各類數據。不過,現實表明,我們的宏觀經濟數據的統計工作仍有大力提升的空間。2013年全國31省區市的國內生產總值(GDP)之和約為63萬億,這個數據超出了全國GDP總量逾6.1萬億。事實上,像這樣巨大的統計“誤差”絕非個例。出現這類統計誤差,原因不外乎兩個,一是統計標準不一,比如未能有效厘清對特殊企業特殊行業的統計內容;二是統計中摻有政績“水分”,這也是導致統計誤差的重要原因。
在抽樣分析時數據測量能力有限,而大數據能獲得更加全面真實的數據,并且對宏觀趨勢給出快速預測。在大數據時代,數據已經能夠自己說話,傳統的科學統計模型已經過時,理論也可能被終結。
大數據的能量往往也超出我們的想象。在房地產價格統計上,銀行的貸款信息及住建部門的網簽數據能讓房地產價格數據更真實可靠;在就業領域,搜索引擎大數據可以幫助監測預警失業率和勞動力市場供求狀況;通過鋼鐵、有色金屬、能源、水泥的貿易數據判斷供需走勢等等。這些不是異想天開,它們一旦落地,將大大提高宏觀經濟數據的精細化,提高決策的科學性。
正如國家統計局局長馬建堂所說,“誰擁有了大數據,誰就占有了制高點。就政府而言,大數據必將成為宏觀調控、國家治理、社會管理的信息基礎”。他的話可謂高屋建瓴。今年全國兩會就有人大代表提出,可以通過分析春節期間移動用戶漫游情況,掌握人口的流動規模與遷徙規律,為交通管理、鐵路運輸、公共安全管理等提供決策參考。這是挖掘大數據價值的現實建議。
與不少發達國家已把大數據的開發應用提高到國家戰略高度相比,我國的大數據管理還處萌芽狀態。重定性、輕定量,重觀點、輕數據的思維慣性,使得我們在數據收集、使用和管理上不太靈敏。
目前,雖然各方都為挖掘大數據開發了很多工具,但大數據的成熟應用還有很長一段時間。首先,數據雜亂,價值密度低,如何有效地收集數據信息仍沒有成熟的方案。同時,數據的規模并不能決定一切,不論是哪種數據分析方式,都可能存在統計上的缺陷,不能說數據更大、更新、更快就沒有問題。