“大數據”能力不僅是一種統計技術和數據分析能力,更考驗著政府在信息上的開放和透明。
在令人恐懼的SARS事件過去10年后,令人不安的禽流感又來了。
最新報道:4月9日上海新增確診2例人感染H7N9禽流感病例,浙江新增2例;全國共發現確診病例28例,共8人死亡。一個好消息是,上海4歲感染H7N9禽流感男童康復;一個壞消息是,農業部稱不排除更大范圍檢出H7N9禽流感。人們很習慣遺忘,政府尤其健忘,可現實逼著政府去反思SARS事件10年后自己在提升信息公開和改善突發事件應對上到底做了什么?
流感信息的發現、統計和發布,關鍵是數據的處理。這一次的禽流感,尤其考驗著政府的“大數據”能力。
“大數據”是近來很流行的一個概念,是面對信息爆炸時代產生的海量數據,對這種龐大的數據資源的處理能力和統計技術。誰率先具備從各種各樣類型的數據中快速獲得有價值信息的能力,誰就是贏家。很有意思,關于大數據最聞名的故事,就與流感相關。舍恩伯格在《大數據時代》開篇中就講了這個故事:2009年甲型H1N1這種結合了導致禽流感和豬流感的病毒出現時,全球的公共衛生機構都擔心一場致命的流行病即將來襲,可各國疾病和預防中心在發現和統計流感信息方面又很滯后,因為人們在以為自己患了普通流感的情況下一般不會去醫院,病重時才會去,醫院才會搜集到這個信息,而且這種信息傳到疾控中心也需時間,所以通告新流感病例時往往會有一兩周的延遲。對于一種可能飛速傳播的疾病,信息滯后兩周的后果將是致命的。
而一家知名互聯網公司的工程師發表的論文則讓公共衛生官員們感到震驚,文章解釋了這家公司為什么能夠預測到冬季流感的傳播:不僅是全美范圍的傳播,而且可以具體到特定的地區和州。這家公司是通過觀察人們在網上的搜索記錄來完成這個預測的。他們每天都會收到來自全球超過30億條的搜索指令,他們希望通過分析人們的搜索記錄來判斷這些人是否患上了流感。他們不是簡單地以“哪些是治療咳嗽和發熱的藥物”之類檢索詞條來判斷,而是通過檢索詞條的組合建立了一個數學模型。所以,這一年甲型H1N1流感爆發的時候,與習慣性滯后的官方數據相比,這家公司建立了一個更有效、更及時的指示標。
舍恩伯格是想通過這個故事說明,大數據深刻地改變了公共衛生,改變了人們的思維方式。當今天H7N9禽流感成為問題時,我們的政府部門有必要反省自身的“大數據能力”:政府有沒有告別那種滯后的統計方式,有沒有能力對海量數據進行有效的分析,從而讓政府的判斷走在疾病傳播的前面,不僅能預測,更能在流感傳播前進行有效的預防。
“大數據”能力不僅是一種統計技術和數據分析能力,更考驗著政府在信息上的開放和透明。首先,政府能不能獲得真數據?現在很多政府部門最缺乏的就是獲得真數據的能力,層層虛報,層層造假,“知情權“被層層說謊的體制所剝奪,沒有能力獲得反映真實情況的數據信息,海量數據都是垃圾數據。然后,信息能不能自由流動?在一個信息被壟斷和被操縱的空間中,信息是很不完整的,碎片化零散的信息自然難以進行大數據分析。最后,信息能不能透明公開?以“擔心影響社會穩定“、“公開會引起恐慌“的理由封鎖信息,那是最愚蠢的。