新媒體時代,大數據技術方興未艾,面對互聯網上的海量信息,借力大數據強化網絡輿情分析研判,有效預防突發事件發生,對輿情工作者亦是有益嘗試。
預測是大數據輿情分析研判的核心
大數據的核心作用是預測,大數據輿情分析研判是輿情工作者通過收集分析互聯網上關于社會熱點或網民關注焦點事件的大量消息報道,發掘背后隱藏關系,進而預測事態發展趨勢,為輿情事件處置提供決策參考。
預測不是預知,更非先知,大數據輿情分析研判也是通過對現有數據分析運算而推出結論,對事件發展趨勢的預測與數據數量、質量和分析模型等密切相關。在輿情事件處置中,應樹立依靠而非依賴數據的指導思想,避免數據獨裁,這一點我們要有清醒認識。
數據是大數據輿情分析研判的基礎
互聯網上海量數據的存在是大數據輿情分析研判的基礎,但是面對紛繁浩雜、真偽難辨的網絡信息,需要輿情工作者秉持來源廣泛、時效性強、數量大的原則收集篩選各類數據,客觀反映事件真相。
數據來源要廣泛。大數據輿情分析研判所需數據,不僅要來自官方輿論場還應包含民間輿論場,既要有正面贊揚更要有負面批評。網絡輿情數據按網民參與度可分為消息數據和互動數據。消息是網上關于事件的各類報道,來源廣泛、真假難辨,此類報道通常會將網民聚焦到事件本身,引發關注,是突發事件的“導火索”,也是分析事件起因的重要線索。互動數據是網民對社會熱點事件情感意愿的體現,是社情民意的真實反映,是突發事件的“催化劑”,也是研判輿情發展趨勢的基礎,是輿情分析的核心,收集數據時,應特別關注貼吧、論壇、新聞跟帖、微博、微信等互動數據的采集。
數據時效性要強。現在每天互聯網上的數據以GB甚至TB級規模增加,總量超乎想象,這就需要收集輿情數據時把握好數據的時效性。對于數據時效性,通常根據輿情事件的性質、規模、影響力等因素綜合分析。
數據量足夠大。現在網上各類消息滿天飛,真偽難辨,錯誤的消息數據會嚴重影響輿情分析質量。辨別消息真偽的關鍵是看消息間邏輯關系是否合理,假消息通常與其他消息沒有聯系或聯系不緊密,不能與之構成合理的消息鏈,這就要求輿情工作者應收集盡量多的數據,數量大到能多維度反映事件真相,內在邏輯關系能讓假消息原形畢露。
數據分析是大數據輿情分析研判的關鍵
大數據輿情產品的價值來源于數據分析。數據本身并不產生價值,對數據開發利用才會產生巨大價值。好的數據分析技術或模型會透過消息表象全方位揭露隱藏于消息背后的微妙關系,國內有學者形象指出:如果把大數據比作石油,那么數據分析技術就是勘探、鉆井、提煉、加工的技術,只有掌握大數據的關鍵技術才能將資源轉化為價值。
一個科學高效的輿情數據分析模型應盡量減少人為干預,用簡單算法分析盡量多的數據,相對于算法參數設定的主觀性,數據本身是客觀存在的。
云計算、物聯網、4G網絡等新技術的發展為大數據輿情分析模型的建立提供了有益幫助。基于云計算的輿情分析,能同時分析更多數據,揭露更多隱藏價值,使預測更準確,決策更合理。
法律是大數據輿情產業健康發展的保障
大數據必將給全社會的工作、生活、學習帶來巨大變化,政府管理部門應未雨綢繆、提早應對,加強法律法規建設,構建完善的監督管理體系,指導規范大數據產業健康發展。現階段可以統籌推進鼓勵發展、明確使用、保障安全三個層面的法律法規建設工作。
鼓勵發展。政府應高度重視大數據產業化工作,加強頂層設計,制定國家層面的大數據戰略規劃,出臺鼓勵政策,加強基礎平臺建設,構建國家數據中心,強化技術和人才支撐。明確各方定位,引導政府決策數據化,推動政務信息公開向政務數據公開的轉變,鼓勵社會、企業等數據持有者公開數據,確保數據的流動性和可獲取性。
明確使用。大數據時代,隨著數據被不停的收集分析,社會運行更加透明。就大數據輿情而言,包含了太多的個人興趣愛好、行為特征等隱私數據和對社會熱點事件發展趨勢的預測等敏感信息。這就需要我們對大數據輿情的用途、使用方式、使用范圍、使用部門等做出明確的法律規定。
保障安全。安全是互聯網發展的最大挑戰。大數據時代,數據作為最大財富,政府應強化數據安全保護,制定出臺適合國情的大數據法律體系,建立數據保密與風險管理機制,明確在數據收集、存儲、傳遞、使用、買賣階段的操作規范,加大對破壞數據服務器、存儲設備等的處罰力度。健全完善個人隱私保護法規,嚴厲打擊非法買賣個人信息等數據犯罪行為。