“大數據將從一個時髦的概念走進我們生活中的方方面面。幫助我們更好地認識世界,認識自己,構建全新的社會關系。”清華大學數據科學研究院執行副院長韓亦舜說。
“《關于促進大數據發展的行動綱要》(以下簡稱《行動綱要》)標志著大數據在我國的發展與應用已經上升到國家戰略層面。”賽迪顧問分析師盧敏說,“《行動綱要》明確指出推動政府大數據開放、共享和安全的重要性。而要使《行動綱要》中的內容盡快成為促進大數據發展和推進大數據應用的實際行動,還有很多問題要解決。”
數據潛在利用價值高
《行動綱要》涉及三個關鍵詞:共享、開放、安全。盧敏指出,三個關鍵詞背后指向三個問題:“共享”指向為什么要加快政府大數據公開的進程,“開放”指向企業創新的動力源在哪里,“安全”指向如何保護個人隱私和信息安全。
“政府大數據公開的目的是改善民生,企業創新的目的是促進結構轉型,信息安全建設的目的是完善法律。三個關鍵詞分別指向社會、經濟、法律等不同領域。由此看來,大數據產業牽一發而動全身。”盧敏說。
共享、開放、安全的出發點和落腳點都指向政府大數據的開放共享、研究與應用、示范影響效應等。我們不禁要問,政府大數據的價值究竟何在?
就數量而言,BAT(百度、阿里、騰訊)擁有數以億計的用戶量,但這與政府大數據規模相比,可謂小巫見大巫。盧敏介紹說:“粗略估算,全國政府大數據加起來至少也有數百甚至上千個阿里巴巴的體量。”
至于政府大數據的質量,則可以通過和BAT企業對比來說明。據介紹,百度擁有龐大的用戶搜索記錄,每個網民都會留下眾多記錄,但這些數據較為單一,不進行關聯應用就無法顯示價值;騰訊的優勢在于擁有數以億計的QQ和微信用戶量以及更龐大的社交數據,但這些數據目前僅局限于營銷應用;阿里的交易數據似乎價值更高,但也只是局限在電商領域以及外延應用。“BAT的共同短板在于數據種類的單一化程度較高。”盧敏說。
政府大數據涉及工商、稅務、司法、交通、醫療、教育、通信等等領域,數據的種類繁多,關聯性強、統計規格較為統一,便于應用處理。九次方大數據創始人王叁壽曾表示“政府的數據事關百姓生活的方方面面,數據的利用價值也最高”。
開放標準待建立
真正的大數據除了量大,另一個特點是變化多,如圖片、視頻、大段文字這些不能用數字化處理的數據,屬于非結構化數據。只有非結構化的數據才更具有開發價值。
政府的很多數據,例如人口、戶籍等,屬于結構化數據,離非結構化的大數據概念還有一定距離。但就目前階段來看,政府推動大數據產業發展仍有現實意義。
通過與大數據緊密相連的互聯網,在市民服務設施眾包、提高政府監督職能等方面,百姓能夠參與進來。“政府信息的開放共享,有助于提高政府的公信力。”韓亦舜說。
政府數據的開放,不但能幫助政府提高自身透明度并提升治理能力和效率,也是促進經濟發展和社會創新的重要推力。然而,在政府數據資源共享開放工程當中,數據的開放程度與開放內容的標準,目前似乎并沒有定論。
復旦大學國際關系與公共事務學院副教授鄭磊在《中國開放政府數據平臺研究:框架、現狀與建議》一文中提出,經過樣本的數據采集分析,截至2015年5月,各地開放政府數據實踐共計公開了1963個數據集。其中公開數據最多的是武漢(635個),最少的則是貴州(17個)。
努力打造大數據產業新高地的貴州,在政府數據開放方面面臨著新的挑戰。
鄭磊指出,中國開放政府數據實踐存在的問題主要有目前開放的數據量少、價值低、可機讀比例低,開放的多為靜態數據,數據授權協議條款含糊,缺乏便捷的數據獲取渠道,缺乏高質量的數據應用,缺乏便捷、及時、有效、公開的互動交流等。
“《行動綱要》為信息開放共享指明了出路,但是政府大數據如何應用,還要看接下來的行動和規則制定。”盧敏說。
針對問題,鄭磊建議加強管理架構建設,制定相關政策與工作機會,提高領導支持能力,基于社會需求開放高價值數據、展現數據應用,提升數據開放性與可機讀比例,規范數據更新周期,落實數據更新工作,完善數據授權協議,降低數據獲取與互動門檻,推動有效公開的溝通。
數據利用如何破冰
目前,一些發達國家政府在數據開放方面走在了前面,甚至把數據開放當做執政自信的標志,公開一些政府日常消費方面的支出供市民監督。
我國政府數據利用方面特別是數據共享方面確實存在一些誤區。一方面說到開放就好像完全沒有隱私,另一方面安全問題又成為了數據開放的最大障礙。
韓亦舜認為,政府數據開放要在實踐中摸索前進。先把政府部門內部及部門之間數據共享的工作做起來。對社會的數據開放共享,先從方便百姓生活又不是很敏感的數據開始。特別是涉及公共安全、公共利益的數據,提供公共服務的機構或企業有義務在一定前提條件下開放,“這樣一些可以預警、預防的群體性事件就能夠避免”。
韓亦舜指出,按照流行的大數據的幾個“V”(大量、高速、多樣、價值)或者多源異構的定義來衡量,政府的部分數據,還屬于結構化數據,離大數據概念還有差異。但沒有必要拘泥于大數據的定義,只要政府充分運用數據的挖掘利用,提高政府治理能力,提高科學決策能力,受益的將是全社會。
在政府開放數據方面,韓亦舜建議,各級政府都以數據應用為導向,需要什么數據就共享什么數據。雖然,與大數據的開發共享還有距離,但確實是數據應用的可行路徑。
韓亦舜說,相信越多的人從數據開放中獲益,就會有更多的人愿意開放數據。
背景資料
《關于促進大數據發展的行動綱要》
主要內容及對產業的部署
《行動綱要》的內容可以概括為“三位一體”,即圍繞全面推動我國大數據發展和應用,加快建設數據強國這一總體目標,確定三大重點任務:一是加快政府數據開放共享,推動資源整合,提升治理能力;二是推動產業創新發展,培育新業態,助力經濟轉型;三是健全大數據安全保障體系,強化安全支撐,提高管理水平,促進健康發展。圍繞這“三位一體”,具體明確了五大目標、七項措施、十大工程。并且據此細化分解出76項具體任務,確定了每項任務的具體責任部門和進度安排,確保《行動綱要》的落地和實施。
五個目標:一是打造精準治理、多方協作的社會治理新模式;二是建立運行平穩、安全高效的經濟運行新機制;三是構建以人為本、惠及全民的民生服務新體系;四是開啟大眾創業、萬眾創新的創新驅動新格局;五是培育高端智能、新興繁榮的產業發展新生態。
七項措施:完善組織實施機制、加快法規制度建設、健全市場發展機制、建立標準規范體系、加大財政金融支持、加快專業人才培養、促進國際交流合作。
十項工程:政府數據資源共享開放工程、國家大數據資源統籌發展工程、政府治理大數據工程、公共服務大數據工程、工業和新興產業大數據工程、現代農業大數據工程、萬眾創新大數據工程、大數據關鍵技術及產品研發與產業化工程、大數據產業支撐能力提升工程、網絡和大數據安全保障工程。
按照國務院的部署,工業和信息化部主要負責推動大數據產業發展,培育新興業態,助力經濟轉型,包括推進大數據核心技術攻關、健全產品體系、完善產業鏈和發展環境、推進工業及新興產業大數據應用,同時做好信息安全和規范管理等的相關工作。重點組織實施十大工程中的“大數據關鍵技術及產品研發與產業化工程”“大數據產業支撐能力提升工程”“工業和新興產業大數據工程”三項工程。