2015年8月19日,國務院總理李克強主持召開國務院常務會議,通過《關于促進大數據發展的行動綱要》(以下簡稱《行動綱要》)。9月5日,《國務院關于印發促進大數據發展行動綱要的通知》(國發〔2015〕50 號)正式發布,在全社會引起廣泛影響。《行動綱要》由國家發展改革委牽頭,會同工業和信息化部,自2014年初開展前期研究,歷經深入的專題研究,并廣泛征求了相關部門、專家學者的意見和建議,歷時一年多時間編制完成。《行動綱要》是到目前為止我國促進大數據發展的第一份權威性、系統性文件,從國家大數據發展戰略全局的高度,提出了我國大數據發展的頂層設計,是指導我國未來大數據發展的綱領性文件。
下面從本人作為研究起草工作小組主要成員的角度,就《行動綱要》的個人基本認識和理解作一下解讀。
一、從國家信息化發展的戰略全局把握大數據的概念與范疇
新一輪信息技術革命與人類經濟社會活動的交匯融合,引發了數據爆炸式增長,大數據的概念應運而生。然而到目前為止,全社會對“大數據”的認識并沒有達成一致公認的程度。例如,維基百科提出“大數據”是指無法在一定時間內用常規軟件工具對其內容進行抓取、管理和處理的數據集合。這種定義對于實際應用而言幾乎沒有意義,除了少數的互聯網巨頭和IT巨無霸企業誰也沒有這種規模的數據。企業界通常是將自己可利用到的海量數據視為大數據。政府部門認為自身數據很多,將部門數據都整合起來會有幾十倍的增長,堪稱大數據了,所以他們心目中的“大數據”就是整合后的政府數據資源。一種在學術界廣為人知的“4V”表述是:“大數據”是以體量巨大(Volume)、類型繁多(Variety)、存取速度快(Velocity)、價值密度低(Value)為基本特征的數據集。在這種界定下,大數據應用的本質是類似沙里淘金、大海撈魚、廢品利用的過程,大數據并不直接意味大價值,實際上是指經過分析發掘后可以釋放潛在的價值。在這種“4V”界定下,傳統意義上政府掌握的數據資源看起來不應歸為“大數據”,因為它不符合“價值密度低”的界定,而且在數據類型上仍然以結構化數據為主,并且往往是常規數據處理技術就能夠勝任的。
人們對大數據概念理解的不一致和認識上的分歧實際上反映了現有的大數據概念與現實需求的脫節,特別是與政府需求的脫節。筆者認為,從推進國家信息化發展的角度看,對大數據進行嚴格定義或許并不重要,能夠利用大數據提升全民數據意識、發展數據文化、釋放數據紅利、打造數據優勢才是硬道理。大數據熱強化了社會的數據意識,這對于中國才是至關重要的。長期以來中國社會文化一直缺乏精確的數據意識,中國人的傳統習慣是定性思維而不是定量思維,正如胡適先生所說的是“差不多”文化,這種文化阻礙了科技在中國的發展,沒有精確就沒有現代科技。數據文化的本質就是尊重客觀世界的實事求是精神,數據就是定量化的、表征精確的事實,重視數據就是強調用事實說話,按理性思維的科學精神,因此提升全社會的數據意識和數據精神是大數據熱的巨大貢獻。
科學認識大數據的概念和范疇,對于準確理解和深刻把握《行動綱要》的主要內容和精神實質是非常重要的。我認為,應該從國家信息化發展的戰略全局把握大數據的概念、本質與邊界范疇。信息化的核心是數據,只有政府和公眾都關注數據時,才能真正理解信息化的實質。數據是與物質、能源同等重要的基礎性戰略資源,數據的采集和分析涉及每一個行業,是帶有全局性和戰略性的工作。因此,從國家信息化發展的全局來看,我認為可以把“大數據”廣義地界定為:我國現代信息化進程中產生的和可被利用的海量數據集合,是當代信息社會的數據資源總和,是信息時代的全數據,既包括互聯網數據,也包括政府數據和行業數據。實際上,在《行動綱要》中,大數據就是采用了這種廣義的界定方法。因此,大數據既是一類呈現數據容量大、增長速度快、數據類別多、價值密度低等特征的數據集;也是一項能夠對數量巨大、來源分散、格式多樣的數據進行采集、存儲和關聯性分析的新一代信息系統架構和技術;更代表了一種新的思維方式——大數據思維,是能夠幫助人們從信息社會海量數據中發現新知識、創造新價值、提升新能力、形成新業態的強大的認知世界和改造世界的能力。
二、大數據是我國信息化發展步入深水區后的核心主題和戰略抉擇
近年來,我國經濟社會信息化建設快速推進,信息化水平不斷提高。但隨著經濟社會發展進程的不斷深化,我國日益面臨諸如食品藥品安全、公共安全與應急管理、社會信用體系、生態環境保護、民生公共服務等復雜、多維、并發的經濟社會難題。過去以“金字”工程為代表的縱向煙囪式信息系統和以地方、部門信息化為代表的橫向孤島式信息系統,已經無法有效支撐經濟社會發展難題的解決,“只管自家門前雪”的信息化管理模式已經嚴重不適應現代社會的治理需求,往往“按下葫蘆浮起瓢”,信息化對經濟社會發展的支撐和引領作為無法充分發揮,迫切需要打破部門割據和行業壁壘,促進互聯互通、數據開放、信息共享和業務協同,切實以數據流引領技術流、物質流、資金流、人才流,強化統籌銜接和條塊結合,實現跨部門、跨區域、跨層級、跨系統的數據交換與共享,構建全流程、全覆蓋、全模式、全響應的信息化管理與服務體系。
我國信息化發展已步入深水區。可以說,容易的、皆大歡喜的條塊和局部的信息化系統已經完成了,正如習近平總書記所說“好吃的肉都吃掉了,剩下的都是難啃的硬骨頭”。《行動綱要》的根本出發點和核心主題就是推動解決信息化進入深水區后的硬骨頭、老大難問題,主要包括:第一,為解決經濟社會難題亟需交換、融合、共享的各類數據和信息,在社會中依據類別、行業、部門、地域被孤立和隔離;第二,同一時空對象所屬的各類數據和信息之間天然的關聯性和耦合性被割裂和遺忘;第三,政府數據開放和政務信息共享程度受限,信息資源開發利用水平不高,其根源既有大數據處理方面的技術障礙,也有公共權力部門化、部門權力利益化,部門利益合法化帶來的體制弊端;第四,數據和信息服務的便捷化、高效化、產業化、智能化水平不高。《行動綱要》的發布,彰顯了我國信息化發展的核心已從前期分散化的網絡和應用系統建設,回歸和聚焦到充分發揮數據資源的核心價值,從而提升國家信息化發展的質量和水平。因此,大數據已成為國家信息化深化發展的核心主題,發展大數據已成為構建數據強國、推動大數據治國的必然選擇。
三、《行動綱要》的核心是推動數據資源共享開放
《行動綱要》從內容架構上總體上呈現了“一體兩翼一尾”的格局。“一體”即以“加快建設數據強國,釋放數據紅利、制度紅利和創新紅利”為宗旨,“兩翼”是指以“加快政府數據開放共享,推動資源整合,提升治理能力”和“推動產業創新發展,培育新興業態,助力經濟轉型”兩方面內容為載體和依托,“一尾”是指以“強化安全保障、提高管理水平,促進健康發展”為保障和平衡。
綜觀《行動綱要》的內容架構,其核心是推動各部門、各地區、各行業、各領域的數據資源共享開放。在《行動綱要》正文中,“共享”共出現59次,“開放”共出現36處,充分顯示了數據共享開放對國家大數據發展的極端重要性。事實上,共享開放的大數據不僅是深化信息化發展的關鍵要素,也將成為激發大眾創業、萬眾創新的重要源泉,為開創新應用、催生新業態、打造新模式提供新動力,有利于提升創新創業活力,改造升級傳統產業,培育經濟發展新引擎和國際競爭新優勢。
但是,從我國信息化發展的現實情況看,“不愿共享開放”、“不敢共享開放”、“不會共享開放”的情況依然較為普遍。特別是我國各級政府、公共機構匯聚了存量大、質量好、增長速度快、與社會公眾關系密切的海量數據資源,除了部分自用和信息公開外,大部分沒有充分發揮數據資源作為“生產要素、無形資產和社會財富”的應有作用。具體表現在:
第一,不愿共享開放。這一方面是認識的問題,一些政府部門和公共機構尚未意識到數據共享開放的價值,另一方面也是利益分配的問題,有些政府部門和公共機構把自己掌握和獲取的數據,作為自己利益和權力的一部分,甚至看成是私有財產不愿共享開放,造成不同部門之間甚至同一部門不同機構之間都難以實現數據共享開放。另外,我國在數據共享開放方面的法律法規、制度標準建設相對落后,沒有形成數據共享開放的剛性約束,數據共享開放缺乏考核管理體系,數據共享開放價值不明確、市場不健全、動力不充足。
第二,不敢共享開放。主要是由于我國當前尚缺乏嚴格規范數據共享開放的法規制度,相關人員擔心政務數據共享開放會引起信息安全問題,擔心數據泄密和失控,對數據共享開放具有恐懼感,不敢把自己掌握的數據資源向他人共享開放。在我國,對于保密文件以外的政府數據是否應該共享開放一直沒有統一的規定,造成了定保密范圍過大。我國《保密法》中對定密、解密程序、泄密處罰以及救濟機制等重要制度設置已落后于實際發展的需要,導致政府部門對共享開放數據過度謹慎。
第三,不會共享開放。政府數據共享開放是一個高度專業化的工作,需要分級分類、收放結合、科學把握。政府數據該共享開放而不共享開放會引發數據隔離與封閉、價值損耗、信息孤島等一系列問題;相反,不該共享開放而共享開放、或者不該大范圍共享開放而大范圍共享開放也可能帶來更大的損失,甚至危及國家安全。目前我國尚未出臺法律對數據共享開放原則、數據格式、質量標準、可用性、互操作性等做出規范要求,導致政府部門和公共機構數據共享開放能力不強、水平不高、質量不佳,嚴重制約了大數據作為基礎性戰略資源的開發應用和價值釋放。
四、《行動綱要》體現了國家層面對大數據發展的頂層設計和統籌布局
《行動綱要》作為我國推進大數據發展的戰略性、指導性文件,充分體現了國家層面對大數據發展的頂層設計和統籌布局,為我國大數據應用、產業和技術的發展提供了行動指南。
《行動綱要》對支撐大數據發展的國家級統一平臺進行了總體規劃布局。提出建設“國家政府數據統一開放平臺”,構建跨部門的“政府數據統一共享交換平臺”,“在地市級以上(含地市級)政府集中構建統一的互聯網政務數據服務平臺和信息惠民服務平臺”,“中央層面構建形成統一的互聯網政務數據服務平臺”,建立“全國統一的信用信息共享交換平臺”,“形成全國統一的中小微企業公共服務大數據平臺”,建設“國家網絡安全信息匯聚共享和關聯分析平臺”,建立“國家知識服務平臺與知識資源服務中心”。
《行動綱要》體現了對大數據發展的系統化、體系化建設思路。《行動綱要》正文共出現“體系”54處,包括構建“國家基礎信息資源體系”、“國家宏觀調控數據體系”、“國家知識服務體系”,以及建立“大數據應用體系”、“大數據技術體系”、“大數據產業體系”、“大數據產品體系”、“聯網信息保存和信息服務體系”、“大數據監督和技術反腐體系”、“綜合信息服務體系”、“資源要素數據監測體系”、“大數據產業公共服務支撐體系”、“大數據產業生態體系”、“大數據安全保障體系”、“大數據安全評估體系”、“大數據安全支撐體系”、“大數據產業標準體系”、“數據標準和統計標準體系”、“大數據市場交易標準體系”、“數據科學的學科體系”、“大數據人才培養體系”,等等。
上述統籌布局明確了國家層面大數據相關平臺、中心和重要系統的建設任務,厘清了不同層面平臺的銜接配合關系,提出了系統化建設的重要考慮,將有力推動政府信息系統和公共數據互聯共享,加快整合各類政府信息平臺,消除信息孤島,避免重復建設和數據“打架”,增強政府公信力,促進社會信用體系建設,對于促進國家大數據平臺和重要系統的統籌規劃、合理布局,避免一哄而上、重復建設具有重要而深遠的現實意義。
五、《行動綱要》明確提出了我國大數據發展的目標體系
《行動綱要》立足我國國情和現實需要,提出了未來5—10年推動大數據發展和應用的目標,主要包括五個方面:第一,打造精準治理、多方協作的社會治理新模式;第二,建立運行平穩、安全高效的經濟運行新機制;第三,構建以人為本、惠及全民的民生服務新體系;第四,開啟大眾創業、萬眾創新的創新驅動新格局;第五,培育高端智能、新興繁榮的產業發展新生態。
《行動綱要》不僅提出了我國大數據發展的宏觀定性目標,還明確提出了階段性、可考核的具體發展目標。按照年度劃分,主要發展目標梳理如下:
(一)到2017年底前
明確各部門數據共享的范圍邊界和使用方式,跨部門數據資源共享共用格局基本形成。
(二)到2018年底前
1、建成國家政府數據統一開放平臺,率先在信用、交通、醫療、衛生、就業、社保、地理、文化、教育、科技、資源、農業、環境、安監、金融、質量、統計、氣象、海洋、企業登記監管等重要領域實現公共數據資源合理適度向社會開放。
2、中央政府層面實現數據統一共享交換平臺的全覆蓋,實現金稅、金關、金財、金審、金盾、金宏、金保、金土、金農、金水、金質等信息系統通過統一平臺進行數據共享和交換。
3、中央層面構建形成統一的互聯網政務數據服務平臺;國家信息惠民試點城市實現基礎信息集中采集、多方利用,實現公共服務和社會信息服務的全人群覆蓋、全天候受理和“一站式”辦理。
4、跨部門共享校核的國家人口基礎信息庫、法人單位信息資源庫、自然資源和空間地理基礎信息庫等國家基礎信息資源體系基本建成,實現與各領域信息資源的匯聚整合和關聯應用。
5、開展政府和社會合作開發利用大數據試點,完善金融、稅收、審計、統計、農業、規劃、消費、投資、進出口、城鄉建設、勞動就業、收入分配、電力及產業運行、質量安全、節能減排等領域國民經濟相關數據的采集和利用機制,推進各級政府按照統一體系開展數據采集和綜合利用,加強對宏觀調控決策的支撐。
6、圍繞實施區域協調發展、新型城鎮化等重大戰略和主體功能區規劃,在企業監管、質量安全、質量誠信、節能降耗、環境保護、食品安全、安全生產、信用體系建設、旅游服務等領域探索開展一批應用試點,打通政府部門、企事業單位之間的數據壁壘,實現合作開發和綜合利用。
(三)到2020年底前
1、逐步實現信用、交通、醫療、衛生、就業、社保、地理、文化、教育、科技、資源、農業、環境、安監、金融、質量、統計、氣象、海洋、企業登記監管等民生保障服務相關領域的政府數據集向社會開放。
2、形成一批具有國際競爭力的大數據處理、分析、可視化軟件和硬件支撐平臺等產品。
3、培育10家國際領先的大數據核心龍頭企業,500家大數據應用、服務和產品制造企業。
4、在涉及國家安全穩定的領域采用安全可靠的產品和服務,實現關鍵部門的關鍵設備安全可靠。
上述目標體系的設定,清晰地體現了國家發展大數據的愿景設計,但從實現的角度,其挑戰性也是很大的,不僅需要大量的技術創新,而且更需要大量的法規、制度、管理、運行等體制機制方面的改革和創新。《行動綱要》對大數據發展目標的設計,充分體現了國家推動數據共享開放、提升國家數據能力和數據優勢的堅強決心,也吹響了打造數據強國的沖鋒號角。
六、《行動綱要》強調了大數據發展與相關政策的銜接配合
近期,國家相繼出臺了物聯網、云計算、寬帶中國、智慧城市、信息消費、信息惠民、互聯網+、中國制造2025,以及大眾創業、萬眾創新等一系列信息化政策文件。從本質上講,這些政策與《促進大數據發展行動綱要》都屬于“中國信息化”這一同一事物的不同側面,即通過新一代信息技術創新應用,切實促進國民經濟和社會事業發展。因此,加強對上述政策文件的整體性解讀和關聯性分析,避免政策碎片化、孤立化和割裂化,是至關重要的。
《行動綱要》很好地體現了大數據發展戰略部署與其他信息化相關政策的銜接和融合。《行動綱要》明確提出“推動大數據與云計算、物聯網、移動互聯網等新一代信息技術融合發展,探索大數據與傳統產業協同發展的新業態、新模式,促進傳統產業轉型升級和新興產業發展,培育新的經濟增長點。”“抓住互聯網跨界融合機遇,促進大數據、物聯網、云計算和三維(3D)打印技術、個性化定制等在制造業全產業鏈集成運用,推動制造模式變革和工業轉型升級。”“推動大數據與移動互聯網、物聯網、云計算的深度融合,深化大數據在各行業的創新應用,積極探索創新協作共贏的應用模式和商業模式。”
七、健全《行動綱要》的政策保障機制乃當務之急
《行動綱要》設定的主要任務和發展目標,體現了大數據浪潮下我國在大數據應用和技術領域引領全球的戰略機遇,但客觀上也面臨著條塊分割、部門壁壘、利益束縛、信息安全等諸多現實挑戰,健全高效的政策保障機制是實施《行動綱要》的基本前提和重要基石。
《行動綱要》提出了組織實施機制、法規制度建設、市場發展機制、標準規范體系、財政金融支持、專業人才培養、國際交流合作等七方面的保障措施,這其中許多方面的內容都切實關乎《行動綱要》的落實程度,特別是很多方面的保障要求,尚需要有關部門深入細致研究,拿出切實可行的操作規范,避免政策措施“看起來很美”,但懸在半空中。例如,《行動綱要》中提出的有待“明確”的事項有:“加強頂層設計和統籌規劃,明確各部門數據共享的范圍邊界和使用方式,厘清各部門數據管理及共享的義務和權利。”“明確數據采集、傳輸、存儲、使用、開放等各環節保障網絡安全的范圍邊界、責任主體和具體要求,切實加強對涉及國家利益、公共安全、商業秘密、個人隱私、軍工科研生產等信息的保護。”“促進政府數據在風險可控原則下最大程度開放,明確政府統籌利用市場主體大數據的權限及范圍。”“研究推動網上個人信息保護立法工作,界定個人信息采集應用的范圍和方式,明確相關主體的權利、責任和義務,加強對數據濫用、侵犯個人隱私等行為的管理和懲戒。”
可見,上述待“明確”事宜都是道理明顯正確,但操作和實現挑戰極大的“硬骨頭”工程,其真正落實涉及到要“明確”每一項工作的責任主體、分工機制、規范形式、實施機制、效果評價等,都是說起來容易,做起來絕非易事。只有以改革創新的勇氣攻堅克難,建立堅實的政策保障機制,破除制約大數據發展的瓶頸和障礙,才能真正開創“用數據說話、用數據決策、用數據管理、用數據創新”的新局面,才能真正釋放數據紅利、制度紅利和創新紅利,推進我國從數據大國走向數據強國。