北京、上海、三亞、廈門、浙江、云南……
“五一”前夕,百度、攜程和遨游網依托各自的大數據,紛紛發布國內旅游熱點預測。這些預測信息不僅成為一些游客安排出游行程的參考,也成為熱門城市、熱門景點加強旅游管理的重要依據。
“過去是百度一家,今年是三家,越來越多的企業進入到旅游預測領域。管中窺豹,可見一斑。目前我國越來越多的互聯網企業已經開始同政府機構在各個領域開展合作,為政府管理提供大數據支持。”業內人士告訴科技日報記者,通常來講,企業通過提供大數據支撐技術、大數據資源管理和大數據增值服務三種方式來獲得價值。但是,目前我國大數據參與政府治理仍停留在統計分析層面上,建模和可視化應用較為匱乏,沒有成型的合作模式。“大數據要深度參與政府治理,難!”
“死”數據難以發揮它的價值
“從整個決策過程來看,大數據能夠幫助人類實時、大批量處理動態監測、醫療診斷、法律文書處理等專業任務;大數據分析模型能夠對決策的結果進行仿真和效果呈現,幫助決策部門對整體方案和細節進行有針對性的優化;大數據還能根據實際需求和公眾體驗提供相應的決策信息反饋機制、決策調控糾偏機制。”中國電子信息產業發展研究院軟件與信息服務業研究所博士周大銘指出,大數據能夠全程參與決策,是科學決策的依據。但是,數據的數量、質量、種類和數據的分析能力直接影響決策的水平。“我們現在面臨的問題是,數據不準,數據不全,數據共享很有限。”
“社會上的各種部門、機構都沉淀著大量的數據。但是,這些數據都是‘死’數據,沒有真正發揮出它的價值。”億贊普科技(集團)公司IPM高級總監陳春瑩說。
從2013年開始,億贊普連續三年為兩會提供大數據服務,并在兩會期間針對民生關注的熱點問題,如油價、房價、上學情況等開展了民意洞察。陳春瑩認為,政府治理有兩個層面,民意洞察和決策執行。在民意洞察層面,并不缺少大數據支撐。在政府決策執行層面,大數據遭遇“部門墻”。
他說:“目前,由于涉及信息安全等問題,一些部門的數據無法對外開放,也就無法采集分析。即便是開放的數據,各省市和各部門也相對獨立,形成了‘數據孤島’,無法互聯互通。同時由于國內暫時沒有針對大數據制定相關標準,整合數據也就無從談起。”
“2012年2月,紐約頒布了《開放數據法案》,通過立法的形式對開放數據的原則、路徑、形式、公開周期等均進行了統一規定。當前,紐約數據開放平臺共有近4000個數據集,數據涉及面非常廣。”周大銘坦言,我國缺少相關法律的保障,要打破政府部門間的數據壁壘非常困難。
從數據、建模,到迭代、優化,需要大量的數據做支撐。模型越復雜,運算的維度越多,需要的數據量就越大。缺少數據支撐的模型迭代速度非常慢,模型優化也就更加不易。
大數據模型不可能一招定乾坤
有人提出,在政府大數據應用中我國具有后發優勢,可以充分借鑒先行國家的經驗,推動政府大數據應用的快速推廣。事實上,這個后發優勢的含金量并不那么高。
2014年10月10日,國家發展改革委聯合相關部門共同展開“信息化(大數據)提升政府治理能力”研究。課題組搜集了美國紐約大數據應用的各種案例,但是所獲信息并沒有預想的那么多。
“我們只能看到,他們應用了大數據,得到了什么結果。至于怎么分析的,怎么操作,用的什么模型,中間過程是什么,我們從案例中根本找不到這些信息。”課題組成員周大銘對記者說,“我們還是要靠大數據建自己的模型。”
中國電子信息產業發展研究院軟件與信息服務業研究所博士陳光,同為課題組成員,他告訴記者,大數據參與政府治理的原理是一致的,但是具體的參與方式是領域驅動或問題驅動的。也就是說,針對這個領域、這個問題的分析方法及其建立的模型,并不一定適用于另一個領域,或者另一個問題。“大數據模型不可能一招定乾坤。”
影響大數據模型的不只是應用領域和應用問題,相關因素的環境變化也會對模型產生重大作用。“谷歌流感趨勢”就是一個非常具有代表性的例子。
“谷歌流感趨勢”是谷歌公司多年前推出的一款預測流感的產品,它通過匯總用戶的相關搜索記錄,預測出世界上不同國家和地區的流感傳播情況。2009年,甲型H1N1流感暴發的幾周前,“谷歌流感趨勢”成功預測了流感在美國境內的傳播,其分析結果甚至具體到特定的地區和州,非常及時,令美國的公共衛生官員倍感震驚。但在近兩年,“谷歌流感趨勢”卻屢屢出錯。
“人們的搜索習慣發生了變化。過去搜流感信息是為了治病,現在搜流感信息的人并不一定是患者。這就導致‘谷歌流感趨勢’模型出現了偏差。”周大銘強調,大數據在商業領域的應用,比如精準營銷、廣告推送,準確度從60%提高到70%,這10個百分點就能給企業帶來巨大的效益。但是,政府治理對大數據的要求就高得多,預測準確度1%的差別都會對決策產生重要的影響。
大數據將強烈沖擊當前的決策體系
業內人士提醒記者注意,大數據的定位是輔助決策,最終的決策還是由人來做。即便是這樣,基于大數據的決策體系也會對當前的決策體系產生強烈沖擊。
在陳春瑩看來,這種沖擊主要表現在兩個方面:其一,政府的角色發生了重大變化,由管理者變為了服務者。其二,政府治理的方式,從碎片化走向系統化。
他以億贊普的跨境貿易為例,進一步解釋說,把中國優質產品賣到海外,要比國內的商品貿易復雜得多。它涉及很多問題,包括怎么評價企業,怎么搭建平臺,怎么跨境支付,怎么解決商品的運輸問題,商品到了國外怎么落地,等等。“我們把所有相關功能和流程全部理清,然后一個一個解決卡脖子的問題。為了解決跨境支付問題,億贊普收購了錢寶。中國貨品運到歐洲、中東、北非,沒有直飛航班,億贊普收購了意大利帕爾馬國際機場。我們是基于大數據服務客戶,用大數據來管理業務,是一種倒逼式創新。”陳春瑩說。
大數據參與政府治理的整個決策體系,當然比企業的商業活動組織更為復雜,但這并不意味著此事不可做。業界人士反復強調,決定大數據能否深度參與政府治理的核心,是管理者的意識,而不是其他。
陳春瑩介紹說,我國某些城市已經在探索建立市民卡管理系統,它融合了社保、身份證、醫保、金融、公交卡等功能。億贊普參與了這些城市市民卡項目的頂層設計。“市民卡比較適合在執行力特別強的城市來推行,未來也希望這種城市管理方式能夠推廣到全國。”
“企業利用大數據的方式是非常多樣化的,相關管理者要多吸取他們的經驗,在一些重點應用領域先行先試,比如政務、教育、醫療、旅游、交通等領域。”陳光指出,基于大數據的政府治理挑戰傳統的管理思維,涉及部門利益關系,非壯士斷腕不可為。
●案例解析
紐約怎么利用大數據強化城市管理
紐約是美國第一大城市,有來自近百個國家和地區的移民,給政府管理帶來很大的困難。紐約市政府利用大數據在民生服務、市政府管理、能力提升等方面進行了積極地探索。
消除火災隱患并治理群租房:為加強對群租房的治理,消除火災隱患,紐約的數據分析團隊匯總整理了該市19個機構的數據和90萬棟建筑的信息。該團隊將這些數據與近5年的火災數據對比,得出一個預測模型,以估計不同建筑中的群租情況和火災隱患的嚴重程度。篩選出的危險建筑中,有70%存在嚴重的火災隱患,對群租房的檢查效率提高了4倍。
地溝油檢查:為確保地溝油的排放運送符合紐約企業誠信委員會的要求,紐約數據分析團隊通過調取紐約企業誠信委員會登記的企業許可證數據,將未獲得地溝油運送資格的餐廳統計出來,然后與其排污管道堵塞的地理數據圖進行對比,能夠迅速定位非法排放地溝油的餐廳,成功率高達95%。
治理冒名非法經營:針對非法經營者被吊銷營業執照后冒用他人名義繼續經營的問題,紐約市政府利用歷史監測數據對店主變更前后的營業情況進行對比,包括收入、稅收、被投訴次數等。如發現店主變更后營業數據無顯著變化,則很可能存在冒名非法經營問題,基于這種預測開展的針對性檢查,成功率提高了4倍。