摘要 : 從長遠來看,政府開放大數據是必然趨勢,取之于民用之于民。不過全面開放、完善開放規(guī)則還需要一個過程。在當前的個例式開放模式中,政府部門似乎更傾向于“大公司優(yōu)先”。我想這只是暫時的,未來更多中小企業(yè)、以及政府所鼓勵的創(chuàng)業(yè)者,都會享受到“大數據紅利”,現(xiàn)在還需要多一點耐心。
大數據終于不再是紙上談兵,而是進入到實際應用階段,標志性事件是兩會上,李克強總理明確表態(tài),政府應該盡量的公開非涉密的數據,以便利用這些數據更好的服務社會,也為政府決策和監(jiān)管服務。這是中國政府首次正式公開表態(tài)支持大數據。在此之前中國各級政府一些部門已在大數據開放上有所嘗試,從實際情況來看,還存在開放規(guī)則不明朗的問題,不過一個大方向確實:大公司優(yōu)先。
1、政府部門大數據成為企業(yè)眼里的“香餑餑”。
大數據是金礦,企業(yè)和政府都已經意識到其中的價值,在大數據上有野心的企業(yè)都期望獲得更多有價值的數據,可能是來自其用戶,可能是來自合作伙伴,還有一個重要來源是政府等組織機構的公開數據。
不同來源不同性質的數據關聯(lián)在一起交叉挖掘分析,會發(fā)生“化學反應”得到更多價值。阿里巴巴拿到微博數據可以挖掘做好精準營銷、拿到交通部門數據可以與菜鳥網絡結合、拿到金融監(jiān)管部門數據便可與用戶交易和理財記錄結合做個人征信;百度拿到交通部門數據可以與百度地圖結合、拿到博彩指數公司數據結合網絡數據做世界杯預測……
2015年開始中國政府對互聯(lián)網、高科技和大數據產業(yè)的空前重視,并且明確表態(tài)要開放大數據,因此勢必會有更多的政府數據開放給民間。這些大數據成為相關企業(yè)眼里的“香餑餑”。這些數據如何開放、開放給誰、如何使用,卻還不明朗。
2、政府大數據使用權尚不明朗,需邊走邊看
阿里、百度這兩家中國最積極的大數據玩家,過去便與一些政府部門接入了大數據。
2013年2月25日,國家食品藥品監(jiān)督管理局與百度在北京聯(lián)合舉行“安全用藥,搜索護航”戰(zhàn)略合作簽約儀式。國家藥監(jiān)局的三大藥品數據庫,總計20余萬個權威藥品信息全面入駐百度。
2014年5月27日,中國氣象局公共氣象服務中心與阿里云達成戰(zhàn)略合作,共同搭建“中國氣象專業(yè)服務云”,面向有氣象數據需求的企業(yè)提供專業(yè)化的云計算服務。
2014年7月23日,百度推出名為“北京健康云”的智能醫(yī)療平臺產品,這是北京市政府支持推動下的一個民生醫(yī)療項目。
2014年10月15日,“云上貴州”系統(tǒng)平臺正式開通運行,這是貴州省政府與阿里牽頭的企業(yè)合建的云計算基礎設施,應用在交通等領域。
2015年1月13日,阿里健康宣布將藥品監(jiān)管網的基礎設施從甲骨文數據庫遷移到阿里云平臺,阿里將利用大數據技術幫助解決假藥問題。
政府在大數據上已經動了起來,百度和阿里成為第一批吃螃蟹者。問題是,這些數據不只是它們想要,阿里和百度之間有競爭關系不說,還有不少相關企業(yè)都有拿到這些數據的訴求。比如藥監(jiān)局的藥品數據庫,百度和阿里先后拿到之后,便有醫(yī)學藥學生命科學專業(yè)網站“丁香園”站出來表示,這些數據應該以公平的方式開放給更多企業(yè),以達到數據安全,市場公平和效率最高的目的。顯然在紛紛認識到大數據的重要性之后,圍繞大數據的爭搶已經展開。
美國政府在大數據開放上有著先進的經驗,《大數據》這一大數據啟蒙教材的主要案例便是圍繞美國政府大數據的開放案例,這本書曾被副總理汪洋公開推薦給官員。“用納稅人的錢收集的數據應該免費提供給納稅人使用”書中提及的一個觀點。不過,道理簡單,操作卻并不可一蹴而就:哪些數據是可以開放的(李克強總理提到非涉密數據,不知道是否已有明確界定規(guī)則)?開放的程度是怎樣的?開放的方式如何:是面向特定企業(yè)開放還是建設系統(tǒng)納入統(tǒng)一數據開放平臺之中?是有償開放給企業(yè)還是免費開放給所有企業(yè)?是直接開放原生數據還是開放基于數據挖掘的某些統(tǒng)計結果?顯然,這些問題都沒有統(tǒng)一答案,需要邊走邊看。
3、規(guī)則界定之前,政府開放大數據更傾向于“大公司優(yōu)先”。
政府開放大數據當前的案例主要是面向阿里、百度這樣的互聯(lián)網巨頭。在一些中小創(chuàng)業(yè)型公司看來,這難免會有些“不公平”。不過仔細想想,大公司優(yōu)先或許是必經之路。
首先,大公司具有更強的技術能力和資源。阿里巴巴給外界的印象是電商,其實它同時也是技術大牛,阿里云是最大的公有云平臺,并且其面向大數據推出了ODPS(開放大數據處理服務)。同樣,百度是技術驅動的互聯(lián)網巨頭,率先提供了大數據開放引擎,建立了大數據實驗室。在這兩家公司大數據已經是公司戰(zhàn)略。它們有技術,肯投入資源利用大數據。如果說只能逐步開放大數據給不同企業(yè),分批選擇企業(yè)有限選擇技術更強、資源更多的大公司合情合理。
其次,大公司在大數據隱私保護上更可靠。由于政府大數據不少涉及到國計民生,不少關乎公民隱私,比如健康數據、出行數據、信用數據等等。因此政府在開放大數據服務于民的同事,必須嚴格把關數據的使用者以及使用方式,避免出現(xiàn)公民隱私被侵犯的情況。如果不涉及公民隱私的數據直接開放自然沒問題,但涉隱數據,自然要選擇可靠的使用者。從概率上來看,聲譽好的大公司出現(xiàn)問題的概率最小。這與普通用戶選擇個人云存儲、個人郵箱、網絡支付工具等涉及隱私服務,會優(yōu)先考慮大公司,是一個道理。
再次,面向中小企業(yè)的數據開放必須通過系統(tǒng)。就算政府一些數據可以公開給任何符合條件的企業(yè)使用,也不大可能是“點對點”的方式,即不是簽協(xié)議戰(zhàn)略合作這類方式,而是基于開放式的數據開放平臺,可能是公共API,也可能是美國政府的“DATA.GOV”這樣的形式,只有這樣才能一次開放多家使用。談判、合作、協(xié)商、協(xié)議,這些都只適合針對個別企業(yè)的合作。因此眼下這樣的可以整合不同政府部門相關數據的開放平臺建設,已迫在眉睫。不過在建好之前,只能是大企業(yè)優(yōu)先,與大企業(yè)的合作只會為后續(xù)的進一步開放提供寶貴的實踐經驗。
最后,大企業(yè)并非無償使用數據還要貢獻價值。還有一個重要的原因是,BAT等大企業(yè)本身便擁有海量大數據。這些數據來自中國網民的網購理財、來自用戶社交搜索等等。2014年9月19日,國家統(tǒng)計局首次對外展示了其正在研究的基于百度搜索數據來預測房地產價格的新工具,以及新研發(fā)的網購數據統(tǒng)計,而其數據來源之一則是阿里巴巴。騰訊也在統(tǒng)計局的潛在數據源提供方名單之中。就是說,政府一方面要開放自己的大數據,另一方面也需要從大公司拿到特定數據。除了數據貢獻之外,還有技術服務。政府不擅長技術,BAT們卻擅長,幫助政府部門建基礎設施、建開放平臺、開發(fā)數據挖掘工具,在這一塊的合作案例已經夠多了。
從長遠來看,政府開放大數據是必然趨勢,取之于民用之于民。不過全面開放、完善開放規(guī)則還需要一個過程。在當前的個例式開放模式中,政府部門似乎更傾向于“大公司優(yōu)先”。我想這只是暫時的,未來更多中小企業(yè)、以及政府所鼓勵的創(chuàng)業(yè)者,都會享受到“大數據紅利”,現(xiàn)在還需要多一點耐心。