京津冀協同發展是一項重大國家戰略,2015年的政府工作報告中再次重申這一戰略的重要性,而大數據則是“互聯網+”行動計劃的重要組成部分。京津冀三地地域相鄰,在大數據產業發展中各具特色。因此,在京津冀協同框架下,三地充分發揮自身優勢,建立差異互補、協同合作的大數據產業鏈。
一、引言
京津冀協同發展是一項重大國家戰略。習近平總書記曾指出實現京津冀協同發展,是面向未來打造新的首都經濟圈、推進區域發展體制機制創新的需要,是探索完善城市群布局和形態、為優化開發區域發展提供示范和樣板的需要,是探索生態文明建設有效路徑、促進人口經濟資源環境相協調的需要,是實現京津冀優勢互補、促進環渤海經濟區發展、帶動北方腹地發展的需要,要堅持優勢互補、互利共贏、扎實推進,加快走出一條科學持續的協同發展路子。
2015年的政府工作報告中也指出,要推進京津冀協同發展,在交通一體化、生態環保、產業升級轉移等方面率先取得實質性突破。
而大數據是信息產業的重大技術突破,具有非常廣闊的發展前景。1980年,著名未來學家阿爾文·托夫勒便在《第三次浪潮》一書中,將大數據熱情地贊頌為“第三次浪潮的華彩樂章”[1]。大約從2009年開始,“大數據”成為互聯網信息技術行業的流行詞匯。
無論是國外還是國內城市都對大數據市場寄予了巨大的希望。我國在2015年的政府工作報告中也指出,要制定“互聯網+”行動計劃,推動移動互聯網、云計算、大數據、物聯網等與現代制造業結合,促進電子商務、工業互聯網和互聯網金融健康發展,引導互聯網企業拓展國際市場。
京津冀在發展大數據產業方面都具備自身的優勢,但也存在一些局限,在京津冀協同發展的大框架下,就需要優勢互補,共同協作。
二、大數據產業的內涵及特點
大數據,或稱巨量數據、海量數據,是指由數量巨大、結構復雜、類型眾多的數據構成的數據集合,是基于云計算的數據處理與應用模式,通過數據的集成共享、交叉復用形成的智力資源和知識服務能力。
維克托·邁爾-舍恩伯格及肯尼斯·庫克耶編寫的《大數據時代》中,大數據指不用隨機分析法(抽樣調查)這樣的捷徑,而采用所有數據進行分析處理[2]。
大數據具有4V特點,即Volume(大量)、Velocity(高速)、Variety(多樣)、Value(價值)。這些特點恰恰體現了大數據對信息技術的超高要求。
Volume(大量)。大數據所包含的數據量巨大。美國互聯網數據中心曾指出,互聯網上的數據每年將增長50%,每兩年便將翻一番,而近90%的數據都是近幾年產生的。僅以百度為例,根據公開的信息,作為全球最大的中文搜索引擎,百度每天響應來自138個國家和地區的數十億次請求,每日新增數據10TB,要處理超過100PB的數據。而互聯網中產生的數據僅是大數據構成的一部分,其余來自工業、商業等領域的數據更是不計其數。例如僅國家電網,全國能夠采集獲得的數據總量也是上10個PB級別的。據統計2013年中國產生的數據總量超過0.8ZB(相當于8億TB),2倍于2012年,相當于2009年全球的數據總量。預計到2020年,中國產生的數據總量將是2013年的10倍,超過8.5ZB。
Velocity(高速)。大數據對數據處理速度要求高。各種數據的產生與更新速度非常快,如騰訊QQ目前擁有8億用戶,4億移動用戶,每日新增數據約在200TB~300TB,平均每秒新增數據約為2.37GB~3.56GB,可謂瞬息萬變,分秒間處理出的結果已是千差萬別,因此大數據具有鮮明的時效性,大數據的挖掘要求在秒級時間范圍內給出分析結果,這也是大數據處理技術和傳統的數據挖掘技術最大的區別。
Variety(多樣)。大數據的類型繁多,數據來源于各種各樣的渠道。除數據龐大的互聯網之外,電信、金融、保險、電力、石化系統、公共安全、醫療、交通領域、氣象、教育、地理、政務、商業銷售、制造業、農業、物流和流通等其他領域也都包含著規模龐大的數據。據推算,目前國內銀行和金融系統每年產生的數據達到數十PB;整個醫療衛生行業,一年能夠保存下來的數據就可以達到數百PB;交通方面,航班往返一次能產生的數據就達到TB級別,列車、水陸路運輸產生的各種數據視頻、文本類數據,每年也在百PB級別[3]。
Value(價值)。正因為數據數量如此龐大,而來源又如此繁雜,因此真正能夠產生價值的數據比例不高。大數據具有數據價值密度低,商業價值高的特點。大數據的特點也決定了大數據產業鏈所必須包含的組成部分。大量與多樣的特點決定了產業鏈中應包含數據來源及存儲部分;而速度和價值特點則決定了產業鏈應包括快速數據處理挖掘和應用部分。因此可以說大數據產業鏈主要包含四個層面:第一層,數據來源層,包括互聯網、移動互聯網、運營商、政府部門、工業、商業等領域;第二層,數據存儲層,包括云服務平臺、云存儲設備商等;第三層,數據分析與挖掘層,包括各綜合及專業服務部門,負責數據分析及共享等;第四層,數據應用層,包括互聯網、政府部門、商業部門等多個領域。
三、京津冀大數據產業發展的優勢比較
1. 信息業發展基礎比較
大數據是信息技術發展的更高階段,信息業的發展也是大數據產業發展的基礎。在信息業發展中,北京在京津冀三地中處于絕對的領先地位。2013年1-12月北京市軟件和信息服務業實現營業收入4 900億元,這與政府的重視和財力物力的大量投入密不可分。如圖1所示,2013年北京市信息傳輸、軟件和信息技術服務業固定資產投資209.74億元,是河北的1.8倍,天津的2.8倍。完善的基礎設施和高速發展的信息業也吸引了更多的專業技術人員從事這一行業,如圖2所示,2013年北京市信息傳輸、軟件和信息技術服務業從業人員達到73.2萬人,遠遠領先于河北的19.8萬人和天津的7.98萬人。因此說,在三地中,北京具備更加完備的信息業發展基礎,擁有更多的專業人員。
2. 軟件產業總體發展狀況比較
軟件是大數據產業發展的核心,大數據產業發展的各個環節都離不開專業技術軟件。相比較起來,三地的軟件產業發展差距也比較大。從軟件企業數量和軟件業務收入兩個指標上看,北京均居于三地之首。如圖3所示,至2013年底北京共有軟件企業1 956家;天津共有560家,河北共有264家。在軟件產品數量上,北京的增長量也很大,2013年北京新認定軟件產品8 783件,同比增長34.2%,軟件業務收入4 210.63億元,遠遠高于天津的711.39億元和河北的134.23億元(見圖4)。因此從總體上說,北京的軟件產業比天津和河北發展速度更快,產業規模更大。
3. 軟件產業項目分類比較
雖然北京的軟件產業發展水平遠遠領先于天津和河北,但軟件產業中細分了各個類目,具體分析來看,三地對于軟件產業的側重點也有不同。如表1所示,北京的信息系統集成服務收入、信息技術咨詢服務收入、數據處理和存儲服務收入這三項收入都很高,甚至其中兩個項目是其他兩個地區的十余倍;而天津的嵌入式系統軟件收入和集成電路設計收入則都高于其他兩個地區,特別是嵌入式系統軟件收入這一項,相當于北京同類項目收入的15倍;而河北的軟件產業發展相對較弱,除信息系統集成服務收入與天津相當外,其余的項目均遠遠低于其他兩個城市。
4. 科技研發基礎比較
大數據屬于高科技產業,因此研發水平的高低對于產業發展有著至關重要的作用。首先,從研究與試驗發展(R&D)經費上來看,2013年北京市全年發(R&D)經費支出1 200.7億元,相當于地區生產總值的6.2%;天津市全年經費支出約402.4億元,占地區生產總值的2.8%;河北省全年經費支出290億元,占全省生產總值的1.0%。其次,從專業人才方面來看,2013年北京市共有研發(R&D)活動人員35.1萬人,全市共有56所普通高校和80個科研機構培養研究生,全年研究生教育招生9.1萬人,在學研究生26.6萬人,畢業生7.3萬人;天津市共有普通高校55所,全年招收研究生1.7萬人,在學研究生5.1萬人,畢業生1.5萬人;河北省全年研究生教育招生1.3萬人,在學研究生3.8萬人,畢業生1.1萬人。
綜合以上數據分析可知,北京市研發經費支出數額與占GDP的比重都高于其他兩個地區,且無論是現有專業人才還是后備人才也比其他兩個地區數量更多,因此說三個地區相比,北京具有更雄厚的科技研發基礎,天津其次,河北相對較弱。
5. 土地資源比較
與許多產業相同,大數據產業對土地資源也有一定的需求,其后續的擴充也需廣闊的發展空間。從地理位置來看,京津冀同處環渤海心臟地帶,地域相鄰。但三地的土地面積和人口密度卻具有很大差別。其中北京土地面積1.64萬平方公里,2014年末全市常住人口2 151.6萬人,人口密度約為1 312人/平方公里;天津土地面積1.19萬平方公里,年末全市常住人口1 516.81萬人,人口密度約為1 275人/平方公里;河北省18.88萬平方公里,年末全省常住人口7 383.75萬人,人口密度約為391人/平方公里。從以上數據可以看出,與京津地區相比,河北省土地面積大,人口密度小,具有更大的空間發展潛力。
6. 人力資源成本比較
無論任何產業,人力資源都是產業發展的根本,而擁有更低的勞動力成本,將會為企業節約更多的資源,更有效地提高企業競爭力,推動企業良性運轉,從而推動整個產業的發展。據統計,2013年北京市全年城鎮居民人均可支配收入為40 321元;天津市為32 658元;河北省為22 580元。從以上數據中可以非常直觀地發現,河北省擁有更低的勞動力成本,天津次之,北京最高。
四、推進京津冀大數據產業差異互補發展的對策建議
1. 京津冀合作構建差異互補的大數據產業鏈
大數據產業涉及領域廣泛,涉及內容細致繁雜,所需存儲空間龐大,數據搜集涉及多個部門,僅靠一個省市構建完善的大數據產業鏈所需投入的人力物力財力較大,且根據以上的比較可以看出,北京、天津、河北三地在大數據產業建設基礎條件上各有優劣,單一的地區可能在基礎設施、研發能力、土地資源、人力資源等許多方面受到制約。因此,不如充分運用三地現有優勢,設計適合三地發展并能實現合作共贏的產業規劃,在京津冀協同發展戰略引導下,共同構建京津冀大數據產業鏈,讓三地在產業鏈上的布局分配及側重點上有所差別。取長補短,差異性、互補性發展。
2. 建立統一共享的大數據平臺
數據的搜集是大數據產業鏈的開端,也是數據挖掘、分析的必備前提,充足全面的數據可以使數據的分析更加客觀準確,得出的結論更具參考價值。目前三地的政府、產業界、互聯網站都積累了大量的數據資產,但由于受觀念制約,或對數據資源的獲取能力和整合能力不足,許多數據并不能完全實現共享,得不到充分的利用,造成了大量數據資源的浪費。因而建議京津冀建立統一的大數據平臺及數據庫,讓三地數據實現互傳共享,從而最大程度地挖掘數據價值,提高數據利用率,創造出更大的社會和經濟價值。
3. 建議在北京建立大數據技術研發中心及應用中心,側重于大數據的研發及應用
大數據產業的發展需要不斷更新提升的高新技術作為支撐,特別是面對目前國內科技創新能力不強的問題,急需具備軟件開發能力的軟件企業及具有自主創新能力的研發力量。根據以上的比較可以看出,北京的軟件產業發展最快,軟件企業最多,軟件業務的收入也最高。而且,北京還有相對于其他兩個地區更為雄厚的技術研發基礎,因此建議在北京建立大數據研發中心,負責大數據新技術的研發。另外,鑒于北京信息產業整體發展領先于其他兩地,且北京又是許多國內外大企業總部的集聚地,因此建議將大數據應用中心設于北京,以期將經過挖掘與處理的數據更好地投入應用。
4. 建議在天津建立相關設備生產基地和云計算中心,側重于相關設備生產及數據分析
從以上數據可知,天津的嵌入式系統軟件收入和集成電路設計收入都高于其他兩個地區,而嵌入式系統是綜合了計算機軟硬件、傳感器技術、集成電路技術、電子應用技術為一體的復雜技術。它在物聯網中承擔著分析、管理、處置信息的核心作用。物聯網產業也是天津著力發展的產業之一,而且天津的云端服務器、存儲器、路由器生產也位居國內先進水平。因此建議在天津建立物聯網與云計算設備生產基地,為大數據產業提供硬件支撐。
在天津建立云計算中心,則是依托天津濱海新區云計算產業基地,以國家超算天津中心為基礎,借力“天河一號”應用平臺,結合計算性能達到百萬億次的天河·天騰系統;包含128個Intel-EX5675 CPU的天河·天翔系統;包含24個節點共計96個CPU的天河·天馳系統,提供高質量、高性能的計算與分析服務。
5. 建議在河北建立云存儲基地,側重于數據搜集及存儲服務
通過以上分析可知,河北相對于其他兩個城市,具有土地資源及人力資源成本優勢。而大數據的存儲中心恰恰由于受土地和勞動力成本的制約而不適合建在中心城市,但又由于招商及維護等方面原因不宜離中心城市過遠。因而河北便可充分利用它毗鄰京津的地域優勢,建立云存儲基地,側重于大數據的搜集及存儲服務。
但也應注意,由于河北省下設多個城市,城市之間可能會因為總體規劃不明確而出現城市大數據產業規劃雷同,產品服務同質化,嚴重地甚至會出現惡性競爭。這就需要省內統一規劃大數據產業布局,結合各地優質資源集中謀劃,在全省內形成協作互利的大數據存儲網絡。