當前,中國大數據產業盡管已初具規模,但尚未成熟,產業界也并未就發展方向達成共識。客觀來看,國家層面的支持為大數據產業的發展注入了強勁動力,這無疑是一大利好。具體來看,發展策略需要從核心要素出發,在提升三大能力補齊“短板”的同時把握好未來發展的方向,從而真正打造出具有競爭力的大數據產業。
認清產業核心要素
從普遍意義上來看,大數據產業是以數據及數據所蘊含的信息價值為核心資源所構成的生態環境,是與大數據管理和價值實現相關的企業、行業機構等社會主體的經濟活動的集合。遵照產業定義的通用原則,產業各環節的參與實體應能夠提供可交付的產品和服務,并形成上下游產業鏈供需關系。在此基礎之上,依據數據價值的提升路徑和IT領域的產品布局,可以將大數據產業的核心要素歸納為數據資源、數據基礎能力、數據分析和展示、數據應用這幾個重要組成部分。
其中,數據資源部分負責原始數據的供給和交換,是數據資產作為生產要素的直接體現。根據數據來源的不同,可以細分為數據資源提供者和數據交易平臺兩種角色。
數據基礎能力部分負責與數據生產加工相關的基礎設施和技術要素供應,為數據加工和價值提升提供生產工具,主要包括數據存儲、數據處理和數據庫等多個角色。
數據分析和展示部分負責數據隱含價值的挖掘、數據關聯分析和可視化展現等,是智力要素在數據價值中的集中體現,包括傳統意義上的BI、可視化和通用數據分析工具,以及面向非結構化數據提供的語音、圖像等媒體識別服務。
數據應用部分則根據數據分析和加工的結果,面向電商、金融、交通等細分行業提供精準營銷、信用評估、出行引導等企業或公眾服務。
大數據產業核心要素示意圖
主要環節完成初布局
自大數據的概念于2013年迅速普及之后,中國大數據產業在電信、互聯網、金融、電商等信息化領先行業的引導和帶動下,聚集了BAT等龍頭企業和數百家中小及初創企業,在大數據產業的主要環節完成了初步布局,產品和服務供應鏈能夠滿足基本數據生產加工的全生命周期覆蓋。
——在數據資源層,開放主體集中在信息化基礎較好的行業及地區,并呈現服務化趨勢。
隨著大數據產業中數據資源參與主體的逐漸增多,我國的數據開放水平得到了普遍提升。一方面,數據開放的主體集中在部分信息化基礎較好的行業及經濟發達地區,例如互聯網、交通出行、教育科研行業等。這些行業目前都出現了相應的數據開放企業和平臺。此外,政府推動的公共信息資源開放網站也主要由信息經濟較發達的地區先行先試,并逐漸向周邊省市輻射擴散。另一方面,第三方數據交易平臺不斷涌現,填補了居間服務的市場空白。目前全國范圍內已建成及正在籌建的地方數據交易機構達到十余家,一些早期的數據交易平臺逐漸從單一的居間服務商向數據資源綜合服務商轉型。
——在數據基礎能力層,參與主體基本完成云時代向數據時代的轉型升級。
隨著大規模數據存儲和處理能力需求的快速增長,以BAT、華為、浪潮等為代表的云計算服務提供商,根據自身的原始積累和優勢資源完成向數據驅動企業的戰略轉型。百度憑借其長期積累的用戶搜索記錄推出了百度數據開放平臺,通過百度搜索服務提供“即搜即得”的高效數據展現。阿里云從基礎的彈性資源供給逐漸擴展服務類型,研發并提供了支持PB級數據存儲的分布式關系型數據庫(PetaData)等一系列數據支撐產品。華為的分布式存儲管理系統FusionStorage為異構海量數據的存儲管理提供了彈性可擴展的技術保障。
——在數據分析以及應用層,中小和初創企業積極占領戰略高地。
由于缺乏原始數據資產和先期市場份額,中小企業特別是初創企業集中在數據分析和數據應用等低基礎產業環節布局,投融資形勢異常火暴。中關村(000931,股吧)數據產業聯盟統計數據顯示,中關村從事數據分析和數據應用的企業合計超過110家,占總數的三分之二以上。在投融資方面,據不完全統計,2015年成功在國內融資的大數據創業公司超過50家,總融資金額超過50億元人民幣,其中從事數據分析和行業數據應用的創業公司數量接近40家,份額達到了75%以上。2016年上半年,數據分析和應用兩個領域的創業公司的融資情況占據了主流,數量為17家,占比達到70%。
——在商業模式上,硬件和軟件聯動的兩種商業模式并舉并行,為大數據產業發展帶來新機遇。
為了更廣泛地覆蓋數據生產加工流程,擴大其產品和服務在數據生命周期中的作用范圍,大數據產業的參與企業逐漸打破硬件和軟件的產品界限,形成了“硬件帶動軟件”和“軟件帶動硬件”兩種新型商業模式。例如,浪潮推出的SmartRack系列整機柜服務器,針對深度學習應用、社交數據存儲、熱數據處理等不同數據處理場景制定了多種混搭架構方案,以一體機的方式實現硬件設施和軟件管理的集成交付。阿里巴巴發布的數加平臺率先探索以“軟件帶動硬件”的市場營銷模式,通過提供數據計算引擎、機器學習等開放服務,將阿里云的計算、存儲等多種資源有機地組織在一起形成解決方案,從而有效拓展阿里云在實際生產環境中的部署和推廣途徑。
駕好前進道路上的“三套車”
盡管中國大數據產業已經在主要環節完成了初步布局,但相比在這一領域的先行者“短板”仍有不少。對此,中國大數據產業需要充分認清自身存在的不足,在強化數據質量管理、把握好數據技術過渡期機遇的同時,積極探索適合自己的新型商業模式。
首先,把握源頭,強化數據質量管理。目前數據資源開放在開放范圍、開發利用方式、數據可用性等方面仍存在局限性和不足。截至2016年5月,全國共有9個省份/直轄市開通了區域級數據開放網站。雖然與去年同期相比,平臺數量有所增加,但大多數地區仍面臨數據開放格式不一致、可讀性較差、更新頻率較低等實際問題。部分地方或第三方數據交易平臺在流通效率、質量管理方面良莠不齊,特別是不同行業數據維度不統一、語義不協同等共性問題制約了交易市場的規模化發展。為推動大數據產業發展,需要進一步把握好數據源頭,推動各方不斷加強自身數據能力建設,做優存量、做大增量,加快完善相關配套措施確保隱私和信息安全。同時鼓勵參與主體共同推動數據標準化進程,健全數據交易規范,探索數據資產定價機制,以各行業多樣化應用需求撬動數據交易市場巨大發展潛力。
其次,細化分工,關注數據技術過渡領域。與美國等數據產業發達國家相比,我國大數據產業的短板仍較明顯,數據加工處理服務、數據庫技術和通用數據分析工具等基礎性通用數據技術差距較大,同時市場主體數量少、自主知識產權把控能力低等問題導致未來發展動力不足。傳統行業和企業對數據分析應用具有巨大需求,但其數據資源多以非結構化為主。原有結構化數據和新增非結構化數據之間的互訪問操作與融合管理成為技術領域的新挑戰,同時也是搶占未來主流市場的關鍵技術點。目前,美國等技術領先國家的產業版圖已完成了技術過渡領域的初步布局,我國產業參與主體也應考慮進一步細化市場分工,形成專業性強、銜接緊密的產業新生態,并積極加大過渡時期的技術研發力度,在數據過渡期實現與發達國家的同步。
最后,強化合作,探索新型商業模式。大數據產業是技術密集型產業,同時也是業務驅動為主的實用型產業。針對數據分析和運用過程中需要解決的共性基礎問題,歐美等數據產業發達國家通常采用以開源社區先行的開放合作模式,采用“眾包”思想不斷完善系統架構和產品服務功能,提供更為通用和普適的技術解決方案。經過大量企業在生產實踐中的優勝劣汰式自由選擇,不斷成熟和完善的開源產品逐漸從免費提供向企業化盈利的商業模式進行演變。相比之下,中國數據產業的參與主體在開源社區中的貢獻仍然較低,企業間合作、國際間合作的參與熱情有待提高。對此,中國數據產業應充分借鑒國外企業的成功經驗,以開源產品和服務為基礎,提供定制化和深度支撐的新型商業模式,在此基礎之上為中小企業和初創企業在大數據產業中發揮作用而提供新的思路。