我國高度重視大數據的戰略意義和數據資源對社會經濟發展的積極作用,國務院于2015年出臺了《促進大數據發展行動綱要》,并將“實施國家大數據戰略,推進數據資源開放共享”納入“十三五”期間規劃和建設的重要目標。目前國內大數據產業發展已初具規模,但尚未形成產業界定共識。本文首先就大數據產業的核心要素進行探討,然后從核心要素展開闡述我國大數據產業發展的若干特點,最后結合發展現狀和問題提出相關策略建議。
一、大數據產業的核心要素
普遍意義上來講,大數據產業是以數據及數據所蘊含的信息價值為核心資源所構成的生態環境,它包含了與大數據管理和價值實現相關的企業、行業機構等社會主體的經濟活動集合。遵照產業定義的通用原則,產業各環節的參與實體應能夠提供可交付的產品和服務,并形成上下游產業鏈供需關系。在此基礎上,依據數據價值的提升路徑和IT領域的產品布局,我們將大數據產業的核心要素歸納為數據資源、數據基礎能力、數據分析和展示、數據應用幾個重要組成部分。
圖1.大數據產業核心要素示意圖①
其中,數據資源部分負責原始數據的供給和交換,是數據資產作為生產要素的直接表現,根據數據來源的不同,可以細分為數據資源提供者和數據交易平臺兩種角色;數據基礎能力部分負責與數據生產加工相關的基礎設施和技術要素供應,為數據加工和價值提升提供生產工具,主要包括數據存儲、數據處理和數據庫等多個角色;數據分析和展示部分負責數據隱含價值的挖掘、數據關聯分析和可視化展現等,是智力要素在數據價值中的集中體現,包括傳統意義上的BI、可視化和通用數據分析工具,以及面向非結構化數據提供的語音、圖像等媒體識別服務;數據應用部分根據數據分析和加工的結果,面向電商、金融、交通等細分行業提供精準營銷、信用評估、出行引導等企業或公眾服務。
二、我國大數據產業發展現狀和特點
自2013年大數據的概念迅速普及,國內大數據領域在電信、互聯網、金融、電商等信息化領先行業的引導和帶動下,聚集了BAT等龍頭企業和數百家中小及初創企業,在大數據產業的主要環節完成了初步布局,產品和服務供應鏈能夠滿足基本數據生產加工的全生命周期覆蓋。經過兩三年的持續發展,我國的大數據產業呈現出以下幾個發展特點。
數據資源層,開放主體集中在信息化基礎較好行業及地區,并呈現服務化趨勢。隨著大數據產業中數據資源參與主體的逐漸增多,我國的數據開放程度得到了普遍提升。一方面,數據開放的主體集中在部分信息化基礎較好行業及經濟發達地區,如互聯網、交通出行、教育科研行業等,都出現了相應的數據開放企業和平臺。政府推動的公共信息資源開放網站也主要由信息經濟較發達地區先行先試,并逐漸向周邊省市輻射擴散。另一方面,第三方數據交易平臺不斷涌現,填補了居間服務的市場空白。目前全國范圍內已建成及正在籌建的地方數據交易機構達到十余家。一些早期的數據交易平臺逐漸從單一的居間服務商向數據資源綜合服務商轉型。
數據基礎能力層,參與主體基本完成云時代向數據時代的轉型升級。隨著大規模數據存儲和處理能力需求的快速增長,以BAT、華為、浪潮等為代表的云計算服務提供商,根據自身的原始積累和優勢資源完成向數據驅動企業的戰略轉型。百度憑借其長期積累的用戶搜索記錄推出了百度數據開放平臺,通過百度搜索服務提供“即搜即得”的高效數據展現。阿里云從基礎的彈性資源供給逐漸擴展服務類型,研發并提供了支持PB級數據存儲的分布式關系型數據庫(PetaData)等一系列數據支撐產品。華為的分布式存儲管理系統FusionStorage為異構海量數據的存儲管理提供了彈性可擴展的技術保障。
數據分析以及應用層,中小和初創企業積極占領戰略高地。由于缺失原始數據資產和先期市場份額,中小企業,特別是初創企業集中布局在數據分析和數據應用等低基礎產業環節,投融資形勢異常火爆。據中關村數據產業聯盟統計數據顯示,中關村從事數據分析和數據應用的企業合計超過110家,占總數2/3以上。投融資方面,據不完全統計2015年在國內融資的大數據創業公司超過50家,總融資金額超過50億人民幣,其中從事數據分析和行業數據應用的創業公司近40家,占75%以上。2016年上半年,數據分析和應用兩個領域的創業公司融資情況占據了主流,數量為17家,占比達到70%。
此外,硬件和軟件相互滲透的兩種商業模式并舉并行,為大數據產業帶來新機遇。為了更廣泛地覆蓋數據生產加工流程,延長其產品和服務在數據生命周期中的作用范圍,大數據產業的參與企業逐漸打破硬件和軟件的產品界限,形成了“硬件帶動軟件”和“軟件帶動硬件”兩種新型商業模式。浪潮推出的SmartRack系列整機柜服務器,針對深度學習應用、社交數據存儲、熱數據處理等不同數據處理場景制定了多種混搭架構方案,以一體機的方式實現硬件設施和軟件管理的集成交付。阿里巴巴發布的數加平臺率先探索以“軟件帶動硬件”的市場營銷模式,該平臺通過提供數據計算引擎、機器學習等開放服務,將阿里云的計算、存儲等多種資源有機地組織在一起形成解決方案,有效擴展阿里云在實際生產環境中的部署推廣途徑。
三、我國大數據產業發展建議
把握源頭,強化數據質量管理。目前數據資源開放在開放范圍、開發利用方式、數據可用性等方面仍存在局限性和不足。截止2016年5月,全國共有九個省份/直轄市開通了區域級數據開放網站。雖然與去年同期相比,平臺數量有所增加,但大多數地區仍面臨數據開放格式不一致、可機讀性較差,更新頻率較低等現實問題。部分地方或第三方數據交易平臺在流通效率、質量管理方面良莠不齊,特別是不同行業數據維度不統一、語義不協同等共性問題制約了交易市場的規模化發展。為推動大數據產業發展,需要進一步把握好數據源頭,推動各方不斷加強自身數據能力建設,做優存量、做大增量,加快完善相關配套措施確保隱私和信息安全。同時鼓勵參與主體共同推動數據標準化進程,健全數據交易規范,探索數據資產定價機制,以各行業多樣化應用需求撬動數據交易市場巨大發展潛力。
細化分工,關注數據技術過渡領域。與美國等數據產業發達國家相比,我國大數據產業的短板仍較明顯,數據加工處理服務、數據庫技術和通用數據分析工具等基礎性通用數據技術差距較大,同時市場主體數量少、自主知識產權把控能力低等現狀導致未來發展動力不足。傳統行業和企業對數據分析應用具有巨大需求潛力,但其數據資源多以結構化為主。原有結構化數據和新增非結構化數據之間的互訪問操作和融合管理成為新式共性技術要素,是搶占未來主流市場的關鍵技術機遇點。美國等技術先驅國家的產業版圖已完成了技術過渡領域的初步布局,我國產業參與主體也應考慮進一步細化市場分工,形成專業性強、銜接緊密的產業新生態,并積極加大過渡時期的技術研發力度,實現數據過渡期與發達國家的同步發展。
強化合作,探索新型商業模式。大數據產業是技術密集型產業,同時也是業務驅動為主的實用型產業。就數據分析和運用過程中需解決的共性基礎研究問題,歐美等數據產業發達國家通常采用以開源社區先行的開放合作模式,采用“眾包”思想不斷完善系統架構和產品服務功能,提供更為通用和普適的技術解決方案。經過大量企業在生產實踐中的優勝劣汰自由選擇,不斷成熟和完善的開源產品逐漸從免費提供向企業化盈利的商業模式進行演變。相比之下,我國數據產業的參與主體在開源社區中的貢獻仍然較低,企業間合作、國際間合作的參與熱情有待提高。應借鑒國外企業的成功經驗,以開源產品和服務為基礎,提供定制化和深度支撐的新型商業模式,同時也能夠為中小企業和初創企業參與大數據產業提供新的發展思路。