背景:我們正處在一個數據量爆發增長的時代。 在摩爾定律長達 50 年的支配下, 當今的信息產業呈現出前所未有的繁榮,新的互聯網技術不斷涌現。從傳統互聯網的 PC終端, 到移動互聯網的智能手機,再到物聯網傳感器,技術革新使數據生產能力呈指數級提升。 據 IDC 預測, 目前每年數據的生產量是 8ZB( 1ZB=1012GB) , 2020 年將達到 40ZB。 屬于大數據的時代已經到來。
數據產業有望呈現“線上數據化->線下數據化-> 數據流通“三段式發展過程。
( 1) 線上數據化:互聯網 1.0 時代,以互聯網企業為代表,最早沉淀線上數據;
( 2) 線下數據化:“互聯網+”時代,以傳統線下企業為代表,借助互聯網實現數據化;
( 3)數據流通:在線上/線下全產業實現數據化的趨勢下,數據在產業鏈上下游甚至跨產業流通并創造價值。
數據開放大勢所趨。信息使用的邊際收益是遞增的,信息流動和分享的范圍越大,創造的價值就越高,而線上/線下數據化和數據開放正是信息大范圍流動的兩大前提。推動數據開放和流通在發達國家已成為共識,美歐多國通過國家戰略為數據開放背書。自從“互聯網+”上升為我國戰略后,中央不斷加大力度推動數據開放,在地方政府和產業界的帶動下,部分地區已經做了諸多有益的嘗試。
從“流量思維”到“數據思維”。表面上看“數據思維”取代“流量思維”是為迎合技術發展而發生的態度轉變,但更深層次,從流量到數據是對整個互聯網經濟的重新定義和洗牌,兩種思維分別是兩代互聯網經濟的代表。
( 1) 思維本質:從優化資源配置到生產核心資源。 第一代互聯網重構的是時間、空間,本質上是資源的優化配置;而第二代互聯網的核心是數據,數據成為了新的生產要素。( 2) 經濟價值:從流量的天花板到數據的萬億空間。流量時代,互聯網撬動的GDP 約為 2.5 萬億人民幣( 2013 年),占到國內 GDP 總量的 4.4%;在經歷了第一代互聯網時期的爆發式增長, BAT 等互聯網巨頭的流量規模已經形成,變現方式單一將導致流量變成一種相對廉價資源;數據思維時代,企業將從單純追求“量”向追求“質”轉變,大數據能夠幫助企業從有限的流量中挖掘更大的價值;根據我們的推算,大數據有望撬動中國 GDP 至少在萬億量級,將完全比肩流量經濟。
數據流通的兩種模式:閉環生態、開放交易。
( 1) 模式一:“內部創新+外延并購”形成閉環。典型公司:阿里巴巴等互聯網巨頭。 這一模式可以理解為,以大型互聯網公司擁有的海量數據資源為根基,通過內部創新和外延并購構建閉環生態,推動數據在閉環中流動以創造價值。從“數據魔方(賣數據) -> 達摩盤(大數據營銷平臺) -> 入股第一財經(閉環生態區圈)”的發展路徑可以洞悉阿里逐步收縮的大數據戰略。
( 2) 模式二:打造開放的大數據交易平臺。 典型平臺和公司:貴陽大數據交易所,九次方大數據公司等。貴陽大數據交易所是全球第一家大數據交易所,由政府和產業界共同發起成立,將引領中國大數據交易市場的發展,九次方作為其第二大股東,將成為積極推動大數據開放交易的先行者。
掘金產業鏈。我們將大數據產業鏈按上中下游劃分為:資源、技術、應用。
( 1)“互聯網+”時代,所有企業都有潛力發展成為數據資源公司,處于產業鏈的核心地位,數據是其持續變現的資本;
( 2)產業發展初期,數據技術型公司,包括硬件、 基礎軟件、分析服務、信息安全等,是最直接的受益群體;
( 3)數據開放的趨勢下,極有可能引爆新一輪大眾創業、萬眾創新的格局,誕生具備創新式數據思維及突出技術實力的應用型公司。
上游資源: 任何企業都將可能成為數據公司
互聯網+時代, 數據資源型企業發展迎來歷史機遇。 我們在產業升級三段論中提到,大數據產業已經發展到了線下數據化的階段。 眾多的互聯網公司和線下企業在數據思維的驅動下, 生產和存儲著海量的數據資源,各類數據已然成為跑馬圈地的主要對象。 由于大數據資源未來將是企業價值的重要載體, 我們甚至可以這樣認為: 所有企業都有潛力發展成為數據資源公司。
資源型公司處在產業鏈中的核心地位。BAT 之所以能夠在大數據時代繼續坐穩互聯網企業龍頭的位置,是因為它們幾乎壟斷了搜索、 社交、電商等關鍵領域的數據,并借此聚攏技術型、 創意型以及其他資源型公司,構建由自己主導的生態圈。線下龍頭企業在觸網后同樣能夠生產豐富的數據資源,它們極有可能復制 BAT 在線上的成功路徑。大北農結合豬管網、智農商城、農信網等打造的智慧大北農生態圈, 即是傳統行業龍頭轉型數據資源型公司的成功典范。
資源型公司擁有持續變現的基礎。大數據資源將幫助一部分企業從訂單型向運營型升級,交易不再是一錘子買賣, 而是持續挖掘數據價值變現的動態過程。 一些依托數據資源的運營型公司或將通過如下三步構建閉環:
1)公司與客戶達成協議,共建信息化平臺;
2) 平臺沉淀出大數據,公司對此具有使用權( 甚至擁有權) ;
3) 公司利用這部分大數據資源,獲取長期可持續的價值回報。
石基信息利用酒店管理系統獲取的數據與阿里合作建立酒店預定平臺、易華錄以 PPP 的方式得到智慧城市的核心數據等, 都是訂單型向運營型轉變的典型案例。
向數據資源型公司升級的浪潮已至, “大數據+” 時代來臨。我們認為,互聯網+改革帶來的價值和紅利未來主要將以大數據的形式來呈現, “大數據+” 將是這輪產業升級的根本目的和動力。 在國家和產業界的大力推動下, 消費、醫療、金融、 制造業等各個領域均掀起了大數據的應用熱潮。 據統計, 自“互聯網+” 戰略提出以來,已有百余家 A 股上市的傳統企業給制定了轉型方案。 我們精選出其中最有可能成功升級為數據資源型公司的標的, 分行業列于下表:
右鍵點擊可放大
基于以下觀點,我們認為在互聯網+時代, 數據資源型公司的數量會迎來井噴式的增長,傳統行業龍頭可利用數據資源鞏固自身地位, 但其他公司也將獲得彎道超車的機會。
1)互聯網+對傳統行業最直接的影響就是線上化后的數據化, 且對數據進行存儲、分析的成本在不斷下降, 因而互聯網公司對大數據資源的壟斷將被打破, 行業競爭開啟新格局;
2)快速轉型的傳統龍頭企業將重新整合所在的細分行業, 構建以自身為核心的生態圈,推動大數據在其中的流通,提升整個產業鏈的效率;
3)目前正處于“大數據+” 發展的早期, 對這樣一個明顯具有網絡效應的產業而言, 搶占先發優勢極為重要,數據資源的積累程度將直接影響企業在大數據時代的地位和影響力。
中游技術:大數據產業鏈最直接受益群體
大數據市場規模
Wikibon 估測 2014 年全球大數據市場規模達到 285 億美元,同比增長 53.2%,大數據成為全球 IT 支出新的增長點;
而根據易觀國際的測算口徑, 2017 年我國大數據市場有望達到 170 億元。 全球大數據市場中,行業解決方案、計算分析服務、存儲服務、數據庫服務和大數據應用為市場份額排名最靠前的細分市場,分別占據35.4%、 17.3%、 14.7%、 12.5%和 7.9%的市場份額。云服務的市場份額為 6.3%,基礎軟件占據 3.8%的市場份額,網絡服務僅占據了 2%的市場份額。可以看出, 大數據技術占據了絕大多數市場份額, 將成為大數據產業發展的最直接受益者,但從更廣義的角度來看,大數據帶來的是社會多個領域的創新和變革, 并將對傳統行業進行改造,未來大數據應用領域的發展空間難以估量, 據此, 麥肯錫曾預測中國大數據潛在市場將達到 1.57 萬億元。
從公司層面上看,以 IBM 為首的 IT 巨頭在收入上遙遙領先; 創業型公司Cloudera、 Splunk 等的收入與巨頭廠商仍有差距。 2013 年 IBM 大數據業務收入為 13.68 億美元, HP 和 Dell 的大數據收入分別為 8.69 和 6.52 億美元,排在第二三位。三家公司的大數據業務均占總體收入的 1%左右。 收入最高的純大數據公司為Palantir( 為政府和金融機構提供數據分析軟件服務), Pivotal(大數據集成產品,提供 Hadoop,內存 SQL 數據庫以及 MPP 等多種服務) 和 Splunk(大規模機器數據收集,存儲,可視化分析) , 分別為 4.18 億, 3 億, 2.83 億美元。
技術路徑之爭
大數據處理系統一般需要經過 4 個主要環節,包括數據準備、數據存儲與管理、計算處理、數據分析。
( 1) 數據準備:在進行存儲和處理之前,需要對數據進行清洗、整理,傳統數據處理體系中稱為 ETL( Extracting, Transforming, Loading)過程。
( 2) 數據存儲與管理:大數據存儲系統不僅需要以極低的成本存儲海量數據,還要適應多樣化的非結構化數據管理需求,具備數據格式上的可擴展性。
( 3) 計算處理環節:海量數據處理要消耗大量的計算資源,對于傳統單機或并行計算技術來說,速度、可擴展性和成本上都難以適應大數據計算分析的新需求。分而治之的分布式計算成為大數據的主流計算架構,但在一些特定場景下的實時性還需要大幅提升。
( 4)數據分析環節:數據分析環節需要從紛繁復雜的數據中發現規律提取新的知識,是大數據價值挖掘的關鍵。
大數據解決方案基本可分為兩類, 由主流數據庫廠商主導的傳統方案升級: 數據庫一體機(例如 Oracle ExaData 以及 IBM Netezza 等),以及以開源力量為主的大數據技術( 以 Hadoop 為代表)。 隨著數據的海量化和快速增長的趨勢不斷增強,傳統關系數據庫技術表現出明顯的不足,如何以合理的成本獲得海量數據的高可用性已經成為現代 IT 領域的重大挑戰。 大數據對數據分析、計算和存儲三個環節影響較大,需要對技術架構和算法進行重構,是當前和未來一段時間大數據技術創新的焦點。在所有大數據解決方案中,最為引人注目的是由主流數據庫廠商主導的傳統方案升級,以及以開源力量為主的大數據技術。 兩者是相互補充的關系。
目前大數據開源技術中使用最廣的是 Hadoop, 一個能夠對大量數據進行分布式處理的軟件框架。 Hadoop 框架的核心設計是: HDFS 和 MapReduce。 HDFS 為海量的數據提供了存儲, 提供高吞吐量來訪問應用程序的數據,適合那些有著超大數據集的應用程序。 而 MapReduce 為海量的數據提供計算,它將單個任務打碎,并將碎片任務(Map)發送到多個節點上,之后再以單個數據集的形式加載(Reduce)到數據倉庫里。 基于以上特點, 用戶可以輕松地在 Hadoop 上開發和運行處理海量數據的應用程序。
Hadoop 是大數據行業應用最廣的分布式系統
產業鏈劃分: 硬件+基礎軟件+分析服務+信息安全
硬件領域,主要包括服務器和存儲兩個重要組成部分:
( 1)服務器方面, 大數據應用拉動服務器銷量增長, 國內廠商的市場占有率進一步加強。 IDC 報告顯示:中國 X86 服務器全年銷售額 350 億元,同比增長 29.7%,再次成為全球增長貢獻最大的市場。本土廠商市場占有率較 2013 年提升了 9.1 個百分點,達到 60.4%。同時X86 服務器市場容量進一步向高端轉移,四路高端領域出貨量同比增長 30%,達到市場平均增速的 1.5 倍。
( 2)存儲方面,本土廠商市場占有率不斷增加,入門級及中端存儲增長速度快。 IDC 數據顯示 2015 年第一季度,由于華為、宏杉科技、浪潮、曙光等本地廠商在市場和技術層面的井噴式發展,市場占有率已經達到 49.9%,首次拿下國內市場的半壁江山。 此外數據顯示,存儲市場在中低端保持了較高的增長,高端存儲呈現萎靡狀態,隨著技術的演進,更多高端存儲將被通過中低端存儲Scaleout 的解決方案替代, 進一步為本土廠家提供機會。
基礎軟件領域,外國廠家占有絕對優勢, 技術是核心競爭力, 由于基礎軟件以開源軟件為主,市場規模有限。
Wikibon 預計到 2017 年 Hadoop 和 NoSQL 軟件/服務收入將達到約 35 億美元, 其中, Cloudera(Hadoop)和 MongoDB(NoSQL)是相關領域的代表性企業。
在 Hadoop 生態領域, Cloudera 是規模最大、知名度最高的企業,也是當前大數據領域最強有力的解決方案服務商之一。 2014 年 4 月Cloudera 融資 9 億美元, 估值約 41 億美元。 2014 年 12 月正式宣布在中國設立分公司, Cloudera 免費版在國內市場已經占據了 80%的份額,并有越來越多的用戶轉向收費的商業版本。 MongoDB, 原名 10gen,是使用頗為廣泛的 MongoDB 非關系型數據庫的創建者,在今年年初的新一輪融資之后,估值已達到約 16 億美元。
分析服務領域, 是目前大數據市場最重要的組成部分, 2014 年市場規模占比達35%, 而相關企業也得到了投資者的熱烈追捧。 美國知名的大數據分析企業包括Palantir 和 Splunk。 Palantir 是一家面向政府、金融機構的軟件提供商, 其估值已達到 200 億美元,成為繼 Uber、 Airbnb 之后全美估值第三高的創業公司,關于Palantir, 最傳奇的說法是,它幫助美國政府找到了本·拉登。 Palantir 以反恐為切入點, 如今,政府和金融業務已經成為 Palantir 的兩大支柱產品, 年收入預期至少在10 億美元。 Splunk 成立于 2006 年,是第一家大數據處理的上市公司,在首個交易日以 109%的漲幅撐開了人們對大數據的想象空間。作為一家商業智能軟件提供商,其軟件平臺可以實時對任何 APP、服務器或網絡設備的機器數據進行索引、監控與分析,并將結果生成圖形化報表,在此基礎上幫助客戶避免服務性能降低或中斷。
信息安全領域,隨著大數據的發展重要性不斷提升, 大數據時代傳統信息安全企業將面臨新的機遇和挑戰。 隨著大數據時代的到來,解決網絡安全問題變得越來越難,傳統防御威脅的手段已逐漸失效, 大數據時代也被稱作“大泄密” 時代, PWC(普華永道)指出, 2014 年全球所有行業檢測到的網絡攻擊共有 4280 萬次,比去年增長了 48% 。諸多網絡安全故障的發生,都表明大數據時代的安全問題日漸惡化,而企業在大數據應用前首先要考慮的就是數據安全威脅。因此隨著大數據產業的快速發展, 信息安全領域投資規模也將不斷擴大。
我們認為大數據技術型企業將最先受益于大數據行業的爆發式增長:
( 1) 國產服務器廠商市場占有率不斷增加, 市場容量進一步向高端領域轉移;
( 2) 基礎軟件領域國外企業占有核心技術優勢,國內企業主要集中于下游大數據處理分析領域;
( 3)主要廠商仍處于數據分析階段,即訂單驅動型商業模式,不具有數據運營權。但行業轉型動力明顯,主流數據分析型企業紛紛嘗試直接獲取數據資源或與數據資源方合作實現平臺化發展,獲得持續性收入;
( 4) 信息安全依然是大數據技術發展的保障,行業需求將隨整體市場規模的擴大而不斷發展。
下游應用:數據開放將引爆萬眾創新
數據應用型企業位于大數據產業鏈的下游,通過對開放數據的運用或與數據資源型企業的合作實現大數據價值挖掘后的變現。 相比資源型與技術型企業,應用型企業以新興創業公司為主,先天帶有互聯網基因,專注于解決行業痛點,是實現大數據商業化的關鍵一環,按照終端用戶又可分為 2B 和 2C 兩類。
2B:面向企業或者公共政府部門,提供數據分析結果的服務, 如交通流量數據公司 Inrix,
2C:面向個人,提供基于數據分析的服務; 如 FlightCaster 基于分析過去十年里每個航班的情況,然后將其與過去和現實的天氣情況進行匹配,預測航班是否會晚點。
數據應用型企業可能同時手握大數據資源并擁有大數據分析核心技術,但與傳統線下企業和 IT 企業不同的是,我們更強調創新式思維模式及數據變現能力。 如 Netflix,美國最大的商業視頻網站,擁有 2900 萬個用戶。每天采集海量的用戶數據,不僅包括人們喜歡看什么類型的視頻,在哪看,用什么設備看等,還包括你何時快進,何時暫停,是否看完整個影片等。 Netflix 通過對海量數據的分析推出史上首部大數據制作的電視劇《紙牌屋》 。
數據應用型企業不等同于數據分析型企業,前者強調眾包思想,具有獨立的數據變現模式, 可以與數據資源型企業共創價值,充分挖掘大數據開放流動帶來的資源紅利, 體現了大眾創業、萬眾創新的理念;而數據分析型企業則更像是外包商, 為客戶提供服務,是原有商業模式的補充。 對于外包和眾包, 寶潔公司負責科技創新的副總裁 Larry Huston 評價道, “外包是指我們雇傭人員提供服務,勞資雙方的關系到此為止,其實和雇傭關系沒什么兩樣。但是現在我們的做法是從外部吸引人才的參與,使他們參與到這廣闊的創新與合作過程。這是兩種完全不同的概念。 ” 外包強調高度專業化,是企業的購買活動,而眾包則是跨專業創新的過程, 應用型企業與資源型企業不是雇傭而是合作關系。
政府數據開放為數據應用型企業提供了發展良機, 數據的開放和流通,將極大促進數據價值釋放, 掀起新一輪大眾創業、萬眾創新的浪潮,不亞于當初的移動應用及手游開發。 關于政府數據開放一個典型的例子就是 1983 年美國將用于軍事的衛星定位系統 GPS 向公眾開放使用,并且在 2000 年后取消了對民用的 GPS 精度的限制。GPS 數據開放后,帶動了一連串的生產和生活服務創新,包括汽車導航、精準農業、通信等,同時創造了大量就業崗位,僅美國國內就有約 300 萬的就業崗位依賴于 GPS。再看互聯網開放平臺為第三方企業創造的價值, 以騰訊為例, 騰訊希望成為互聯網連接器, 一端連接合作伙伴,一端連接海量用戶, 共同打造互聯網生態, 從 2010 年實施平臺開放以來, 截止 2013 年末,第三方收益達到 50 億,今年有望突破百億, 創業者人數超過 500 萬。 我們認為類似于互聯網開放平臺所能創造的價值, 依托大數據開放平臺, 在各細分垂直領域必將誕生一批“小而美” 的數據應用型企業。
國外已有一些數據應用型企業深耕多年, 涉及范圍有交通、醫療、 營銷等。 Inrix是一家典型的數據應用型企業,致力于為全球交通問題提供智能數據和先進的分析方法,截至 2012 年 12 月已經為全球 32 個國家的企業提供了服務。 目前奧迪公司、德國汽車俱樂部、荷蘭汽車協會、寶馬汽車公司、英國廣播公司、福特汽車公司、微軟公司、豐田汽車公司和沃達豐公司等都是它的親密合作伙伴。 Inrix 依靠分析歷史和實時路況數據,能給出及時的路況報告,以幫助司機避開正在堵車的路段,并且幫他們提前規劃好行程。
國內多數的數據應用型企業還處于初創階段, 2014 年底藍色光標以接近 2500萬美元的金額認購數據營銷技術公司精碩科技(Admaster Inc)約 12%的股份, 后者估值超過 2 億美元大關。 AdMaste 是國內少有的第三方數字營銷監測和調研機構,專注于為廣告主提供全流程的網絡廣告效果監測、分析評估、媒介優化咨詢和技術解決方案等服務。 在細分領域, 國內影視大數據龍頭企業艾漫科技于今年年初完成 A輪超 6000 萬人民幣融資,這是迄今為止國內關于娛樂影視大數據領域最大的一筆 A輪融資,由榮聯創富基金和創勢資本聯合投資。
基于以下觀點,我們認為數據應用型企業在未來幾年將會進入快速發展階段。
( 1)數據規模爆炸加政府助推數據開放, 任何一個企業掌握大數據,都不可能只憑借其一己之力充分挖掘大數據的價值,勢必應當群策群力。
( 2) 政府、 金融、電信、電子商務、物流、媒體等行業正迎來大數據應用井噴期,萬億市場規模可期, 各大生態體系都將為新型企業崛起提供機會。
( 3)應用型企業兼具互聯網/大數據思維與技術,相比傳統企業,可以更快發現行業痛點并加以解決, 實現彎道超車。
( 4) 數據分析型企業轉型動機強烈,希望參與大數據應用變現帶來的巨大收益。
摘自上海申銀萬國證券研究所報告《大數據,互聯網經濟新內核》