大數據分為廣義和狹義兩個概念。廣義的來講,所有的互聯網公司都有自己的數據,因為它們有很多用戶,以及用戶沉淀下來的數據。它們也有自己的數據部門,大的互聯網公司會拿這些數據做一些變現。狹義的來講,其實大數據更多的定義是第三方的公司,它幫助在市場上有需求的客戶收集以及利用數據。
今天想著重講的是狹義層面上的數據概念,就是說我想為大家介紹一下國內外大數據創業領域的標桿性公司,以及它們發展的情況。
大數據在企業應用中的構成
大數據在企業應用中分成五個大的部分。先有底層數據基礎,才有分析層面的東西。
2014年全球大數據創業公司
1.Infrastructure
第一個大的模塊叫Infrastructure(基礎設施),也就是說我們平時用到的云計算、存儲設備以及數據庫等,這些都是基礎的東西。數據源的存儲和處理需要載體,通常是硬件或是虛擬化設備。
2.Datasources
第二個是數據源,這是大數據的基本原材料,我們必須要有數據才能夠提取數據中的價值。
3.Opensources
Opensources(開源方案)包含算法、數據轉化、結構化處理等功能,相當于一個中間件,它是連接了數據源和基礎架構,再把數據做結構化的處理。
4.Analytics
最廣泛的應用場景就是Analytics,就是分析類,比如大家經常提起的的BI,我們企業內部有各種各樣的數據,怎么樣通過工具或者是軟件把這些數據呈現出來,在這個領域有各種各樣的細分。比如說有專門做非結構數據處理的,有些專門做數據可視化的,還有一些可能是針對某些垂直領域的。
5.Applications
最后一類是應用類,它們融匯了大數據與各垂直細分領域業務邏輯,提升價值,比如金融業、房產業、醫療業、汽車業、等等。
根據這五大類,相繼有一些創業公司。我自己調研發現從2008年到2014年是大數據在美國創業的風口。從2012年到2014年出現大數據行業突破性的變化。可以看到,每一個細分領域的公司有非常大的量級上的增加。
國外大數據退出案例
截止到2014年底,國外在大數據創業公司一共有358家,但是只有16家退出。分析層面退出的案例最多,數據源、基礎設施方面也有幾家。
1.Analytics
KARMASPHERE:是做數據處理的公司,它給企業提供了非常基層的數據分析工具,提供給數據科學家用的。也就是說,它的用戶是具備對數據有一定的理解和處理能力的人,它提供一個工具和接口,把一些企業里面非結構化數據搜集過來,去做一些最基本的結構化處理,數據科學家再通過自己擅長的各種模型,去利用這些數據。
Tableau:它做更加傻瓜的數據可視化。也就是說,它直接繞開數據科學家可以直接提供給相對小白一些的用戶,有些中型企業它們沒有數據科學家的職位,他們可以直接用Tableau,免去數據采集、處理、建模的繁瑣步驟,很簡單快速的部署到企業內部,一目了然與自身業務、經營息息相關的實時情況,比如說:用戶的購買率、轉化率等等。
Palantir:它雖然還沒有上市,它如今卻是與Airbnb并駕齊驅的百億獨角獸之一,它是發展最迅速并且融資規模最大的大數據公司,已經融了9億美金。它的競爭優勢在于提供了全產業、并且超定制化的數據服務,它不僅僅有自己第三方的數據源,同時也具備數據分析、SaaS可視化的服務。所以它是非常有核心競爭力的公司,產品的厚度相應是非常堅實的。
BlueFin:它現在已經被Tiwtter收購了,它在美國是做社交數據起家的。如果大家想收集某些有關品牌、事件、人物的情報,其實最直接的數據源頭就是社交平臺,因為人們與社交媒體的交互是最為頻繁的 。所以BlueFin這家公司創業之初就采集了主流社交平臺的數據,比如利用我們常說的爬蟲技術,采集對于某一些特定關鍵詞的評論,再做分析。其實有點像輿情檢測跟輿情分析。這個在國外是非常普遍,在早些年前已經被很多企業重視。因為國外自主品牌相對比較多,他們很早就開始注重營銷這方面的東西。所以這個公司起步也比較早,最后退出的也比較快。
Splunk:還有一類就是IT運維方面的分析,這個公司在國外最成功的案例就是Splunk,這個工具是提供給內部IT部門運維人員的,因為運維人員每天要關注系統運轉的穩定性和安全性,他們要處理很多機讀語言的非結構化數據,這個可能跟公司管理或者是跟業務沒有太大關系,但是IT數據非常重要。主要的原因是,如果IT系統一旦崩盤可能會影響到網站的運營,對于大型企業來講,可能就是損失掉了一筆巨額的收入。
2.Applications
Rocketfuel:在應用層面,國外在2015年新增了幾家新的退出案例,我還沒有完整的總結。2014年,只有一家叫Rocketfuel,這家有點像國內的秒針,它是針對做廣告優化精準營銷的。因為大數據在應用場景層面,其實最頻繁被用到的還是智能營銷,因為營銷是最簡單粗暴的訴求:離錢最近的,打廣告,直接找到精準的客戶,直接給客戶帶來收入。這塊國內跟國外是一樣的情況。
3.Datasources
BlueKai:剩下的幾個基礎方面的數據源,以及開源數據,基礎設施,它不算是非常熱門的創業領域。所以相繼在國外退出的案例也沒有那么多,尤其是數據源這塊,國外有一家叫BlueKai,它也是偏向于營銷,主要是給企業的營銷部門提供第三方數據源,有點像數據集市。
4.Infrastructure
ParAccel:在基礎設施方面還有一家ParAccel是標桿性的公司,它是做數據處理的,把非結構化的數據轉化成結構化的。很多企業不做精細化運營,但起碼數據存儲還是要有的。
新銳大數據創業公司
剛才提到的都是一些退出的公司,這一頁上是我自己篩選出來的,我覺得這兩年在美國創業市場比較新銳的公司。
Taboola:也是做精準營銷和營銷優化,但是它不太一樣的是它集成了更多人工智能方面的東西。
Localytics:它跟傳統的數據分析不太一樣,比如Tableau做的主要是大型或者是中大型的客戶,中大型客戶有比較現成的數據庫,比較現成的結構化的東西。但是Localytics更輕,主要針對很多SME,就是中小型的公司,包括創業公司,它自己有靈活的數據庫功能,一個新的創業公司即使沒有搭建數據庫,也可以很快的部署,在應用上可以看到用戶的情況和行為表現。
MixPanel:跟Localytics比較類似,都是比較新銳的創業公司。
APP Annie:大家比較熟悉了,用于分析應用中的用戶行為數據。
Data Hero:今年已經成功退出了,這也是一家成長非常快的公司。
EvreString:是華人自己做的公司,是真格投的,它利用了數據,幫助企業找到核心潛在客戶,算是一個銷售線索公司。但是他們非常厲害的是,他們能夠把很多數據孤島串聯起來,幫企業找到最精準的用戶群體。
大數據創業增速緩慢
國外截止到2014年底有358家大數據方面的創業公司,退出的只有16家,包括并購和上市,而且并購占到了80%,上市只有20%。從比例上來看,4.5%的退出率對于一個創業方向來講其實是很低的,而且從速度上來看,也是相應的比較緩慢的。
究其原因,我覺得不管是在國外或者是在國內,大數據應用場景的不成熟,以及有能力使用大數據的人才(數據科學家)匱乏,始終是阻礙大數據發展的原因。
從現有統計看,分析工具其實是占比最高的,不管是在融資情況或者是退出方面。第二名是基礎設施,我剛才說了,因為所有公司都有存儲數據的需求。然后是垂直細分領域,排名最后的數據源,像開源數據其實是最難變現的。所以到現在都沒有很好的退出。
大數據創業熱門領域
最熱門的三大領域:數據分析、應用和基礎設施。從2008年到2012年,數據分析工具越來越多,不管是融資金額,還是案例數上。基礎設施機會越來越少,因為這塊肯定是先有一個培育的土壤,才能有后面分析的東西,所以這塊的創業機會越來越少。
在應用場景這塊,可以看到中間多出來很多,后面也變少了。我們來看不管是投資人或者是創業公司,可能在2009年到2010年都是想象的階段,不知道這方面到底能不能好,很多人都一窩蜂的擠進來。后面理智一點的發現,應用場景快速做起來的并不是太多,所以也就相對理性了。
大數據在垂直領域的應用案例
在垂直領域,大數據在美國已經有的成功案例,包括市場營銷、能源、石油、金融,企業服務里面最常用到的人力資源HR。因為現在有很多簡歷需要通過智能分析去做大數據的關聯。還有就是零售,因為零售行業是產能非常高的行業,所以大數據對它們來說價值非常大。還有就是供應鏈管理、醫療、健康以及房產。
國內大數據創業公司
1.基礎設施
基礎設施領域,國內有一家新銳創業公司叫博睿數據,他們是做數據庫的。我個人認為,在基礎設施領域,尤其是數據庫方向,在國內的創業機會很少。因為這個東西不太需要再引入中文版或者是中國獨特的東西。因為用國外現成的工具就可以解決問題了。而且現在有很多開源,也是免費的,這塊在中國的創業機會不是太多。但是也有一些新興的方向,比如說做數據壓縮、數據檢索等,這種相對比較細分,也比較新興的領域,這些方向可能還有機會。
2.數據源
我自己認為數據源方面創業公司確實沒有什么機會了,首先數據方面創業公司都做的比較大了,比如說數據堂是做數據集市的,這些公司都已經到B輪了。最大的像數據魔方,阿里媽媽等,是阿里旗下的產品,巨頭在這個領域會有優勢很多。
3.分析類
分析類目前還處在起步的階段,目前我看到可視化的機會,阿里前幾天剛剛推出了叫數說,它們是做可視化的,以后會提供給各種各樣的客戶,包括政府或者是中小型公司,以及大型的民營企業。可以看到,只要你對你的分析方面有需求,只要數據源導進來,他便可以自動的做歸類和分析,并且智能化的形象展現。這個領域的創業公司有星圖和海云,我把數據庫導進來可以看很多公司的動態。
剛才我們講的大而全的分析平臺,既具備數據處理能力,又具備可視化,現在行業里面非常標桿的叫永洪數據。我覺得永洪非常強大,因為它們跟國外的Tableau直接對標,是我目前看到的做數據處理、可視化分析,并且跟客戶的業務邏輯緊密結合非常成功的公司。
后面除了分析平臺之外,精準到用戶分析又有兩家公司已經做的比較大,就是TalkingData和友盟,我們覺得做用戶層面數據分析創業公司機會不多了,友盟被阿里收購了,所以空間并不是特別多。
下面這一類,這是我特別關注的,我覺得在國內數據類創業公司里面最有機會,就是有點對標國外大數據創業公司,像神策網絡、GrowingIO、達觀數據,你有數據庫可以非常靈活,你沒有數據庫我可以幫你引入一些外部的。在收費模式上也是SaaS的模式,比較輕。但是也存在一個短板,可能它們的目標群體,也就是中小型客戶的付費意愿沒那么強,客單價低。
還有像百分點,它是做智能算法、廣告優化的。像應用類下的智能營銷,我自己覺得在國內機會不多,做廣告優化,除非你是從PC領域轉到移動領域,不然的話機會真的不多。因為現在這幾家公司都是C輪以后或者是快上市,或者是并購的結構了。
后面還有一類我也特別關注,IT這塊像日志IT運維分析,因為我自己對IT方面非常感興趣,國內比較成功的幾家Hansight、日志易、OneAPM,還有陸續針對特定類型客戶的公司,比如我正在做的一個項目,針對大銀行、運營商機構的Protoco Soft。
4.應用類
最后一類應用類垂直到不同細分領域,我覺得都有機會。尤其有機會的是市場營銷和銷售線索領域,因為這個離錢近,可以直接給企業帶來好處和利益的,我覺得這塊是最有機會。再精準到細分里面,數據應用場景最成熟的可能是電商營銷或者是社交數據,或者是社交CRM,這些方面都有很多機會。還有就是安全、醫藥、金融都會有機會。雖然垂直應用層面可能有機會,但是如果已經有人做建議慎入,本來這個市場相對比較小,進入之前也必須看看競爭對手已經做到了什么程度了。
總結:
追溯國外的大數據市場行情,發展還是相對緩慢的,并且這個情況也可能會發生在中國。 無論是在國外或者是在國內,大數據應用場景的不成熟,以及有能力使用大數據的人才(數據科學家)匱乏,始終是阻礙大數據發展的原因。但是,大數據為人類提供的價值不可估量,一旦爆發會是指數性的增長。技術驅動型的創業也將是下一個風口,我們還是要對這個領域持續保持關注,并且鼓勵專業人才投入到建設大數據創投生態中來。