從谷歌的GFS和Bigtable的兩篇論文發表到如今大數據市場的繁榮,又經歷了近十年的時間!大數據的快速展得益于互聯網的發展,也得益于Apache基金會開源力量的努力,自2005年Hadoop成為Apache項目,Yahoo、Facebook等互聯網公司為大數據的發展作出了巨大貢獻,也培養了一批大數據技術研發和應用的骨干人才。
隨著大數據技術的初步成熟,在資本推波助瀾下,大數據創業投資異常火爆,孕育出一大批大數據創業企業。五個熱門投資領域包括:
1、Hadoop 商業化
Hadoop商業化的三家馬車分別是Cloudera、Hortonworks和MapR。Cloudera是Apache Hadoop著名的項目發起者Doug Cutting創辦的企業,根正苗紅,得到了IBM、Oralce等企業的支持,在行業應用方面的市場份額也最大。Hotonwork則是源于Yahoo的團隊,在2011 年從雅虎拆分出來,完全致力于推進Hadoop開源平臺,Hortonworks與微軟建立了很好的合作關系。MapR選擇了Apache的很多組件,但放棄了HDFS,屬于獨樹一幟,它與EMC具有戰略合作關系,ComScore是它的客戶。
2、SQL on Hadoop
為了提升Hadoop的分析能力,在Hive的基礎上,SQL ON Hadoop技術不斷發展,Cloudera的impala、Hortonworks的stinger和Facebook的Presto進一步發展。這一技術領域也帶動了創業公司的發展,如Hadapt,它提供了對關系型數據庫和非結構化數據的交互訪問;WibiData,它提供了對Hadoop的封裝,連接前端應用到Hadoop基礎設施。
3、NoSQL數據庫
NOSQL數據庫是大數據技術創業公司最為活躍的領域之一。Datastax出售商業化的Cassandra,Cassandra是由Facebook貢獻的Apache開源列存儲數據庫。Mongodb是個基于分布式文件存儲的數據庫,被互聯網企業廣泛應用。Sqrrl則是由Apache 開源的Accumulo發展起來。目前,這些NOSQL數據庫廠商都受到了資本的青睞。
4、大數據分析與可視化服務
大數據分析屬于應用領域,因為更貼近市場需求,見效更快,受到資本的歡迎,一大批創業公司涌現出來。tableau、KarmaSphere、Datameer、metamarkets等公司是其中佼佼者,他們的大數據分析工具已經能夠整合Hadoop、NOSQL數據庫,并在此基礎上實現分類、聚類、推薦等算法,動態分析和展現數據分析結果。
5、行業大數據應用
為社交媒體、廣告公司、企業客戶、電子商務等行業客戶提供數據分析,幫助這些行業提升數據分析的水平,如DataSift、RelateIQ、RocketFuel等創業公司。
隨著大數據技術的進一步發展,Hadoop 2.0、流計算、內存計算、移動數據分析、大數據存儲、大數據云等創業企業也逐步壯大起來,大數據創業投資的市場仍將欣欣向榮。