大數據新創公司正在創建可行的產品,以解決真實環境的痛點,而且這些大數據新血都獲得了強固的管理團隊資金上的支持。以下是10個值得關注的大數據新創公司。 大數據市場愈來愈火熱,但它不像一些被過度炒作的趨勢(如社群媒體),有了這些工具它就可以被精確地指出投資報酬率。
之前,我們透過Story Source Newsletter、HARO、Twitter,以及其它管道,以電訪方式挑選候選人,我們獲得了超過100個建議。雖然我們獲得這么多的回應,但大部分的人對于我們的電訪都是一口回絕。候選公司中有些提出的顯然是科學計劃;有些可能是完全沒有資金、管理背景,或是價值定位模糊的計劃,而有些顯然是對產品有錯誤幻想。
這次就不是這樣了。最近,我們改變了選出10個新創公司的方法。首先,我們從Startup50.com上匯編了的一長串的候選名單。然后,我們讓讀者來票選出他們傾心的公司。我們觀察的新創公司中,只有極少數是較瘋狂、高風險的產品;大部分都是有很好的想法,有真正的創投資金支持,并且搭配管理團隊。
這一回合我們采用了新方法。從一長串的名單中被挑選出來的新創公司可以挑戰名單上特定的新創公司,他們可以想辦法贏得別人的投票。如果挑戰被認為是可取的,我們會再另外設置一個投票。Sqrrl和DataStax就是突破這一連串的挑戰,躍上候選名單的公司。 總共超過11,000人投票選擇他們最欣賞的大數據新創公司;Cloudant贏得第一,SiSense緊追第二,而第三名的SumAll也是極為高票。
這回,我們提高了投票的比重;平常的投票約設定30%權重。這一次,我們更重視資金、管理團隊背景,以及該公司產品發展計劃的可行性等其它因素。
然而,整個42個大數據候選名單(加上幾個一開始逃出我們法眼的名單)每一個都強得離譜!
以Xplenty為例。他們最后以第八名獲選,但是我們有考慮將他們提升,因為這個新創公司才創立一年,還沒有募到大筆資金,也還沒有響當當的客戶。所有的條件都對他不利。 權衡這些造成投票結果的負面因素很重要,而且如果能把一些穩定發展且具有潛力的新公司,和目前幾乎是最有潛力且最受矚目的新公司一起涵蓋進來的話,這樣子獲得的結果是最好的。
當我們開始觀察這些潛力替代者時,我們意識到,名單中最前面25個左右的任何一個候選公司對選擇結果都會有強烈的爭議。
坦白說,我們可以把Platfora、Cloudmeter、CloudPhysics、Sqrrl、RainStor、Rocket Fuel,或是幾個其它公司納進來取代Xplenty的位置。大數據公司并不像其它一些領域,它是有實質的內容。他們正在建立可實現的產品,解決真實世界的痛點,而那些坐如針氈的公司現在愿意花錢解決問題;而且大多數的大數據新創公司都有著很好管理團隊予以資金上的支持。這是一個很蓬勃的領域。
因此,Xplenty插進了名單。是的,在此階段他們和旗艦型的殺手比起來必較嫩,但是他們免編碼的Hadoop Big Data service很簡化,使用簡單,價格親民,即使是中端市場也可負擔。
現在,輪到你了!選擇你最鐘愛的大數據新公司,我們會將這10家公司進行排行,并選出最大贏家!
[page]
1.Cloudant
●解決方案:提供云端數據庫服務(DBaaS, Database-as-a-Service)
●總公司:美國麻州波士頓 ●執行長:Derek Schoettle。在Cloudant服務之前,他是Vertica Systems的副總暨CME業務(溝通、媒體與娛樂解決方案),該公司于2011年被HP并購。
●創立時間:2008年。
●資金:Cloudant今年(2013)五月剛結束第二輪的資金挹注,共1200萬美元,由Devonshire Investors、Rackspace Hosting以及Toba Capital主導此一期程,其中包括目前的投資者Avalon Ventures、In-Q-Tel,以及Samsung創投公司的參與。Cloudant到目前為止募集了1600萬美元。
●入選原因:他們是第一個完成Startup50.com票選活動的公司,他們的資金才剛提高到1600萬美元,而且現在聲稱有超過12,000個客戶。據Cloudant表示,數據庫的問題在于,假如有個應用程序是成功的,組織運用到一個程度通常就不會再使用。這通常指的是「App Store效應」;甚至是「擴展分散式的數據庫」與緩存區被叢集硬件與分區計劃限制了。 Cloudant DBaaS以管理服務為目的,設計給以資料驅動的網頁,以及想要管理大數據工作量的移動應用開發者。使用者甚至不需有要有分散式數據庫設計、分享、分割、備份等經驗。Cloudant可透過儲存、分析,以及資料中心的全球網絡供應應用資料,提供低延遲與高可用性的資料層效能,并且將動態資料推到更廣范圍。
●市場潛力與競爭態勢:根據市場研究媒體表示,全球NoSQL的市場在2018年之前預計將達到34億美元,2013到2018年間的年復合成長率達21%。期間,NoSQL市場營收預估將達140億美元。 Cloudant居于一個相當獨特的機會點。Oracle與MySQL可以在AWS平臺上被取得,但是在那里沒有幾個NoSQL DBaaS的供應服務。Joyent今年初有推出一項服務,而AWS的DynamoDB還在試用版階段。 Cloudant宣稱他們擁有12,000個多租戶型客戶,包括Samsung、DHL、Monsanto、Salesforce.com (Heroku)、SourceFire、Hot Head Games、Flurry、AppAdvice,以及LiveMocha。
2.Cloudera
●解決方案:提供以Hadoop應用的大數據平臺
●總公司:美國加州Palo Alto
●執行長:Mike Olson,他是嵌入式數據庫Sleepycat Software公司的前執行長,該公司于2006年被Oracle并購。之后,Olson在Oracle任職嵌入式技術副總經理兩年。
●創立時間:2008年。
●資金:Cloudera目前已經募得1億4000萬美元資金。其投資者包括Accel Partners Greylock Partners、Ignition Partners、In-Q-Tel與Meritech Capital Partners。
●入選原因:大數據很火熱,而Cloudera在Hadoop應用的大數據領域居于領導地位。此外,他們擁有大量創投資金作后盾,并且有專業的管理團隊。 坦白說,我們思考了很久是否將Cloudera排除于名單外。不是因為他們不屬于此,而是他們這段時間以來已經做得夠好,我們不是很肯定他們是否還符合「新公司」的定義。 然而,他們在Startup50.com的票選活動中表現亮眼,最后也擠進前10名排行,而且應證了Hadoop的商業案例。Cloudera讓使用者詢問所有他們建構與了解的資料,并且讓使用者可以看到后面獲得的相關數據庫。Cloudera最近還發布Impala,這是Hadoop上的一個開放原始碼互動詢問引擎,它讓大數據上的互動詢問可以實時性的運作。
●市場潛力與競爭態勢:Gartner預估,今年的大數據將帶動340億美元的IT消費,并且在2016年前將成長到2,320億美元。Gartner同時也預估,2015年之前將有65%的完整分析套裝應用程序,Hadoop會被內建其中。 顯然,Cloudera有先馳得點的優勢,但是它有強勁的競爭對手,包括EMC、Pivotal、 Hortonworks和MapR。Intel也剛加入這個戰局。 他們客戶有CBS Interactive、eBay、Expedia、Monsanto,以及Samsung。
3.LucidWorks
●解決方案:提供大數據的企業搜尋引擎。
●總公司:美國加州Redwood City。 ●執行長:Paul Doscher。在LucidWorks之前,他是Exalead的執行長。Exalead是一家企業搜尋引擎公司,2003年時他升任執行長,他也是開放原始碼商業智慧平臺供應商JasperSoft的共同創立人,之后曾經任職VMware全球營運執行副總裁。
●創立時間:2008年。 ●資金:募得資金共1,600萬美元(來自于Granite Ventures、Walden International、In-Q-Tel,以及Shasta Ventures。) ●入選原因:IT組織從訂單量中所收集的資料比幾年前多更多。然而,收集資料是一回事,利用資料又是另一回事。企業搜尋顯然必須使大數據可被利用;而挑戰則在于如何讓其它的應用程序也可以利用它。 LucidWorks Search的設計是為了協助開發人員,建立一個安全性高、可擴充,而且具成本效益的搜尋程序,同時提供一個簡單又全面的方式來利用開放原始碼的搜尋技術。 LucidWorks Big Data是一種應用開發平臺,將搜尋能力整合至大數據架構的基礎層。該產品是建立在關鍵的Apache開放原始碼的計劃上,讓組織可快速找到、利用與評估大量結構化與非結構化的資料。LucidWorks Big Data與LucidWorks Search之間密切地合作,使它成為高度安全、可擴充、且具成本效益的搜尋應用程序。
●市場潛力與競爭態勢:據WikiBon公司表示,2012年整體的大數據市場已達114億美元。WikiBon相信,大數據市場在2013年將達到181億美元,年成長率達61%。這將催促它的腳步更快速成長,在2017年之前突破470億美元。意即2012到2017年間的復合年均增長率為31%。 其競爭對手包括Endeca、Autonomy與Elasticsearch。 ADP是他們的客戶。
4.MapR Technologies
●解決方案:Hadoop/NoSQL大數據平臺
●總公司:美國加州San Jose
●執行長:John Schroeder,曾任職Calista Technologies的執行長(已被Microsoft并購)。更早之前是Rainfinity的執行長(已被EMC并購)。
●創立時間:2009年。
●資金:MapR Technologies到2013年3月時,募得了一輪3,000萬美元的創投資金,由新的投資者Mayfield Fund所主導,其他參與者包括現有的Lightspeed Venture Partners、NEA與Redpoint Ventures等公司,使他們的總資金累積到5,900萬美元。
●入選原因:MapR在Startup50.com的票選中入選在前10名內,他們有亮眼的創投資金做后盾,而且有一名知道如何從新創立公司披荊斬棘到成功存活的執行長。 MapR的平臺結合了Hadoop、NoSQL、數據庫,以及串流應用,到一個單一的大數據平臺。即使是對Hadoop不太熟的人都知道,速度并不是其中一個讓它火紅的因素。而MapR宣稱,他們已經克服了Hadoop速度上的障礙,同時也提供許多企業級的功能,包括「高可用性、企業持續營運、實時串流、透過NFS的標準檔案應用存取、透過ODBC的完整數據庫存取,以及支援關鍵任務的SLAs?!?/p>
●市場潛力與競爭態勢:競爭對手包括Cloudera、EMC、Pivotal、Hortonworks與Intel。 客戶則有Ancestry、Rebicon與comScore。
5.ParStream
●解決方案:開發數據庫技術以驅動「快速資料」。
●總公司:美國加州Redwood市 ●執行長:Mike Hummel。曾是Empulse的共同創辦人;該公司是提供portal解決方案與軟件的顧問公司,現專注于Web 2.0項目。
●創立時間:2008年。
●資金:ParStream從Khosla、Baker Capital、CrunchFund、Tola Capital,以及Data Collective等公司中獲得了560億美元資金。
●入選原因:傳統的數據庫都不是為了分析大數據的規模而設計的,它們也的確沒能力實時地提供那些分析力。傳統數據庫可依序地分析資料,但無法利用先進的多核心程序。 在CTIA 2013通訊技術展中,執行長Michael Hummel指出,傳統數據庫中最大的瓶頸在于記憶量。同時,數據庫的寵兒Hadoop在有效地擴充上有所困難。 At CTIA 2013 執行長Michael Hummel noted that memory is a big bottleneck for traditional databases. Meanwhile, the Big Data database darling, Hadoop, has trouble scaling efficiently. Hummel認為ParStream的數據庫是為速度而建。鑒于許多數據庫平臺都是為了儲存與分析大量的資料而建;ParStream的設計是為了提供更快速地回應時間,并且降低大數據儲存架構中的程序處理成本。 ParStream利用分散式架構橫向處理資料以驅動「快速資料」。ParStream透過 High Performance Compressed Index (HPCI)的驅動,專門提供大數據與快速資料,它可移除額外的步驟和資料解壓縮所需的時間。 ParStream聲稱,對于數十億的資料記錄他們可提供亞秒的回應時間,同時持續地輸入新資料。
●市場潛力與競爭態勢:分析師認為大數據市場在2013年將達到180億美元(WikiBon預估)至340億美元(Gartner預估)不等。其競爭產品包括SAP HANA、Apache平臺,以及HP的Vertica Systems。Searchmetrics是他們指出的客戶,但Hummel向我保證,很快地將有更多客戶出現在紀錄上。
6.ScaleArc
●解決方案:提供數據庫基礎架構軟件,簡化數據庫環境的建置與管理。
●總公司:美國加州Santa Clara。
●執行長:Varun Singh。Singh之前曾協助創立兩家印度頂尖的網絡技術品牌TechTree和Tech2。目前,他也主辦幾個技術展會,包括CNBC、TV18、CNN-IBN,以及 ET Now。
●創立時間:2009年。
●資金:ScaleArc從Accel Partners、Trinity Ventures、Nexus Venture Partners,以及angel investors等公司 獲得1,800萬美元資金挹注。
●入選原因:ScaleArc在Startup50.com的票選活動中以第六名獲勝。他們已經募得大量創業資金,也有一長串的客戶成功案例。 在上個月的Interop信息科技展會中,Singh指出,上網與移動應用正在緊縮傳統的數據庫架構。對企業來說,在線交易、可獲得的應用及效能,才是最后也是最重要的客戶經驗與營收的決定因素。 然而,企業要在不對客戶產生負面影響的原則下,努力地擴充其數據庫基礎架構或消耗資源,以因應日益增長的需求挑戰,而那些資源可能用在別處會有更好的發揮。傳統的SQL環境陷入困境,因為應用程序量需要存取結構化的資料遽增,帶來的數據庫查詢也遽增;而導致很糟糕的應用程序效能與系統中斷。 這種問題對移動應用來說更糟糕,愈來愈嚴重的延遲狀況是效能上更大的打擊。 Singh認為,企業需要最佳化SQL查詢流量的解決之道,而且無需大幅修改現有的應用程序或數據庫。為了改善效能,他們必須卸載現有的數據庫,但不需花大筆鈔票在新的架構上。最后,他們必須能夠完整地看見SQL流量,以更有效地解決問題,并且在那些問題擴大到足以影響企業營收之前就被解決。 ScaleArc的旗艦產品iDB是一個被插入應用程序與數據庫之間的軟件,無需修改應用程序或數據庫。ScaleArc宣稱它可以在15分鐘內完成部署。然后,使用者就可獲得全然可視化的數據庫流量,以及細密的實時SQL分析。 iDB以動態分群(dynamic clustering)、負載平衡、分片切割技術(sharding)提供數據庫立即性的擴充能力與更高的可獲性,而且它提供了一個透明的SQL-NoSQL混合型的儲存引擎,讓任何利用NoSQL儲存的應用程序,都不需要變更任何程序碼或驅動程序。
市場潛力與競爭態勢:ScaleArc預估這個市場值超過20億美元(事實上他們的預估比大部分的分析師都保守許多。) 競爭對手包括ScaleBase和ParElastic。 現有的客戶包括Demand Media、Disney UTV、KIXEYE、Sazze、Flipkart、Weather Decision Technologies等等。
7.SiSense
●解決方案:大數據分析平臺。
●總公司:美國加州Redwood 城市。在以色列Tel Aviv城市有研發設計中心。
●執行長:Amit Bendov。曾任職Panaya的營銷首長,以及ClickSoftware的全球營銷資深副總。
●創立時間:2010年(技術上來說是創立于2004年,但是到2010年之前都是由五位創辦人組成的副業性質。正式發布的時間是2012年。)
●資金:到年四月為止,SiSense獲得了第二輪1,000萬美元的資金挹注,為Battery Ventures所主導,其他參與者還有Opus Capital與Genesis Partner。第一輪的資金配置是2010年的400萬美元。
●入選原因:SiSense在Startup50.com票選活動中獲得第二高票。他們擁有強力的創業資金,還有可觀的客戶清單。 據SiSense 表示,傳統的大數據分析解決方案很像戰艦:價格昂貴、操作上很復雜,這對大多數的企業來說太過火了一點,他們其實不需要用到這么多的程序。一般業務并不需要分析petabytes的資料量,他們如果能獲得terabytes的資料量分析就很高興了,但不是所費不貲,就是被迫要倚重存儲器數據庫解決方案(in-memory solutions)。但是這種解決方案并不利于后續的規模擴充。 SiSense Prism是為了提供各種規模的商業資料分析而開發的技術。不需要coding或scripting,營運分析師他們可以自己分析資料,不需要把IT或資料科學家拉進程序中。SiSense表示,非技術使用者利用Prism分析的資料量,和目前以存儲器分析資料的解決方案相較之下,高達100倍以上,速度也更快10倍。沒必要建置復雜的數據庫系統或是OLAP Cubes。 Prism是透過SiSense的Elasticube技術所驅動,功能包括多欄式資料儲存、強大的資料壓縮、橫向的處理程序,以及先進的查詢最佳化,以提供有分析力的處理能力,這些功能在之前只有高端的解決方案才能做到。
●市場潛力與競爭態勢:Wikibon相信,在2017年之前,大數據的市場規模將超過470億美元。SiSense的競爭對手包括Tableau、QlikView與SAP HANA等。 客戶有NASA、ESPN、Target、eBay、fiverr、Online Commerce Group、Plastic Jungle,以及Magellan Vacations等。
8.Skytree
●解決方案:開發學習型機器的數據庫分析平臺。
●總公司:美國加州San Jose。
●執行長:Martin Hack。他之前曾擔任GreenBorder Technologies的營銷總監(已被Google并購);也曾擔任SonicWALL的產品線經理。
●創立時間:2012年。
●資金:Skytree在今年4月剛獲得第一輪的資金1,800萬美元。由美國Venture Partners主導此一期程,并加入一個新的投資組合,包括UPS以及Sun的共同創辦人暨前執行長Scott McNealy,他同時也是Wayin的董事長。其他投資者還有Javelin Venture Partners與Osage University Partners。到目前為止,Skytree已經募得1,960萬美元。
●入選原因:Skytree在Startup50.com票選活動中有入選至前10名;而且已經列出響當當的客戶名號。 據Skytree表示,先進的分析和一般人的看法相左,「它不是一臺絞肉機,你把資料從一頭丟進去,另一頭就會吐出有智慧的信息出來。」 Skytree已開發了一個給一般用途的平臺,讓資料科學家可以專注在他們最重要與擅長的事情上:建立與部署分析模型,而不是編碼演算。Skytree是一支應用程序可以放在資料中心被很多用戶使用,相對于傳統的交付模式不同:一支應用程序只給一臺PC使用。 Skytree認為機器學習是解開整個寶庫的金鑰,這個寶庫則內含了預測、客戶建議,以及大多數人甚至不知道可能存在的異常偵測。機器學習在大量資料上以釋放演算的方式找到特征,那甚至是資料科學家可能未察覺到的。
●市場潛力與競爭態勢:Skytree表示,大部分他們碰上的競爭對象不是自建型解決方案,不就是舊有的商業智慧平臺,再不然就是像SAS與IBM這類的供應商;所以潛在客戶不需要花太多心思就能決定選擇哪一個供應商、然后緊隨它。 其客戶包括eHarmony、SETI、USGA與Adconion Media。
9.SumAll
●解決方案:主要提供營銷、銷售與社群媒體分析上的資料分析工具
●總公司:美國紐約 ●執行長:Dane Atkinson,他是Squarespace公司的前執行長。
●創立時間:2011年
●資金:SumAll的背后已經有來自于Battery Ventures、Wellington Partners、Matrix,以及General Catalyst等公司兩輪的資金支援,共達750億美元。
●入選原因:SumAll在Startup50.com選票活動中位居第三名,而且他們的執行長Dane Atkinson見識過許多新創公司的成功經驗。 SumAll的產品是一個分析工具,協助公司利用他們自己的資料賺更多的錢。SumAll試圖分解不同的數據庫,包括那些和舊有應用程序有關的數據庫,或是與社群媒體有關的數據庫。 SumAll把收入、支付、社群和系統流量這些完全不同的資料都帶到一個地方,使用者可以透過他們的業務看到這些互動狀況,并且知道是否有社群活動正在帶動流量。例如,SumAll可協助企業找出他們在Facebook上被按「贊」的數量,或是網站拜訪的流量。
●市場潛力與競爭態勢:這些服務并無必要進行肉搏戰比較,但是Hootsuite、Nimble、Gooddata和Kissmetrics將會是SumAll的敵手。 其客戶包括Siemens、Diamond Candles與Urbio。
10.Xplenty
●解決方案:提供以Hadoop為服務的大數據分析。
●總公司:以色列Tel Aviv城市。
●執行長:Yaniv Mor,之前創辦Xplenty公司。曾經管理過Red Rock顧問公司的NSW SQL Services業務。
●創立時間:2012年。
●資金:他們的種子資金金額未公開,于2012年6月由Magma Venture Capital投資。
●入選原因:Hadoop最近已經被炒翻天了,但是它的開發、部署與維護需要特定且艱澀難懂的許多技能。而Xplenty的目標是讓你完全不用學習那些技能。 Xplenty提供一個資料平臺處理大數據。拖放的界面讓你不用再編寫任何復雜的程序碼。 Xplenty是一種云應用,因此終端用戶的服務器不需要安裝任何東西,也不需要下載任何軟件到工作站。透過服務器自動配置,使用者只要點選你要的資料源,配置資料的轉換任務,然后告訴平臺結果產出要放在何處,便大功告成。Xplenty的平臺是利用SQL語言,因此對資料分析師來說,學習曲線應該是最短的。
●市場潛力與競爭態勢:據TechNavio表示,以Hadoop為服務的市場在2016年之前將高達190億美元。Xplenty的主要競爭對手是Amazon Elastic Map/Reduce (EMR)。其它同樣提供以Hadoop為服務的競爭對手還有Mortar Data、Qubole,以及Microsoft Azure最近也推出Hadoop。Rackspace也即將推出他們自己的Hadoop服務,透過Hortonworks平臺分布。