大數(shù)據技術市場正處于這樣一個階段:Garnter認為是從IT主導的、報告系統(tǒng)轉向業(yè)務主導、自助式服務分析的最后階段。其結果是出現(xiàn)了很多新業(yè)務智能和分析平臺可以滿足企業(yè)機構對可訪問性、敏捷性和更深入的分析洞察力的要求。
現(xiàn)在有很多初創(chuàng)公司提供這種下一代系統(tǒng),他們開發(fā)新技術用于收集、管理和分析大數(shù)據,不管這些數(shù)據是結構化的還是非結構化的、動態(tài)的還是靜態(tài)的、本地的還是在云中的。
下面就是2016年引起我們注意的10個很酷的大數(shù)據初創(chuàng)公司。
Anodot
CEO: David Drai
Anodot在2015年11月走出隱身模式,推出了實時異常檢測和操作智能技術——擁有機器學習專利算法的軟件,可以自動進行業(yè)務分析、查明性能問題并尋找商業(yè)機會。Anodot的目標是從大量數(shù)據中查找異常值,并將這些結果轉化為有價值的業(yè)務洞察。
Anodot的技術旨在用于電子商務網站、數(shù)字廣告系統(tǒng)和物聯(lián)網網絡,以提高運營效率,最大限度增加收入。
Anodot位于以色列的Ra'Anana,以及加州的桑尼維爾,在9月的B輪融資中獲得了800萬美元。
Confluent
CEO: Jay Kreps
在大數(shù)據管理和分析中,處理實時的流式數(shù)據是最大的挑戰(zhàn)之一。解決這個問題的其中一項技術就是開源的Apache Kafka通訊代理項目,提供了高吞吐、低延遲的軟件,用于處理實時數(shù)據。
Confluent是由Apache Kafka創(chuàng)始開發(fā)者創(chuàng)建的,提供了一個圍繞Kafka的完整實時數(shù)據平臺,可作為一個容錯的、高度可擴展的通訊系統(tǒng)。該軟件可用于手機來自用戶活動日志、股票行情系統(tǒng)、設備儀表的數(shù)據,以及其他廣泛用例中的數(shù)據。
今年5月,這家位于加州帕洛阿爾托的公司宣布提供Confluent Platform 3.0,通過融合Kafka Streams把流處理能力添加到應用中,還有在企業(yè)機構上下操作Kafka的Confluent Control Center。
Koverse
CEO: Jon Matsuo
Koverse開發(fā)了一款“盒中數(shù)據湖”的平臺,并稱它可以收集大數(shù)據并更快速地運用于生產中,其成本要低于現(xiàn)有的技術和方法。
這家位于西雅圖的公司創(chuàng)建于2012年,最早的1.0版本是在兩年前首次公布的。Koverse Platform 2.0是在6月發(fā)布的,將Apache Accumulo“分布式鍵值庫”技術和該公司自己的Universal Indexing Engine結合到一起。
聯(lián)合創(chuàng)始人Paul Brown(首席產品官)和Aaron Cordova(首席技術官)曾經是美國國家安全局的數(shù)據科學家,在那里他們幫助開發(fā)了最早的Accumulo項目,重新架構了國家安全局的數(shù)據基礎架構,以更好地處理意外的數(shù)據分析情況。
Maana
CEO: Babur Ozden
Maana開發(fā)了Maana Knowledge Platform,這個數(shù)據搜索和發(fā)現(xiàn)軟件是從大量系統(tǒng)或者“孤島”中收集數(shù)據,并將其轉變?yōu)榭梢员粯I(yè)務線應用采用的業(yè)務洞察。該系統(tǒng)是構建在Apache Spark處理引擎的。
Maana位于加州帕洛阿爾托,創(chuàng)建于2012年,在2015年5月正式發(fā)布,定位是收集和分析由物聯(lián)網網絡生成的大量數(shù)據。9月該公司首次公布了其產品的Winter '17版本,Knowledge Applications用于優(yōu)化像供應鏈和呼叫中心管理這樣的業(yè)務流程,Knowledge Assistants用于創(chuàng)建新的分析模型。
Maana在2016年5月進行的B輪融資中獲得2600萬美元,氣走好難過大部分來自該公司的石油和天然氣及行業(yè)客戶,包括殼牌、雪佛龍、沙特阿美、英特爾和通用電氣等公司。
Pachyderm
CEO: Joe Doliner
掌握著當前一代大數(shù)據技術的初創(chuàng)公司Pachyderm,已經開發(fā)出了一種開源分析引擎,采用Docker容器做分布式計算。
這里的重點是提供了一個容器化、模塊化、可擴展的數(shù)據分析基礎設施,采用像Docker和Kubernetes這樣的工具作為構建塊。該公司的Pachyderm File System和Pachyderm Pipeline System軟件幫助數(shù)據經理和分析師構建機器學習通道和數(shù)據ETL(提取、轉換和加載)工作流程。
Pachyderm創(chuàng)建于2014年,位于舊金山,在今年6月的種子輪融資中獲得了200萬美元。
StreamSets
CEO: Girish Pancha
StreamSets是另外一家解決管理動態(tài)數(shù)據挑戰(zhàn)的公司。更具體地說,StreamSets開發(fā)的軟件防止“數(shù)據漂移”的潛在問題——數(shù)據在源頭的時候可能會遇到這種不可預測的突變情況,并在應用使用這些數(shù)據的時候出現(xiàn)問題。
StreamSets的StreamSets Data Collector軟件被用于在任何數(shù)據源和任何應用之間構建復雜的數(shù)據流。9月,StreamSets首次推出了StreamSets Dataflow Performance Manager用于管理數(shù)據流操作。
StreamSets位于舊金山,創(chuàng)建于2014年,創(chuàng)始人包括CEO Girish Pancha、前Informatica首席產品官、現(xiàn)首席技術官Arvind Prabhaker,以及前Cloudera的早期員工、工程負責人。
Striim
President and CEO: Ali Kutay
Striim創(chuàng)建于2012年,創(chuàng)始人包括來自Golden Gate Software、Oracle、Informatica、WebLogic以及其他知名數(shù)據管理公司的前高管。
Striim公司位于加州帕洛阿爾托,它的軟件將流數(shù)據集成與流操作智能結合到一個系統(tǒng)內,實現(xiàn)持續(xù)的查詢/處理和流式分析。11月,Striimfault了新版本軟件,可以配合Google Big Query、Kafka和MapR Technologies使用。
Striim在3月獲得了1000萬美元的額外資金,使其B輪融資的總金額得到了3000萬美元。
Stytch
CEO: Mark Cunningham
Stytch在4月首次推出了自己端到端的數(shù)據分析平臺,提供系統(tǒng)工具用于自助服務式的數(shù)據準備、數(shù)據建模、數(shù)據發(fā)現(xiàn)、報告和儀表板。Stytch得到了Dun & Bradstreet的支持,Stytch系統(tǒng)的主要賣點是它連接到了Dun & Bradstreet龐大業(yè)務數(shù)據庫。
這家位于溫哥華的公司創(chuàng)建與2015年8月。創(chuàng)始人、首席執(zhí)行官Mark Cunningham從1992年就涉足商業(yè)智能領域,當時他的家族企業(yè)開始開發(fā)Crystal Reports,一款早期的、非常成功的Windows報告工具。
Talena
CEO: Nitin Donde
Talena提供了“永遠在線”的大數(shù)據管理軟件,幫助企業(yè)保護有價值的數(shù)據資產,并基于關鍵業(yè)務應用快速迭代。Talena的技術提供了備份和恢復、測試和開發(fā)管理、以及跨Hadoop、NoSQL數(shù)據庫(例如Cassandra和Couchbase)以及現(xiàn)代數(shù)據倉庫(例如HPE Vertica)的歸檔能力。
今年3月Talena發(fā)布了針對大數(shù)據管理任務的ActiveRx預測分析基礎設施。該軟件解決了如何將機器學習用于預測數(shù)據可用性、如何將備份數(shù)據轉變?yōu)閯討B(tài)數(shù)據資產的問題。
Waterline Data
CEO: Alex Gorelik
隨著企業(yè)機構將基于Hadoop的數(shù)據湖聚合起來用于存儲海量數(shù)據,找到如何以最佳方式利用這些信息就變成一個重大挑戰(zhàn)——更不用說隨之而來令人頭疼的數(shù)據治理問題了。
Waterline Data解決了Smart Data Catalog軟件的問題,構建了一個完成的數(shù)據湖資產庫,改善了數(shù)據發(fā)現(xiàn)和數(shù)據監(jiān)管,讓企業(yè)更容易從這些資產中獲取價值。
Waterline Data創(chuàng)建于2013年,位于加州山景城,在1月的B輪融資中獲得1600萬美元。