分析公司IDC預計,數據總量將從2016年的16.1ZB增長到2025年的163ZB。所以根據調研公司MarketsandMarkets的預計,對管理這些數據并讓這些數據變得更有價值的大數據軟件和服務需求將以每年超過18%的速度增長。
大數據領域有很多專注于提供解決連接分散數據源、將數據遷移到云以便更輕松地訪問和分析等問題的解決方案。此外,在大數據軟件中將機器學習與其他人工智能技術相融合,使其比現在更智能,這個趨勢也越來越明顯。
下面就是2017年上半年值得我們關注的、最酷的10家大數據初創公司:
AtScale
CEO: Dave Mariani
在收集和管理大數據方面,Hadoop也許很流行,但是訪問這些數據、分析數據并從數據中提取價值就會遇到一些問題。
AtScale開發的軟件能夠讓Tableau和Qlik這樣受歡迎的商業智能工具來訪問保存在Hadoop集群中的數據,實際上它將Hadoop變成了一臺在線分析處理服務器,可以用于多維度的分析。
AtScale公司創建于2013年,位于加州圣瑪特奧,它為自己的計算引擎能力申請了專利,這種引擎能夠與任何BI可視化工具相提并論。6月,該公司發布了AtScale 5.5,新增功能包括高可用性部署、預定義的聚合、支持復雜業務用例和分析模型。
DataRobot
CEO: Jeremy Achin
機器學習很熱,創建于2012年的DataRobot公司專門開發一種自動化機器學習平臺,獲取數據科學家的經驗和最佳實踐,并利用這些信息構建和部署預測模型,時間遠遠短于使用傳統工具和技術。
位于波士頓的DataRobot公司,在今年5月收購了Nutonian——另一家專注于時間序列分析模型的數據科學軟件開發商。
3月,DataRobot在C輪融資中獲得了5400萬美元,總融資金額超過1.2億美元。
DataScience
CEO: Ian Swanson
如今數據科學家是很搶手且短缺的,所以企業正在尋求以各種方式最大限度地利用數據科學家的時間,充分發揮他們的才能。
DataScience提供的企業級數據科學平臺將工具、庫和語言與IT基礎設施和業務工作流結合起來。5月發布的廣泛更新,提供了本地或者云部署選擇——后者是跨多個云服務提供商——以及安全性、定制工作流,且支持更廣泛的數據科學編程語言。
DataScience創建于2014年,位于加州卡爾弗市。6月,DataScience與開源人工智能系統開發商H2O.ai達成聯盟,此舉將讓數據科學家利用DataScience平臺部署人工智能和深度學習模型。
Endor
CEO: Doron Alter
Endor開發了一個預測分析平臺,可以讓企業用戶詢問任何問題,例如“誰有可能嘗試這種新產品?”以及“我們應該在哪里開設我們的下一家商店?”,并且在幾分鐘內得到答案。
Endor的專有技術是基于來自麻省理工學院研究的“社會物理學”。雖然機器學習很擅長預測,但是當設備關鍵部分發生故障的時候,社會物理學就會利用大數據分析和生物學的數學模型來了解人類群體的行為。
Endor(是的,它的名字和星球大戰中的行星名字相同)成立于2014年,位于以色列特拉維夫。今年,Gartner將該公司評為商業智能領域中的“酷廠商”,“世界經濟論壇”則將其命名為技術先驅。
Gluent
CEO: Tanel Poder
Gluent開發的數據虛擬化技術能夠實現這家位于達拉斯的初創公司所謂的“混合數據”計算。Gluent Data Platform將數據從傳統關系型數據庫系統卸載到Hadoop,同時仍然提供對這些數據的訪問。
Gluent的系統讓企業能夠利用基于云或者本地Hadoop集群的靈活性和可擴展性,同時提高隊列性能,降低SAN和關系型數據庫許可成本。
Gluent被Gartner評為數據管理領域的“酷廠商”,并在3月Strata + Hadoop World Startup Showcase獲得第二名。
Iguazio
CEO: Asaf Somekh
Iguazio Continuous Analytics Data Platform簡化了大數據、物聯網和云原生應用的業務分析流程,將不同的數據類型和工作負載進行統一。
Iguazio系統通過多個協議和行業標準API創建了一個統一的數據模型,后者包括兼容Amazon的流和表格、對象和文件API。任何類型的數據都以歸一化和搜索優化的形式保存一次,動態轉換,無需拷貝、ETL流程和復雜的數據管道。
Iguazio創建于2014年,位于以色列荷茲利亞,被Gartner評為2017年數據管理領域的“酷廠商”。
Maana
CEO: Babur Ozden
Maana開發它所謂的“以知識為核心的”數據搜索和發現軟件。Maana Knowledge Platform從多個分散的系統或者“孤島”收集數據,并將其轉換為可被業務線應用采用的運營洞察。
在Maana系統的核心,是它的Knowledge Graph專利技術及算法,提供了對業務希望優化的資產或者流程的一體化視圖。Maana的關注點主要是在石油和天然氣行業的行業應用和客戶。Maana最大的投資方是能源公司,包括殼牌、雪佛龍和沙特阿美公司。
Maana創建于2012年,位于加州帕洛阿爾托,最近被評為世界經濟論壇的技術先驅之一。
Nexla
CEO: Saket Saurabh
Nexla開發的數據運營平臺利用機器學習技術監控和調整數據,并實時地在公司之間安全遷移數據。Nexla認為,通過將這些數據操作自動化,可以更快速地從他們的數據中獲得價值。
Nexla創建于去年,位于加州Millbrae,剛剛在5月發布了其產品的公開測試版。同時,Nexla在種子融資中獲得了350萬美元。
Nexla在3月的Strata + Hadoop World大會上獲得了創業展示最高獎項,引起人們的關注。
Panoply.io
CEO: Yaniv Leven
Panoply.io開發的基于云的數據倉庫系統,可以全面全自動化做復雜且耗費時間的數據準備、建模和管理流程。
Panoply的系統與AWS Redshift服務協作,結合機器學習與自然語言處理以執行很多通常由數據工程師、服務器開發者以及數據科學家做的工作,通過減少編碼時間和數據轉換工作節省大量時間。
Panoply.io創建于2015年,位于以色列特拉維夫。
Periscope Data
CEO: Harry Glaser
Periscope Data的軟件連接多個數據庫,讓用戶可以對保存在多個系統中的數據運行SQL查詢,并且生成可以在整個公司分享的交互式儀表板和圖表。Periscope Database Cache是一種具有柱狀存儲的分布式架構,是Periscope系統中的關鍵技術。
Periscope Data創建于2012年,位于舊金山,在2016年11月的B輪融資中獲得2500萬美元。