大數(shù)據(jù)的大事件
隨著對數(shù)據(jù)管理和業(yè)務分析系統(tǒng)需求的不斷擴大,大數(shù)據(jù)技術領域也在不斷發(fā)生變化。如今的大數(shù)據(jù)系統(tǒng)更加自動化、更實時、更關鍵任務。企業(yè)越來越依賴這些系統(tǒng)來整合和分析分散在多個位置的數(shù)據(jù),包括本地和云中的數(shù)據(jù)。其中傳統(tǒng)的非結構化數(shù)據(jù)越來越少,而非結構化數(shù)據(jù)、機器數(shù)據(jù)、流數(shù)據(jù)和物聯(lián)網(wǎng)數(shù)據(jù)卻在迅速增加。
有很多技術型初創(chuàng)公司正在開發(fā)前沿的軟件和系統(tǒng)來滿足這些大數(shù)據(jù)需求。下面就讓我們來看看2017年大數(shù)據(jù)領域這10家引起了我們關注的初創(chuàng)公司。
DataRobot
CEO: Jeremy Achin
DataRobot開發(fā)了一種自動化的機器學習平臺,可獲取數(shù)據(jù)科學家的知識、經(jīng)驗和最佳實踐,并利用這些信息構建和部署預測模型,速度要遠遠快于以前所能實現(xiàn)的。有了這些模型,分析師就可以從海量數(shù)據(jù)中發(fā)現(xiàn)隱藏的機會并預測結果。
DataRobot公司位于波士頓,成立于2012年。在5月收購了Nutonian,另一家專注于時間序列分析模型的數(shù)據(jù)科學軟件開發(fā)技術公司,并得到了外界關注。
3月,DataRobot在C輪融資中獲得了5400萬美元,用于投資其合作伙伴生態(tài)系統(tǒng)。9月,DataRobot聘請了Alteryx高管Seann Gardiner擔任業(yè)務開發(fā)高級副總裁。
DataScience
CEO: Ian Swanson
如今數(shù)據(jù)科學家是很短缺的,對于很多數(shù)據(jù)驅動型公司老說,最好地利用他們的人才是一個主要目標。
DataScience提供的DataScience Cloud企業(yè)平臺,通過工程任務自動化、簡化工作流、提供工具、庫和技能來發(fā)揮他們數(shù)據(jù)科學團隊的價值。
DataScience成立于2014年,位于加州卡爾弗市。10月,該公司與大數(shù)據(jù)平臺廠商MapR Technologies開發(fā)一個聯(lián)合解決方案,可以在MapR系統(tǒng)上運行數(shù)據(jù)科學實驗,從而為新一代以數(shù)據(jù)為驅動的應用提供支持。
Endor
CEO: Doron Alter
Endor開發(fā)了一個預測分析平臺,可以讓企業(yè)用戶詢問任何問題,例如“誰有可能嘗試這種新產(chǎn)品?”以及“我們應該在哪里開設我們的下一家商店?”,并且在幾分鐘內(nèi)得到答案。
Endor的專有技術是基于來自麻省理工學院研究的“社會物理學”。雖然機器學習很擅長預測,但是當設備關鍵部分發(fā)生故障的時候,社會物理學就會利用大數(shù)據(jù)分析和生物學的數(shù)學模型來了解人類群體的行為。
Endor(是的,它的名字和星球大戰(zhàn)中的行星名字相同)成立于2014年,位于以色列特拉維夫。今年,Gartner將該公司評為商業(yè)智能領域中的“酷廠商”,“世界經(jīng)濟論壇”則將其命名為技術先驅。
FlyData
創(chuàng)始人: Koichi Fujikawa
AWS的Redshift云數(shù)據(jù)倉庫系統(tǒng)正在成為構建復雜和昂貴本地數(shù)據(jù)倉庫的主流替代方案,但是仍然存在將數(shù)據(jù)從企業(yè)運營數(shù)據(jù)庫提取到Redshift的挑戰(zhàn)。
FlyData開發(fā)了一款簡單的、自動化的數(shù)據(jù)集成系統(tǒng),用于建立一個Redshift集群,并在MySQL數(shù)據(jù)庫中復制數(shù)據(jù)到Redshift。FlyData的產(chǎn)品包括FlyData Autoload和FlyData Sync。
盡管這家位于加州帕洛阿爾托的公司成立于2011年,但是到了今年9月才在A輪融資中獲得400萬美元資金。
Gluent
CEO: Tanel Poder
Gluent的使命是將數(shù)據(jù)從專有數(shù)據(jù)孤島中“解放”出來,使得可以通過新的、分布式大數(shù)據(jù)系統(tǒng)訪問這些數(shù)據(jù)。
Gluent開發(fā)的數(shù)據(jù)虛擬化技術能夠實現(xiàn)這家位于達拉斯的初創(chuàng)公司所謂的“混合數(shù)據(jù)”計算。Gluent Data Platform將數(shù)據(jù)從傳統(tǒng)關系型數(shù)據(jù)庫系統(tǒng)卸載到Hadoop,同時仍然提供對這些數(shù)據(jù)的訪問。
Gluent的系統(tǒng)讓企業(yè)能夠利用基于云或者本地Hadoop集群的靈活性和可擴展性,同時提高隊列性能,降低SAN和關系型數(shù)據(jù)庫許可成本。
Gluent成立與2014年底,被Gartner評為數(shù)據(jù)管理領域的“酷廠商”,并在3月Strata + Hadoop World Startup Showcase獲得第二名。
Incorta
CEO: Osama Elkady
Incorta的使命是用它面向實時分析和運營報告的數(shù)據(jù)平臺,取代傳統(tǒng)數(shù)據(jù)倉庫系統(tǒng)了ETL(提取、轉換和加載)工具。
Incorta的軟件利用該公司所謂的“直接數(shù)據(jù)映射”引擎,該引擎執(zhí)行復雜的數(shù)據(jù)連接,實時聚合大量數(shù)據(jù)。
Incorta成立于2013年,位于加州圣馬特奧,在9月由Kleiner Perkins領投的B輪融資中獲得1500萬美元。此前Incorta在3月的A輪融資中獲得來自GV(前Google Ventures)等投資方的1000萬美元。
InfluxData
CEO: Evan Kaplan
InfluxData開發(fā)了一系列開源技術,可以解決管理物聯(lián)網(wǎng)網(wǎng)絡和其他系統(tǒng)實時序列數(shù)據(jù)流的問題。
InfluxData的平臺提供了一系列工具和服務,包括InfluxData時間序列數(shù)據(jù)庫,用于實時處理物聯(lián)網(wǎng)、DevOps監(jiān)控和實時分析等領域的時間序列數(shù)據(jù)。
InfluxData位于舊金山,成立于2012年,在3輪融資中累積獲得將近2500萬美元資金。8月,該公司成為AWS合作伙伴網(wǎng)絡的高級技術合作伙伴。
Naveego
CEO: Derek Smith
為了運營和分析的目的,企業(yè)正在大力投資大數(shù)據(jù)項目。但是,如果采用的數(shù)據(jù)質量不佳,那么這些項目注定要失敗。
Naveego基于云的軟件提供了數(shù)據(jù)質量和主數(shù)據(jù)管理工具,幫助企業(yè)監(jiān)控和管理其業(yè)務數(shù)據(jù)的質量——不管是在本地還是在云中——并利用它來獲得競爭優(yōu)勢。
Naveego成立于2013年,位于密歇根州特拉弗斯市,在10月推出了第一個渠道計劃,并在招募數(shù)據(jù)管理顧問、系統(tǒng)集成商和管理服務提供商。
Nexla
CEO: Saket Saurabh
Nexla開發(fā)的數(shù)據(jù)運營平臺利用機器學習技術監(jiān)控和調整數(shù)據(jù),并實時地在公司之間安全遷移數(shù)據(jù)。Nexla認為,通過將這些數(shù)據(jù)操作自動化,可以更快速地從他們的數(shù)據(jù)中獲得價值。
Nexla創(chuàng)建于去年,位于加州Millbrae,剛剛在5月發(fā)布了其產(chǎn)品的公開測試版。同時,Nexla在種子融資中獲得了350萬美元。
Nexla在3月的Strata + Hadoop World大會上獲得了創(chuàng)業(yè)展示最高獎項,引起人們的關注。
Periscope Data
CEO: Harry Glaser
Periscope Data的核心產(chǎn)品——Periscope Data Analytics——讓用戶可以對保存在多個系統(tǒng)中的數(shù)據(jù)運行SQL查詢,并且生成可以在整個公司分享的交互式儀表板和圖表。
11月,Periscope Data發(fā)布了Unified Data Platform,并稱該平臺解決了完整的分析生命周期,讓數(shù)據(jù)團隊可以獲取、存儲、分析、可視化和報告數(shù)據(jù)。
Periscope Data創(chuàng)建于2012年,位于舊金山,公司內(nèi)有不少經(jīng)理是來自于Google和微軟。8月,Periscope Data宣布自2016年以來每年的經(jīng)常性收入增長了322%。