市場研究公司W(wǎng)ikibon數(shù)據(jù)表明,2013年大數(shù)據(jù)市場份額是186億美元,其中22%(大約41億美元)是軟件市場份額。(服務(wù)的市場份額是40%,硬件是38%。)Wikibon預(yù)計(jì),2014年大數(shù)據(jù)市場份額將達(dá)到285億美元,到2017年將達(dá)到501億美元。
如此看來,每天都有大數(shù)據(jù)產(chǎn)品問世就變得順理成章了。以下將為讀者展示2014上半年最具吸引力的十大大數(shù)據(jù)產(chǎn)品。
Cloudera Enterprise 5
CEO:Tom Reilly
4月,Cloudera發(fā)布了Cloudera Enterprise 5,這是企業(yè)級數(shù)據(jù)管理平臺。
Cloudera Enterprise 5包括YARN,Hadoop 2.2的高級資源管理技術(shù),管理多種資源。新的數(shù)據(jù)控制和報(bào)告,審計(jì)提升了軟件的管理能力和兼容性。通過集中部署Cloudera Manager和Cloudera Navigator,軟件的安全性和數(shù)據(jù)保護(hù)能力得到很到改善。
Databricks Cloud
CEO: Ion Stoica
大數(shù)據(jù)領(lǐng)域最近具有重要意義的開發(fā)產(chǎn)品5月份發(fā)布的Apache Spark,這是一款開源內(nèi)存處理器。該產(chǎn)品的發(fā)布讓Hadoop大數(shù)據(jù)平臺的數(shù)據(jù)分析性能的壓力倍增。
Databricks是由Spark的開發(fā)者成立的,該公司的最新產(chǎn)品是Databricks Cloud,它是基于Spark技術(shù)的。主機(jī)平臺還在測試中,簡化的Spark套件和配置,并且內(nèi)置了訪問和分析數(shù)據(jù)的應(yīng)用。用戶可以使用Databricks Cloud來加速處理和分析存儲在亞馬遜S3中的數(shù)據(jù)。
DataStax Enterprise 4.5
CEO: Billy Bosworth
DataStax面臨著很多來自O(shè)racle數(shù)據(jù)庫和微軟下一代數(shù)據(jù)庫架構(gòu)SQL服務(wù)器的挑戰(zhàn)。DataStax開發(fā)了基于Apache Cassandra的DataStax Enterprise (DSE)分布式的、NoSQL數(shù)據(jù)庫管理系統(tǒng),該系統(tǒng)通過大量商用服務(wù)器可以管理巨大數(shù)量的數(shù)據(jù)。
DSE4.5結(jié)合了Apache Spark內(nèi)存處理技術(shù),來實(shí)現(xiàn)DSE的實(shí)時(shí)數(shù)據(jù)分析功能。新的自動化的診斷和性能調(diào)整工具提高了軟件管理的服務(wù)能力。該產(chǎn)品通過與Cloudera和Hortonworks合作,首次整合了Hadoop,提供了融合Cassandra和Hadoop數(shù)據(jù),以及其他來源數(shù)據(jù)的能力,這讓合并正在使用的數(shù)據(jù)和歷史數(shù)據(jù)進(jìn)行分析成為可能。
Guavus Reflex 2.0
CEO: Anukool Lakhina
Guavus的Guavus Reflex Operational Intelligence Platform(智能操作平臺)可以提供實(shí)時(shí)的業(yè)務(wù)分析。
剛剛發(fā)布的Reflex 2.0,可以支持Apache Spark。該軟件適合服務(wù)供應(yīng)商和大型數(shù)據(jù)中心運(yùn)營商,適用一下應(yīng)用:需要分析網(wǎng)絡(luò)數(shù)據(jù)來檢測系統(tǒng)異常,識別和避免欺詐行為,以及應(yīng)答客戶在線需求等。
Hortonworks Data Platform 2.1
CEO: Rob Bearden
Hortonworks發(fā)布了Hadoop分布平臺的最新版本,添加了新的SQL查詢技術(shù)來提高Hadoop應(yīng)用查詢的速度和規(guī)模。為了提高Hadoop,Apache Knox安全性,HDP 2.1還使用了Apache Falcon技術(shù)。
MongoDB 2.6
CEO: Max Schireson
MongoDB是為了幫助企業(yè)管理大量非結(jié)構(gòu)化數(shù)據(jù)而生的。MongoDB 2.6提供了新的文本搜索功能,并為ad-hoc分析提供了工具,擴(kuò)展了安全功能,是操作大量數(shù)據(jù)卷和聚集數(shù)據(jù)的工具,簡化了MongoDB Management Services的管理,提供了可靠性和安全性。
Numerify 360 for IT
CEO: Gaurav Rewari
IT管理者需要業(yè)務(wù)分析。遵循這個(gè)理念,Numerify發(fā)布了基于云計(jì)算的Numerify 360 for IT,這是一款應(yīng)用總控,使用分析來提供管理能力。
利用ServiceNow產(chǎn)生的數(shù)據(jù),作為平臺即服務(wù)的管理應(yīng)用,Numerify 360 for IT整合了來自操作和金融系統(tǒng)的數(shù)據(jù)到云數(shù)據(jù)倉庫。
SAS In-Memory Statistics for Hadoop
CEO: Jim Goodnight
SAS基于供應(yīng)商的內(nèi)存技術(shù)來開發(fā)的這款Hadoop架構(gòu)的交互分析程序環(huán)境,內(nèi)存性能為試圖管理、挖掘、抽取和分析Hadoo中大量數(shù)據(jù)卷的用戶提供了更多的性能動力。
SAS In-Memory Statistics for Hadoop 支持多種統(tǒng)計(jì)和機(jī)器學(xué)習(xí)模型技術(shù)。
SiSense 5
CEO: Amit Bendov
SiSense的這款軟件讓用戶可以發(fā)掘大量數(shù)據(jù)的價(jià)值。該產(chǎn)品的主要功能是把各種來源的大量的數(shù)據(jù)集放到一個(gè)數(shù)據(jù)庫中來分析。
2月,發(fā)布了SiSense 5,現(xiàn)在這個(gè)軟件可以裝到平板電腦上,智能手機(jī)上和其他移動設(shè)備上。該版本依賴“In-Chip”分析技術(shù)。
Splice Machine Hadoop RDBMS
CEO: Monte Zweben
5月,Splice Machine發(fā)布了大家期待已久的Hadoop實(shí)時(shí)數(shù)據(jù)庫,該數(shù)據(jù)庫有助于業(yè)務(wù)避開Hadoop的批量分析限制,提供全功能的,交易SQL數(shù)據(jù)庫,以便能夠運(yùn)行操作應(yīng)用,并進(jìn)行實(shí)時(shí)分析。
相對于傳統(tǒng)關(guān)系數(shù)據(jù)庫來說,Splice Machine認(rèn)為自己是一個(gè)兩全其美的選擇,企業(yè)在不放棄自己的SQL技術(shù)的同時(shí),可以利用其產(chǎn)品架構(gòu)和應(yīng)用構(gòu)建實(shí)時(shí)應(yīng)用。