火爆的市場和酷酷的技術
據市場研究公司IDC聲稱,去年,大數據和業務分析應用軟件、工具和服務的銷售額達到了近1220億美元,到2019年會猛增50%以上,達到1870億美元。
所以,難怪新的大數據產品源源不斷地涌向市場,既有來自老牌企業的,也有來自初創公司的。
下面這10種大數據產品在2016年上半年引起了我們的注意。其中一些(但不是所有產品)是在3月份的Strata + Hadoop World大會或6月份的Hadoop峰會上亮相的。
AtScale Intelligence Platform 4.0
AtScale開發的軟件讓業務用戶有辦法使用已有,并且熟悉的應用軟件和業務分析工具,包括微軟Excel、Tableau和QlikView,訪問Hadoop集群中的數據。
AtScale Intelligence Platform 4.0于3月份發布,它提供了公司所說的“混合查詢服務”,這項技術可以通過任何商業智能工具,使用MDX或SQL――這是查詢數據庫系統中數據的兩大語法,直接查詢Hadoop。
4.0版本還借助“真正的授權”技術,解決安全和數據治理問題。該技術確保在Hadoop上執行的查詢符合數據治理和數據訪問審計等策略。
BlueData EPIC For Cloud Deployments
由于復雜性和成本,大數據產品常常停留于試點階段。BlueData Software的EPIC平臺旨在讓用戶更容易部署用于開發和生產環境的Hadoop和Spark基礎設施及應用軟件。
就在不久前,企業版的BlueData EPIC只適用于本地部署。而在6月份,該公司發布了面向云部署的BlueData EPIC,該公司稱之為“大數據即服務”。
BlueData Epic企業版現處于該公司所說的“針對性可用”階段――數量有限的早期采用客戶,僅限于亞馬遜網絡服務(AWS)平臺。今后幾個月將會推出適用于AWS以及微軟Azure、谷歌云平臺及其他公共云服務的公眾版。
Confluent Platform 3.0
處理實時流數據是大數據領域的最大挑戰之一。為處理這個問題而出現的一項關鍵技術就是Apache Kafka,這種開源消息代理項目為處理實時數據提供了高吞吐量、低延遲的軟件。
Confluent于2014年9月份成立,由Kafka的早期開發人員創辦,他們旨在利用開源軟件,幫助公司獲得流數據的價值。Confluent Platform基于Kafka而建,這種實時數據系統充當容錯、高擴展性的消息傳遞系統。它可以從眾多來源收集數據,比如用戶活動日志、設備儀器、股票行情自動收錄器系統及其他使用場合。
5月份,這家初創公司發布了Confluent Platform 3.0,這個主要版本引入了Kafka Streams,這是用于構建分布式流處理應用程序的Java庫。3.0版本還包括用于管理Kafka環境的Confluent Control Center,這是該公司的首款商用產品。
Datameer 6.0和Datameer Cloud
Datameer開發的一種大數據分析平臺為用戶提供了數據整合、準備、分析和可視化等方面的自助式功能。
Datameer 6.0于5月份發布,它提供了一種新的用戶界面和下一代分析工作流程,該公司稱,這讓數據整合、準備、分析和可視化等步驟成為單一的、流暢的交互式過程,同時改進了數據發現。
該公司還推出了Datameer Cloud,這種基于云的數據準備和分析服務在微軟的Azure HDInsight上運行,由Datameer全面管理。
DataStax Enterprise 5.0、OpsCenter 6.0和Enterprise Graph
DataStax是NoSQL數據庫領域的領導廠商,它為云計算和數據密集型應用提供了基于Apache Cassandra數據庫的軟件。
該公司在2016年很忙碌。6月份發布的DataStax Enterprise(DSE)5.0包含物聯網和零售等應用尤其需要的高級復制功能。它還包含更新版的Apache Spark,面向高級搜索和分析領域。
4月份發布的DSE Graph作為DSE的一個選項來提供,它是一種可擴展的實時圖形數據庫,用于需要由許多應用軟件來管理復雜數據集的應用環境。
同樣在6月份,該公司發布了DataStax OpsCenter 6.0,這款面向DSE的可視化監控和管理系統提供了數據庫監控、調優、配置、備份和安全等功能。
DGSecure 6.0
Dataguise開發的以數據為中心的安全系統用來識別并保護企業最敏感的結構化和非結構化數據,無論數據駐留在何處,從傳統關系數據庫到Hadoop等大數據存儲系統,不一而足。
DGSecure 6.0于6月份發布,它包含面向數據治理、隱私合規和風險緩解等任務的新功能,包括制定數據安全治理策略。軟件包含一個新的儀表板,可用于可視化顯示數據泄密風險、確保遵從隱私政策。
Information Builders的WebFocus Business User Edition
Information Builders的WebFocus歷來是該公司的旗艦商業智能產品。但是企業版軟件歷來面向為經理和工人提供商業智能報表的IT部門和開發人員。
如今業務分析領域的口號是“自助式”,為用戶提供用來自行發現、準備和分析數據的大數據工具。6月份,IBI宣布推出WebFocus Business User Edition(BUE),該產品讓不懂技術的用戶無需IT或商業智能開發人員的幫助,就可以輕松生成和共享報表、儀表板及數據可視化工具。
WebFocus BUE軟件包括:面向不懂技術的用戶的InfoAssist+自助式分析創作工具,用于管理內容和組裝分析頁面的BUE Portal,以及面向高速數據發現的列式存儲工具。
基于瀏覽器的軟件是為包括100個用戶的群組設計的,它在今年年初推出了限量版。
Koverse 2.0
初創公司Koverse提供一種“一體化數據湖”平臺,因而可以大大加快收集大數據,并引入到生產環境的速度,而成本低于當前的技術和方法。
總部位于西雅圖的這家公司創辦于2012年,該技術的早期版本已在兩年多前亮相。Koverse平臺2.0于6月21日發布,它整合了Apache Accumulo“分布式鍵/值存儲”技術和該公司的通用索引引擎(Universal Indexing Engine)。
Koverse保證,它可以在一個月內將一家公司的大數據引入到生產環境――這比過去構建數據倉庫所花的時間要短得多。
SAS Viya
Viya是一種新的分析和可視化平臺,可以在私有云或公共云環境中運行。SAS在4月份發布了下一代軟件,這是它首次真正涉足云計算,并為SAS未來的業務分析軟件提供了基礎。
不僅可使用SAS自己的編程語言來訪問該平臺,還可以使用包括Python、Luya和Java在內的其他語言來訪問,使用支持性的公共REST API也可以訪問。
該軟件目前針對早期采用者,會在這個季度面向大眾發布。SAS計劃今年針對Viya平臺發布的應用軟件包括: SAS Visual Analytics、SAS Visual Statistics、SAS Visual Investigator、 SAS Visual Data Mining以及Machine Learning。
Splice Machine RDBMS走上開源道路
Splice Machine提供的數據庫系統結合了傳統關系數據庫技術的一些方面、下一代NoSQL數據庫的可擴展性以及內存系統的高性能。該數據庫整合了HBase、Hadoop和Spark等技術,可以執行事務處理和業務分析等任務。
6月份,Splice Machine邁出了大膽的一步:讓其數據庫成為一種開源技術。聯合創始人兼首席執行官蒙特·茲韋本(Monte Zweben)表示,走開源道路的目的是,吸引更多的開發人員關注Splice Machine平臺,進而為該數據庫構建更多的下一代應用程序。
除了企業版外,Splice Machine還將提供軟件的開源社區版,到時擁有更多的功能特性,收取許可費。