對于大數據來說,業界這幾周算是比較忙碌的。因為很多初創公司和一些老牌的公司都推出了數據分析和數據管理產品,以及更新了現有產品,提供更豐富的功能與性能。
雖然這些技術都還只是藍圖規劃,但是一些常見的主題還是對其貫穿始終:為用戶提供簡單的獲得數據的訪問方式,更好的管理大規模數據以及預先分析的功能,例如Spark、HAWQ 和 Geode等新興的大數據技術來實現更多的功能。
下面一起來看看吸引眼球的十五項大數據公告。雖然羅列了很多,但還不是全部內容,只是最近在加利福尼亞州圣何塞市Strata + Hadoop World大會上亮相的部分技術。
Altiscale Insight Cloud
Altiscale作為大數據服務的提供者,最近推出了Altiscale Insight Cloud產品,是一個自主服務型的數據分析服務產品,能夠幫助業務分析人員使用BI工具等類似于Tableau和Excel的產品,實現快速的數據湖查詢,而不需要IT部門投入過多的精力參與。
Altiscal Insight Cloud可以驅動SQL查詢、動態可視化、實時儀表板和其他報告及分析能力。它不再因為聚合數據而需要一個單獨的關系數據存儲,繞過了價格昂貴的、專屬的數據庫系統。
Altiscale還與Tableau建立了一個戰略聯盟,能夠讓Altiscale客戶通過使用Tableau的數據可視化軟件與Altiscale服務結合的產品,而實現數據發現的應用服務。
AtScale Intelligence Platform 4.0
AtScale軟件提供了一種使用流行的商業智能工具的方法,包括Tableau和Qlik,可以訪問存儲在Hadoop集群中的數據。該軟件創建了Hadoop和第三方工具之間的語義層級,從本上來說,通過聯機分析處理服務器而實現多維分析的方法。
4.0版本提供了多達100項的新功能和系統改進,其中許多都與企業的安全和性能有關。
新AtScale Hybrid Query Service(AtScale混合查詢服務),是可以在本地實現支持SQL和MDX查詢語言的商業智能工具。由于許多企業和組織在其整個組織中使用多種 BI工具,所以說AtScale對于SQL和MDX的支持也就意味著這些企業不需要在其用戶的電腦中下載新的客戶端軟件或者自定義驅動了。
BlueData EPIC Spring Release
BlueData EPIC是一個大數據即服務平臺,旨在減少實施大數據技術的復雜性,例如Hadoop 和Spark。
EPIC發布的春季版本中提供了幾十種的新性能和功能改進,包括在多租戶部署中提高服務的安全性和服務質量。該清單包括更多的顆粒資源管理控制、基于QoS的分配、性能優化和用于多租戶部署的配額執行功能。
新版本還支持更大范圍的大數據的應用程序和工具,包括用于數據管理和安全管理的Cloudera Navigator以及Ranger,用于大規模并行處理分析的HAWQ,以及Geode、Cassandra和用于實時分析的Kafka。
Domo商務云
Domo 商務云是一個對于商務管理應用的生態系統,包括免費和付費的預包裝,為企業決策者提供數據、見解和訪問的支持,以及所有可以幫助找到商務問題的答案,甚至是特定行業和特定角色中。該公司提供云計算的免費版本,如果用戶需要存儲更多的數據或者獲取更先進的企業功能,例如行政管制得話需要另行付費。
Domo最近還推出了應用商店,帶有1000多個商務管理應用以擴張商務云系統,并開始了Domo應用發布合作伙伴計劃,為第三方獨立軟件開發商開發商務云軟件。
Domo 同時還推出了Buzz,是與商務云一起工作的社交協作平臺,以及允許商務云訪問任何移動設備的Domo Mobile產品。
Kyvos Insights With Azure HDInsight
Kyvos Insights的旗艦產品運行在Hadoop系統上,并允許企業用戶通過可視化,探索和分析的存儲在Hadoop中大數據的可大規模擴展的聯機分析處理(OLAP)系統。
該Kyvos軟件現在與Azure的HDInsight協同工作,微軟基于云計算的Hadoop的平臺,可以幫助Azure HDInsight用戶通過部署Kyvos從而實現分析任務。
IBM云數據服務的Looker Blocks
Looker為基于Web的商業智能平臺提供了訪問駐留在數據庫中或者云中的數據。去年,該公司推出了被稱為Looker Blocks的可復用、可定制的業務邏輯組件,可以創建完整的業務分析查詢功能。
Looker與IBM合作開發了一套Looker Blocks組件,通過利用IBM的云數據服務實現更加簡化和可定制的數據分析服務。根據這兩家公司所稱,該組合將允許客戶在數天內部署一個完整的數據平臺。
MapD Technologies GPU-Powered Database
MapD Technologies推出了新的數據庫和可視化分析軟件,利用圖形處理單元芯片幫助數據分析師交互式地探索大型數據集。
通過利用GPU的強大動力,數據庫可以在每臺服務器將近4000個核上并行查詢,比領先的內存數據庫提供更快的性能。使用帶有MapD Immerse分析前端工具的數據庫可以更快的處理復雜數據庫的可視性問題。(例如政治捐款,在此地圖上就可以看到數據)。
MemSQL 5
MemSQL開發了其同名的數據庫,用于事務處理和實時分析。在該公司公布的最新版本MemSQL 5中,提供了一系列的新技術和增強的功能,以提高軟件的數據庫、數據倉庫和流媒體的工作負載性能。
在新版本中,通過混合的事務處理或者分析處理將事務和分析合并成一個單一的數據庫,以支持OLTP和OLAP查詢。用戶可以在大量的寫入負載中實現實時查詢。借助于可插拔的認證模塊以及類似于Kerberos的工具提高了安全性。用戶可以通過使用MemSQL Streamliner來部署Apache Spark,創建了用戶可視化界面的實時數據管道,同時消除了批量的ETL任務。
Paxata Spring ’16 Release
Paxata的自適應數據準備平臺,建立在Apache Spark之上,運行在最優化的Hadoop環境中,提供了數據集成、數據質量、語義豐富、協作和管理能力。
新版本提高了軟件的能力,通過先進filtergrams綜合數據分析,跨越列寬數據集的細粒度搜索,對于數據發現與統計選項的新的選擇,以及在Hadoop壓縮文件下集成復雜的嵌套JSON/XML數據,為用戶提供了連接信息的能力。
該版本還包括新的IT控制,以提高系統的管理、安全性和規模。
Platfora Big Data Discovery 5.2
Platfora是一個很大的數據發現平臺,建立本地的Apache Hadoop 和Spark。最新的版本”democratizes(民主化)”大數據,使其更容易使用現有的商業智能工具來訪問Hadoop數據。
新版本提供了本地Tableau直接出口,用以準備和豐富數據集成的Tableau (畫面數據提取)數據到Tableau桌面和Tableau服務器中。其他前端BI工具可以通過lens-accelerated SQL訪問Platfora數據,通過SparkSQL和ODBC處理查詢。
Platfora5.2也直接運行在Hadoop集群上,除了傳統的專用配置外,可以助其更容易地利用現有的硬件,并重新調整計算資源。用于數據可視化的Platfora Vizboard已經得到增強,能夠”更加智能化”的默認可視化效果。
Ryft One Cluster
Ryft系統開發的硬件/軟件設備,使用FPGA的并行處理能力處理器加速了tb和pb級別的數據分析能力。
新版的Ryft One Cluster使用帶有開放API接口的混合FPGA / x86計算架構,該公司表示,這可以實現以100倍的速度加速大數據生態系統的發展,同時降低70%的成本。
新系統擴展了數據分析性能和存儲線性,處理分析速度達到每秒200GB以上。它可以作為一個獨立的群集或作為現有的Apache Spark系統或其他大數據生態系統的一部分工作。
Tableau 9.3
Tableau公布了Tableau 9.3全面上市,在最新的版本中,其最受歡迎的數據可視化軟件可以永久地連接桌面功能和Snowflake Elastic Data數據倉庫。
Tableau Desktop 的”一直連接”功能可以更容易的與他人分享結果,同時留存在流動的分析過程中。該軟件的全球地圖覆蓋功能獲得了顯著地提升,新數據添加到了地址解析數據庫和Tableau Map Service中。
在9.3版本中,本地連接到本機連接到Snowflake Computing的云數據倉庫系統更易于Tableau用戶執行簡單和復雜數據探索和分析。這兩家公司還將繼續合作,幫助客戶將他們的業務分析過程轉移到云端。
Talena ActiveRx
Telena的軟件是用于在測試和開發、備份和恢復、歸檔和法規遵從和災難恢復系統中優化數據。
Talena最近推出了ActiveRx,是一款新的預測分析軟件,它采用機器學習算法和數據可視化,以更好地管理大數據的管理工作負載,和更準確地預測數據的可用性。
ActiveX軟件還提供了”驅動副本分析”功能,企業可以用它來把閑置的備份數據轉換成有用的資產。
Tamr Apache Spark Compatibility
Tamr的數據統一平臺擁有豐富的企業的數據 ,匯聚了從企業內部和外部的數百甚至數千數據源進行分析。
Tamr宣布其軟件可與Apache Spark兼容,其內存處理引擎可用于擴展機器學習,Tamr表示,其補充了機器驅動方式以備企業數據之需。
Tamr也在開發開放的接口和核心組件來支持由Spark驅動的數據監護系統。
Trifacta Photon
Trifacta開發了”數據爭論”軟件,揭開了光子計算框架,新技術的核心用戶界面,在大規模的內存數據集時為用戶提供了豐富的交互式數據探索和轉型的經驗。
數據爭論是原始數據的轉化過程,將復雜的數據轉換成清潔的,結構化的數據轉化成可分析的,這是數據分析過程中最具有挑戰性的一個部分。
Photon產品符合Apache Arrow內存數據架構的說明要求,在與數據內容交互的時候為用戶提供了即時的反饋。Photon 引擎在更高水平的計算中實現更多的數據探索。