12月9日,阿里云宣布數據庫產品 HybridDB 正式商業化。
HybridDB(ApsaraDB HybridDB)是一款在線MPP大規模并行處理數據倉庫的服務。它基于 Pivotal 公司的開源數據庫項目 Greenplum Database 開發,并由阿里云數據庫團隊在云計算架構下深度擴展。
該服務支持了OSS存儲、JSON數據類型、HyperLogLog預估分析等功能特性。通過符合SQL2008標準查詢語法及OLAP分析聚合函數,提供靈活的混合分析能力。提供在線擴容、備份、性能監測等服務。
阿里云數據庫產品研究員褚霸介紹,隨著各行各業信息技術的發展催生了以數據分析場景為主要業務的企業。特別是物聯網和廣告分析領域的企業,對云上復雜場景數據分析有強需求。“這個產品可以簡化大量工作,如數據庫管理員、開發者以及數據分析師可以專注于如何通過 SQL 挖掘數據價值,無需再自行維護復雜的大規模并行數據集群。”
HybridDB 是此款產品的名字,也體現了“混合”的特點。HybridDB 兼容數據類型多達23種,比市面上云計算廠商的同類產品多一倍。同時,它支持橫向擴展,當用戶數據量變大,內存及CPU計算能力需求增大時,隨時可以添加節點,以線性擴展分析性能,提高計算能力。
7月公測以來的數據顯示,JSON 和 GIS 類型的數據量高達TB級別時,查詢也可以在1秒內完成。此外,廣告分析領域的公司在做互聯網海量數據的 PV、UV 預估分析時,統計性能提升20-100倍。
在MySQL和ProstgreSQL之外,數據庫用戶為什么還需要全新的產品?褚霸表示,HybridDB的混合數據類型及混合存儲(行存、列存、OSS外部表)能力,可以與阿里云現有的RDS、NoSQL數據庫方案實現數據融合分析。同時補全了EMR(Hadoop)分析場景中實時性不足的問題,為用戶提供基于開源OLTP、OLAP、BigData生態的一站式解決方案。
Greenplum 誕生于2006年,是一個分布式大規模并行處理數據庫,常用于大數據的存儲引擎、計算引擎和分析引擎。它和HybridDB將形成云上云下業務場景的互補,軟件開發過程中,云上HybridDB環境與云下Greenplum商業版本、Greenplum Database開源版本環境可以采用同一套代碼,節省開發及維護成本。
阿里云數據庫團隊的愿景是打造一站式在線分析引擎。從數據的傳輸、存儲、計算到管理,讓客戶的數據需求能夠在同一個產品環境體系內實現,進一步降低數據處理的整體成本。未來,阿里云將圍繞 HybridDB 做數據庫生態的努力。一方面,加速與阿里云數據類產品實現互通,讓用戶可以通過SQL快速分析從不同渠道存儲下來的數據。另一方面,引入合作伙伴認證機制,邀請更多ISV開發商及BI/ETL廠商支持,共同為用戶創造價值。
實時分析
支持SQL語法進行分布式GIS地理信息數據類型實時分析,協助物聯網、互聯網實現LBS位置服務統計
支持SQL語法進行分布式JSON、XML、模糊字符串等數據實時分析,助金融、政企行業實現報文數據處理及模糊文本統計
穩定可靠
支持分布式ACID數據一致性,實現跨節點事務一致,所有數據雙節點同步冗余
分布式部署,計算單元、服務器、機柜三重防護,提高重要數據基礎設施保障
簡單易用
豐富的OLAP SQL語法及函數支持,眾多Oracle函數支持,業界流行的BI軟件可直接聯機使用
可與云數據庫RDS(PostgreSQL/PPAS)實現數據通訊,實現OLTP+OLAP(HTAP)混合事務分析解決方案
性能卓越
支持行列混合存儲,列存性能在OLAP分析時相比行存儲可達100倍性能提升
支持高性能OSS并行數據導入,避免單通道導入的性能瓶頸
靈活擴展
按需進行計算單元,CPU、內存、存儲空間的等比擴展,OLAP性能平滑上升致數百TB
支持透明的OSS數據操作,非在線分析的冷數據可靈活轉存到OSS對象存儲,數據存儲容量無限擴展