企業級數據庫openGauss開源一年以來,社區迅速壯大,生態蓬勃發展,圍繞企業級性、企業級安全、企業級可靠等方面持續加強,并在行業加速落地。目前openGauss成功支撐郵儲銀行新一代分布式金融核心系統上線,并成功打造同業領先的金融核心系統;幫助中華人壽團險核心系統使用鯤鵬全棧替換,實現性能倍增;openGauss基于鯤鵬4路服務器的中國移動數據庫性能測試排名絕對領先。面向未來,openGauss將從國計民生行業數據庫應用的最緊迫問題和長遠需求出發,不斷在核心技術上進行突破,將根扎深,共同打造枝繁葉茂的數據庫主流生態。
openGauss面向企業核心業務場景持續創新
推出面向核心業務場景的高可靠特性
金融與運營商在社會經濟運行中處于關鍵基礎位置,其核心業務場景,對數據庫的性能和穩定性有苛刻的要求。openGauss將于6月30日發布軟硬協同的高可靠特性-RAS故障感知功能,該特性基于鯤鵬最新4路高端服務器和openEuler操作系統,支持在硬件內存發生故障前,及時通知上層OS與數據庫,實現數據庫故障隔離與快速切換,在核心業務數據庫場景業務運行故障無感知,數據安全可控無丟失。
圖1:openGauss基于RAS的高可靠原理圖:故障隔離、快速切換
推出多款重量級企業級特性,數據庫更快、更穩、更強
此外openGauss社區將持續為企業級用戶打造高可用、高性能內核,openGauss將在9月30日的版本中,面向開發者和企業用戶發布In-place Update存儲引擎、基于Paxos協議的DCF高可用組件以及兼顧TP業務和AP業務的HTAP特性。
In-place Update中文意思為原地更新,是相對于openGauss行引擎當前所采用的Append Update(追加更新)模式的升級。追加更新對于業務中的增、刪以及HOT UPDATE(即同一個頁面內更新)有很好的表現,但對于跨數據頁面的非HOT UPDATE場景,垃圾回收不夠高效。而原地更新模式將最新版本的“有效數據”和歷史版本的“垃圾數據”分離存儲:最新版本的“有效數據”存儲在數據頁面上,單獨開辟一段UNDO空間,用于統一管理歷史版本的“垃圾數據”,因此數據空間不會由于頻繁更新而膨脹,垃圾回收效率更高(參見圖1)。同時可實現基于NUMA-Ware架構的高可擴展UNDO子系統以及基于多版本的索引技術。在這種設計思路下,用戶可徹底拋棄原有垃圾數據清理機制,從而使整體系統運行更加平穩,適應更多業務場景和工作負載。
圖2:In-place Update數據存儲示意圖:數據在原page頁,undo通過指針單獨管理
Paxos是一種強一致、高可用的分布式一致性協議。對于存在宕機風險的分布式系統來說,在不要求可靠的消息傳遞下可實現數據強一致,且可容忍消息丟失、延遲、亂序及重復。基于多數派機制的Paxos協議保證了2F+1的容錯能力,即2F+1個節點的系統最大允許F個節點同時出現故障。更進一步,Paxos協議具備自仲裁,多數派選主及日志復制能力,使得openGauss在保證數據一致性的同時,在高可用方面可進一步得到增強,包括:
(1)通過自仲裁、多數派選主能力擺脫第三方仲裁組件,極大縮短RTO時間,且可預防任何故障下的腦裂雙主;
(2)支持節點同步、同異步混合部署的多集群部署模式;
(3)提升主備間節點日志復制效率,提升系統的最大吞吐能力。借助openGauss的DCF高可用組件,用戶不僅可以免去系統腦裂的風險,還可以提升系統性能。
圖3:Paxos原理示意圖
HTAP代表了一類數據庫應用場景,核心思想在基于一套內核提供TP和AP的混合負載能力,而混合負載的兩個核心要素是性能和資源控制。從性能維度,openGauss將基于現有的能力進一步挖掘系統并行執行能力(如SMP),提升CPU利用率(如動態編譯執行),實現內存內計算(如內存引擎),這些不同引擎或能力支撐openGauss從容應對不同的負載請求。而資源控制方面通過資源管理流機制實現不同負載間的資源隔離,即彼此間互不影響且資源足夠,該方法讓各自負載在滿足SLA的基礎上,有非常好的實時性。HTAP實現了單個系統的多業務負載處理能力,一套數據底座,應對兩套業務模型,省去數據遷移的代價。
圖4:HTAP即能進行事物處理,又能行業分析處理
openGauss除了在內核能力上不斷推出新特性,同時在社區和生態建設上,攜手伙伴一起打造面向分布式場景的高競爭力解決方案。
openGauss通過ShardingSphere分布式中間件,實現線性擴展,最高可達6400數據分片,可以滿足業務不斷增長的數據規模要求;結合業務流量,可以靈活平滑進行數據節點的擴縮容,智能讀寫分離,實現分布式數據庫的自動負載均衡。而標準化鏡像機制確保多環境一致性交付,不僅能夠支持多云場景,還能有效降低企業對平臺的依賴性。同時這套分布式方案,還能支持強有力的集群管理、運維能力以及多地多中心靈活部署。
共建、共治、共享、共贏,打造數據庫主流生態
生態是開源庫數據庫成功的關鍵因素,openGauss一直就秉持共建、共治、共享的生態策略,攜手產業鏈伙伴,最終實現生態共贏。openGauss不僅代碼開源,還通過開源社區運營,讓業界的開發者、伙伴能公開透明的參與進來,通過技術委員會、SIG組的形式廣泛匯聚業界的技術專家,為openGauss發展提供源源不斷的智力支持和思想輸入。據悉,openGauss社區理事會正在籌備中,預計于下半年成立,是openGauss開源社區主要治理機構。
圖5:30+企業加入openGauss社區(排名不分先后)
開源近一年,openGauss得到業界伙伴的強烈的響應和支持,已有6家數據庫企業基于openGauss發布商業發行版,下半年會有更多新的企業發布商業發行版。目前,民生銀行、中國電信云公司、深信服等30多家企業級用戶已加入社區,并在多個關鍵特性上積極貢獻。openGauss還與行業解決方案軟件伙伴緊密合作,針對行業場景的特點,聯合推出對應解決方案:與深信服推出高性能安全數據庫一體化方案、聯合SharingSphere社區推出全棧開源的分布式中間件解決方案、聯合頭部廠商面向降本增效場景推出存算分離方案等,相關聯合解決方案均已在行業核心場景實現商用落地。
智能基座、產教融合,為產業界提供豐沛的人才
創新之道,唯在得人。得人只要,必廣其途以儲之。高校是人才培養的根據地,是人才發展的未來。openGauss聯合高校,通過產、學、研、用,打通人才體系建設,通過基礎理論對接產業和市場需求構建知識體系,從理論到實踐到應用相結合,構建良性人才生態,激發產業持續活力。
目前清華、北大、復旦等50余所著名高校已開設openGauss課程,覆蓋數萬名學生,另有超過30所院校已確定將在年內開課,未來一年,預計將有超過200所院校在教學中使用openGauss,真正實現產教融合。據悉,openGauss已進入全國計算機等級考試。
openGauss逐漸成為數據科學的學術創新平臺,清華大學、北京航空航天大學、西北工業大學、西安電子科技大學等數十所高校,均已基于openGauss進行創新型基礎研究工作,如AI-native的數據庫技術、面向新硬件(ARM多核、TPU/GPU、RDMA、NVM/SCM等)新型數據庫技術、云數據庫架構研究、面向行業數字化轉型的數據及隱私保護、面向嵌入式設備場景的數據庫系統等方向研究。
從基礎研究、高校合作到產業創新,openGauss社區匯聚高校、產業界的智慧和力量,共同開展數據庫基礎軟件創新突破。openGauss持續聚焦數據庫根技術,以開源協作創新,為業界帶來持續領先的數據庫技術與產品;以開放繁盛生態,聯合產業鏈上下游伙伴,讓openGauss落地千行百業,助力客戶加速數字化轉型,共促產業發展和生態繁榮。