那么,國產數據庫究竟經歷了怎樣的發展才能取得如今的成就?未來又將面對怎樣的挑戰?
數據庫行業百花齊放
目前我們提到的數據庫,一般是指在計算機中有組織的進行數據存儲和獲取的系統。而提起數據庫系統,還要追溯到20世紀60年代。
當時的計算機已經廣泛應用于數據管理,但隨著人們需求的日益增長,人們渴望擁有一套能夠集管理與數據共享為一體的數據庫管理系統,于是DBMS應運而生。1970年-1972年,關系型數據庫模型出現在大眾視野中。這種模型建立在更加嚴格的數學基礎之上,抽象級別較高,便于理解和使用,自此,關系型數據庫系統逐漸成為主流,也出現了一些代表產品,譬如IBM公司的DB2,以及Oracle的第一款關系型數據庫Oracle V1。20世紀末,傳統的關系型數據庫已經能滿足大部分數據存儲需求,Oracle、IBM等商業化數據庫也得到了蓬勃的發展。進入2000年,隨著互聯網業務不斷擴大,數據量也隨之呈現出了爆發式的增長,結合關系型數據庫的SQL模型和基于NoSQL數據庫高性能的NewSQL數據庫問世,以此面對不同的業務場景及需求。
但在中國,商業化數據庫的發展之路并不是一帆風順。Oracle、IBM、Microsoft、SAP四家傳統廠商的產品曾一度占據商業數據庫市場超90%多的市場規模,Oracle更是席卷中國,在中國數據庫市場可謂是一手遮天。
為了在數據方面實現安全可靠,自上世紀90年代以來,我國就有大大小小的企業開始涉足國產數據庫領域。雖然早期我國數據庫廠商發展艱辛,但也獲得了不小的成果:中國擁有了第一代原型數據庫,也崛起了諸如東軟Openbase、中軟Cobase和華科DM Database等一系列優秀國產數據庫產品。進入21世紀,阿里喊出了“去IOE”的口號,選擇使用開源的MySQL,棱鏡門事件的曝光,也讓達夢、金倉等一批國產數據庫得到了廣泛的關注,PostgreSQL、HBase等開源數據庫也開始活躍起來,再到如今云計算時代和開源社區的興起,國產數據庫真正進入了蓬勃發展的時代,一時間數據庫行業百花齊放。
“1+4+4+N”格局形成
據艾瑞咨詢發布的《中國數據庫行業研究報告2021年》指出,國內企業對于基礎軟件付費的意愿和IT支出占比在逐年提升,隨著市場需求的增加,大批廠商借助國產化的熱潮,開始入局國產數據庫市場。目前,國產數據庫市場“1+4+4+N”的發展格局已經形成。
所謂的“1”,指的是國際巨頭——華為。華為目前是全球第一大電信設備商,更是全球5G技術領跑者,技術領域的行業地位毋庸置疑。據華為GIV報告顯示,全球數據量到2025年將增長至180ZB,AI應用率也將達到80%,基于此背景,華為面向全球發布了人工智能原生(AI-Native)數據庫GaussDB。
在極致性能的加持下,華為GaussDB數據庫廣泛應用于金融、運營商、政府、能源、醫療、制造、交通等多個行業,并為全球60個國家及地區、1500多個客戶提供了優質服務。此外,華為還聯合各行業頂尖ISV為客戶聯合開發解決方案,致力于打造繁榮的生態圈。照此趨勢來看,華為在云、人工智能和物聯網領域的進步,也代表了整個大數據市場的進一步繁榮,并正在通過產品創新、解決方案創新以及在數據庫領域展現的技術價值與產品價值,為各行各業賦能。
在“4+4”中,第一個“4”指的就是4家上市公司,阿里、騰訊、海量、中興。
首先說說阿里,阿里如今憑借自主研發的數據庫OceanBase,在國際事務處理性能委員會(TPC)的TPC-C基準測試中,以每秒4200萬次的數據處理峰值成功登上榜首。這一重大突破一舉打破了美國甲骨文公司保持了長達9年的世界紀錄,《科技日報》更是評價阿里此次登頂國際權威排行是云時代中國數據庫換道超車的標志。
再看騰訊,作為云廠商大軍中的一員,也一度憑借增速高達123%的市場份額位列國內數據庫廠商之首。騰訊云數據庫深耕開源領域已久,憑借齊全的產品線,騰訊無論是從技術創新到產品應用,還是到基礎研究深化,都有能力構建完整的技術演進周期。
接下來是海量,這個名字雖然沒有前兩位那么知名,但是在數據庫領域也是一家深耕已久的實力派了,早在5年前就成功主板上市,行事一直比較低調,近年來積極參與信創產業,數據庫業務更是多領域遍地開花,最新發布的企業級關系型數據庫Vastbase G100也是在openGauss內核基礎上研發而成的產品,其高度兼容Oracle,高性能和高安全的特性贏得了很多金融、制造、政府領域大客戶的青睞。
最后一家中興早在2002年,就已經開始涉足數據庫相關技術的研發。中興推出了具有銀行基因的金融級交易型分布式數據庫產品——GoldenDB。在2019BDIC大會上,中興GoldenDB數據庫獲得了全部50項測試滿分的成績,一時之間也引起了人們對中國數據庫技術的熱議。在2021年,中興通訊GoldenDB更是以位居中國金融級分布式數據庫領導者象限第一的位置,一躍成為國產分布式數據庫金融行業第一品牌。
“4+4”中后一個“4”指的是4家老牌廠商,即達夢、人大金倉、南大通用和神舟通用。
達夢算得上國產數據庫領域的一名老將,也是國產信息化領域國家隊的一員。達夢走的是自主原創的技術路線,根據2016年國內權威機構的檢測,達夢系列產品代碼自主原創率高達99.9%,在安全性方面也達到了目前國產數據庫的最高安全級別。如今,達夢通過加強與產業鏈上下游伙伴的合作,完成了從芯片、整機、中間件到應用系統的產業鏈千余款產品的深度優化適配,逐漸構建起了一個獨立自主的國產基礎軟硬件生態。
人大金倉同樣也是數據庫領域國家隊的一員,先后承擔了國家“863”、電子發展基金、信息安全專項、國家重點研發計劃、“核高基”等重大課題研究。在數據庫領域,人大金倉選擇了一條低成本的戰略路線,主要目標是實現替O,并研發出了具有國際先進水平的大型通用數據庫產品。借助政策東風,在2020年,人大金倉在信創市場份額超50%,完成產品兼容認證1000余個,助力傳統國產廠商市場份額上升至7.1%。如今,金倉也在不斷打磨核心產品KingbaseES,結合需求側技術發展的新趨勢,不斷擴大國產數據庫領域的生態格局。
神舟通用擁有深厚航天軟件研制經驗,在國內基礎軟件企業擁有較強影響力。從數據庫性能來講,神州通用數據庫對Oracle 語法有90%的兼容性,在大型評測機構中取得了相當不錯的成績,某些方面的表現甚至要超過了國外流行的幾家數據庫。在國家“核高基”專項綜合排名及“863計劃”產品評測中,神州通用斬獲第一的好成績。
在分析型數據庫領域中,南大通用占據重要地位。憑借技術優勢,南大通用已經為2000多個大型企業用戶提供了優質數據庫服務,在線運營數據節點高達30000多個,管理數據超過300PB。值得一提的是,南大通用旗下GBase 8a MPP,是目前國內唯一成熟的國產MPP數據庫產品,而新版MPP數據庫集群的發布,也標志著南大通用向大數據分析領域的又一次里程碑式邁進。
此外,近年來受國產化影響,“N”家初創廠商、云廠商、ICT廠商也開始發力數據庫市場。譬如PingCAP、偶數科技、巨杉、易鯨捷、柏睿數據等,也在國產數據領域取得了大大小小的成就,并逐漸被更多的人認可。國產陣營日益強大,預計未來五年有10倍以上的成長空間。如今國產數據庫領域正呈現百花齊放、活躍創新的局面。
挑戰之路仍漫漫
數據庫向上要和操作系統適配來保障系統的穩定運行,向下要支撐應用軟件的需求,確保軟件能夠在數據庫之上穩定運行,若沒有一個安全可靠的數據庫支撐,我們的數據資產安全將難以保障。因此,發展國產數據庫勢在必行。
但機遇與挑戰是并存的,我國數據庫領域發展雖然一路向好,但與國外還存在一定差距。國產數據庫廠商們在奮力追趕的過程中,也面臨了不小的挑戰。
一是在分布式實踐方向,國產數據庫廠商們推出了相應的分布式數據庫產品,但在解決分布式事務、創新架構、數據分片的智能化和提升企業級能力上,仍需深入探索。
二是在信創背景下,國產數據庫借助政策利好進一步發展壯大,但未來還要考慮如何助力傳統企業實現數字化轉型和業務的創新升級,從而進一步拓展市場。
三是國產數據庫選型和應用系統的存在形式越發多樣化,未來如何助力企業降低成本,實現“統一管理”成為了新的挑戰。并且,國產數據庫的發展本就是一個不斷在實踐中積累經驗打磨產品的過程。隨著近年來云計算、大數據、人工智能和物聯網等場景的提出和落地,人們對于數據庫的需求將不斷驅動技術的更新迭代。
如何讓分布式數據庫在事務、性能等環節實現進一步優化?如何進一步優化數據庫的性能,打造高可用的國產數據庫產品?如何應對數據的頻繁遷移、多庫長期并存所提出的新訴求?如何迎著信創產業實現市場版圖的快速擴張?如何推進包括公有、非公有形式在內的云數據庫成為主流?如何讓開源成為產業互聯網時代國產數據庫發展的突破點等等問題,都將是國產數據庫廠商們需要解決的問題。
千里之行,始于足下。國產數據庫的挑戰之路仍漫漫,國產廠商任重而道遠。
不可否認,我國數據庫發展與國外產品還存在一定的差距,但我們也要看到,當前數據庫市場“百花齊放”、數據庫產品的成熟度以及認知度日漸提升都離不開國產數據庫廠商們的不懈努力。從“1+4+4+N”的格局來看,我國數據庫產業已在市場局部開始取得突破,并迎來了數據庫國產化演進的發展拐點,并逐步向著數據庫核心應用領域滲透。可以想象,隨著數據井噴式的發展、國家政策的支持以及企業級市場的強勁需求,未來國產數據庫市場發展的后發優勢也將更加明顯。