伴隨數(shù)字經(jīng)濟時代的到來,數(shù)據(jù)成為企業(yè)的核心資產,數(shù)據(jù)安全的受重視程度不斷提升。近些年,大量網(wǎng)絡攻擊、邏輯故障、人為誤操作、刪庫跑路造成的數(shù)據(jù)安全事故更是給全社會敲響了警鐘。數(shù)據(jù)的安全保護,不單是企業(yè)的合規(guī)性要求,如等保、商業(yè)銀行業(yè)務連續(xù)性監(jiān)管指引等法規(guī)、行業(yè)規(guī)范等,也是企業(yè)自身應對各種故障、避免重大損失的必要手段。
當下,數(shù)據(jù)備份保護正迎來全新的發(fā)展周期,這是因為數(shù)據(jù)庫這一基礎軟件迎來了全新的機遇。眾所周知,在信創(chuàng)、國產替代,云計算、大數(shù)據(jù)深入普及的大背景下,集中式數(shù)據(jù)庫正逐漸被分布式數(shù)據(jù)庫取代,越來越多關鍵行業(yè),如金融、電信的核心數(shù)據(jù)正在嘗試部署于分布式數(shù)據(jù)庫,至于快遞、物流、互聯(lián)網(wǎng)、餐飲、旅游等C端客戶較多的行業(yè)更是很早就應用了分布式數(shù)據(jù)庫。
2022年5月,F(xiàn)rost & Su••ivan聯(lián)合頭豹研究院發(fā)布的《2021年中國分布式數(shù)據(jù)庫市場報告》指出,在中國市場,分布式數(shù)據(jù)庫發(fā)展正處于“爆發(fā)期”。中國的分布式數(shù)據(jù)庫相關專利申請量從2012年的全球占比22%爬升至2021年的76%,中國已經(jīng)成為全球分布式數(shù)據(jù)庫的技術創(chuàng)新中心。
分布式數(shù)據(jù)庫帶來市場新難題
新機遇伴隨新挑戰(zhàn),分布式數(shù)據(jù)庫快速普及的同時,給數(shù)據(jù)備份保護帶來了新的難題。與傳統(tǒng)集中式數(shù)據(jù)庫完全不同的是,分布式數(shù)據(jù)庫有著自己的特性,最突出的兩點:海量、云原生。
就海量而言,分布式數(shù)據(jù)庫節(jié)點數(shù)量比集中式數(shù)據(jù)庫大的多。集中式數(shù)據(jù)庫幾百個節(jié)點已經(jīng)是非常大的數(shù)據(jù)庫環(huán)境,而對于分布式數(shù)據(jù)庫而言,成千上萬個節(jié)點是很普遍的。
拿云原生來說,海量的備份作業(yè)對備份主節(jié)點是否可以橫向擴展、備份的存儲空間是否可以池化并橫向擴展,以解決備份性能及備份存儲空間都提出了新的要求。與此同時,大批量數(shù)據(jù)庫上線及下線對備份系統(tǒng)能否自動感知并動態(tài)調整也提出了新的考驗。
除此之外,海量節(jié)點引發(fā)的數(shù)據(jù)恢復一致性問題相比集中式數(shù)據(jù)庫,概率更大,問題更嚴重。
在瑞數(shù)信息看來,如果數(shù)據(jù)沒有恢復一致性保證,對于分布式數(shù)據(jù)庫的數(shù)據(jù)備份將變得毫無意義。
目前,針對分布式數(shù)據(jù)庫的數(shù)據(jù)備份挑戰(zhàn),市場供給側基本上是空白的,主要有三個方面的原因:一是,分布式數(shù)據(jù)庫市場還比較新,國外領先的數(shù)據(jù)備份廠商還沒有跟進;二是,分布式數(shù)據(jù)庫廠商當前主要的精力,是解決數(shù)據(jù)庫的可用可靠,讓數(shù)據(jù)庫不掉鏈子,雖然有數(shù)據(jù)備份功能,但沒有余力完備;三是,分布式數(shù)據(jù)庫數(shù)據(jù)保護涉及到的技術門檻較高。
瑞數(shù)信息發(fā)布國內首款分布式數(shù)據(jù)庫保護方案
在這樣的大背景下,為了讓用戶能夠更安心的部署新技術、擁抱新時代,瑞數(shù)信息率先推出了專門針對分布式數(shù)據(jù)庫的保護方案,這也是國內首款分布式數(shù)據(jù)庫保護方案。
瑞數(shù)分布式數(shù)據(jù)庫保護方案的核心價值點可以總結為三個維度:
• 備份恢復方面,能夠適配分布式數(shù)據(jù)庫的特性,包括一致性、海量、云原生,讓數(shù)據(jù)備份恢復功能可用、易用。
• 數(shù)據(jù)管理方面,增加了包括性能調優(yōu)環(huán)境快速搭建、開發(fā)測試環(huán)境快速搭建、通過虛擬化數(shù)據(jù)供給實現(xiàn)了低成本的數(shù)據(jù)使用等功能,讓備份下來的數(shù)據(jù)能用、好用。
• 數(shù)據(jù)安全方面,可提供備份數(shù)據(jù)安全保護、防勒索、數(shù)據(jù)安全使用、數(shù)據(jù)治理等功能,讓企業(yè)備份數(shù)據(jù)安全、放心。
具體而言,瑞數(shù)分布式數(shù)據(jù)庫保護方案涉及到很多關鍵技術。
• 數(shù)據(jù)一致性,實現(xiàn)數(shù)據(jù)恢復的金融級安全
實現(xiàn)數(shù)據(jù)恢復一致性,瑞數(shù)分布式數(shù)據(jù)庫保護方案可確保任意時間點的數(shù)據(jù)一致性恢復,實現(xiàn)數(shù)據(jù)恢復的金融級安全。
• 永久增量模式,大幅降低備份時間
針對海量環(huán)境、海量數(shù)據(jù),瑞數(shù)分布式數(shù)據(jù)庫保護方案采用永久增量備份模式,除了第一次全量備份,之后只需備份增量數(shù)據(jù)和日志備份,系統(tǒng)內部自動增量合成,可大幅降低備份時間90%以上,進而解決分布式數(shù)據(jù)庫備份窗口的問題。
• 海量數(shù)據(jù),分鐘級恢復
快速恢復方面,不同于其它備份軟件會將備份下來的數(shù)據(jù)轉換為另一種格式進行存儲,瑞數(shù)分布式數(shù)據(jù)庫保護方案的備份數(shù)據(jù)會保持數(shù)據(jù)的原始格式,這樣在還原時可少轉換一次格式,使得無論數(shù)據(jù)量有多大,瑞數(shù)分布式數(shù)據(jù)庫保護方案都可實現(xiàn)分鐘級恢復。
另外,瑞數(shù)分布式數(shù)據(jù)庫保護方案還有多種功能特性,包括:
• 備份數(shù)據(jù)多副本使用,為測試、開發(fā)、大數(shù)據(jù)等即時供給數(shù)據(jù),充分價值化使用數(shù)據(jù);
• 提供異地復制、多種存儲介質、不可變數(shù)據(jù)、保留周期鎖定、自動化數(shù)據(jù)驗證等功能,確保法規(guī)遵從;
• 針對海量環(huán)境的自動探測技術、無代理流式備份。
• 專業(yè)的存儲空間管理,包括1+N*增量數(shù)據(jù)空間占用、透明壓縮、對象存儲對接等
瑞數(shù)信息持續(xù)不斷為用戶輸出價值
盡管瑞數(shù)分布式數(shù)據(jù)庫保護方案推出時間不長,但憑借突出的表現(xiàn)已在多個銀行、運營商公司進行POC測試,收獲好評不斷。
比如在某銀行測試環(huán)境中,客戶的分布式數(shù)據(jù)庫擁有500個左右數(shù)據(jù)庫節(jié)點,每個Master配置2個S•ave,共加載了40個DB,有單節(jié)點的DB,也有跨越10多個節(jié)點的DB,分庫分表管理非常復雜。
經(jīng)過測試,瑞數(shù)分布式數(shù)據(jù)庫保護方案通過永久增量備份,可大幅減少備份時間至原有的10%-30%,大幅減少存儲空間占用到原有的30%左右,而且無論數(shù)據(jù)量大小,都能實現(xiàn)分鐘級恢復。另外,瑞數(shù)分布式數(shù)據(jù)庫保護方案支持自動化恢復驗證,從而可以保證數(shù)據(jù)保護的法規(guī)遵從和備份機制的執(zhí)行。在客戶提供的一致性恢復測試項目中,瑞數(shù)全部通過。給客戶留下了深刻的印象
總體而言,如瑞數(shù)信息提到,國內分布式數(shù)據(jù)庫一路走來,可以說篳路藍縷,挑戰(zhàn)很多。瑞數(shù)信息希望能夠通過自己的努力,和業(yè)界眾多分布式數(shù)據(jù)庫廠商形成合力,助力用戶不僅能用上分布式數(shù)據(jù)庫,而且要安全地用好,給用戶帶去真正的價值。
為此,面向未來,瑞數(shù)信息將著重在兩個層面發(fā)力:一是,在數(shù)據(jù)保護層面,繼續(xù)完善功能,同時與分布式數(shù)據(jù)庫廠商做好對接,讓用戶更便捷的實現(xiàn)數(shù)據(jù)備份、恢復;二是,助力用好分布式數(shù)據(jù)庫,比如與瑞數(shù)信息現(xiàn)有的數(shù)據(jù)安全檢測與應急響應系統(tǒng)(DDR)聯(lián)動,實現(xiàn)海量數(shù)據(jù)快速備份的反勒索機制,解決海量數(shù)據(jù)的快速脫敏問題等。
結語
在分布式數(shù)據(jù)庫快速發(fā)展的今天,瑞數(shù)信息敏銳地洞察到市場空白,基于多年來對數(shù)據(jù)安全的認知和技術積累,推出的國內首款分布式數(shù)據(jù)庫保護方案,將為企業(yè)更好、更安全地應用分布式數(shù)據(jù)庫、做好數(shù)據(jù)安全合規(guī)打下堅實基礎,同時也引領著數(shù)據(jù)安全細分領域向更新興的技術領域發(fā)展。