“要解決這些問題,阿里巴巴2008年就開始研發自主可控的數據系統,2014年基于MySQL的國內首個云原生數據庫POLARDB開始孵化,到今天已累計超過PB的數據遷移至 POLARDB”阿里云研究員呂漫漪這樣告訴記者。
阿里云研究員呂漫漪
榮耀一:超大容量 彈性擴展
雖然POLARDB是基于MySQL研發的關系型數據庫,但存儲容量完全不受到限制,存儲容量最高可達100TB,單庫最多可擴展到 16 個節點,性能提升是MySQL的6倍,并且完全兼容MySQL。
"由于MySQL 和POLARDB 百分之百兼容,有兩種辦法可以實現快速遷移,:一是直接做個備份,就可以從MySQL遷移到POLARDB,這種方式非常簡單,還可以通過我們提供的DTS在線工具進行遷移。“呂漫漪表示:”對于一個完全基于云環境的數據庫,利用云的彈性擴展是個基本項,用Serverless方式自動擴容,存儲空間無需手動配置,根據數據量自動伸縮,用戶只需為實際使用容量付費。”
當應對完一次“大促“釋放數據資源、節點資源非常簡單,POLARDB三分鐘就可生效。“不同于MySQL的‘一主多從’POLARDB則采用‘一寫多讀共享同一份數據’的方式,無需額外建立多個從庫。在幾分鐘內就可以增加一個只讀節點并啟動服務。采用物理日志(RedoLog)代替邏輯日志(Binlog)極大程度的減少的主備延遲和磁盤IO,使得主備延遲控制在毫秒級,并可根據實際情況修改為主備強同步。”
榮耀二:運維簡單 安全可靠
操作簡單一直是降低差錯、提高可用性的不二法則。呂漫漪表示:“POLARDB的大容量、高性能簡化了構架師對數據庫的操作,不用去做分庫分表、不用做冷熱分離,同時有對查詢的加速接口,可以直接通過調用智能接入層的一個接口就可完成復雜的查詢。”
同時,數據越來越成為企業的重要資產,甚至是企業的生命線。“我們在數據庫安全方面對POLARDB也做了很多改進。POLARDB共享分布式存儲的設計徹底解決了MySQL Master-Slave異步復制所帶來的備庫數據非強一致的缺陷,使得整個數據庫集群在應對任何單點故障時,可以保證數據 0 丟失。采用Active-Active的高可用集群架構,可讀寫的主節點和只讀節點之間進行Failover切換,與傳統的Active-Standby相比,用同樣成本帶來了更好的系統訪問性能。“
POLARDB也加強了數據安全方面的措施,包括采用白名單、VPC網絡、SSL加密、數據多副本存儲等全方位的手段,對數據庫數據訪問、存儲、管理等各個環節提供安全保障。“在實際場景中我們發現,誤刪除等低級錯誤時有發生造成的損失巨大,為此我們未來在新版本中還會提供‘回收站’的功能,能很快地將刪除的數據庫表進行恢復,此外,還利用POLARDB共享分布式存儲的特點,可以快速將數據庫恢復到某一個指定時間點,通過快照的功能通過快照和物理日志將數據庫恢復到一個指定的時間點來提高數據庫的高可用性。“
榮耀三:平滑演進 面向未來
對于POLARDB的演進方向,呂漫漪表示,“首先就是在靠可用性上下功夫。企業及客戶對高可用性和數據庫的安全要求特別高,所以我們會在高可用上加大投入。此外在性能上的提高,把更多的功能下推到存儲層來做。在當今大數據的時代,企業級用戶在功能上也有了新的要求,要求數據庫既要是事務性數據庫又要是分析性數據庫,我們今后把這兩個需求結合在一起,今后將推出并行查詢、大幅提高大表查詢、復雜查詢的性能,這些都是我們的前進方向。
當前數據種類繁多,除了大家熟知的關系型數據庫,圖數據庫、文件數據庫、流數據庫等非關系數據庫也在崛起。呂漫漪認為,數據庫的發展現在是百花齊放,由于應用場景的不同,用戶可以選擇不同的數據庫,但我們可以看到MySQL數據庫也發生了很多改變,它從一個純關系型的數據庫也開始支持文件存儲,5.7版開始支持文件存儲,關系型數據庫的演變和MySQL的演變也開始支持更多的存儲模式,我們可以給客戶提供更多的選擇。”
阿里云數據庫事業部總經理鳴嵩認為:“十年時間,阿里云數據庫團隊從技術創造新商業到推動中國數據庫技術變革。”從AliSQL到RDS,再到首個自研云原生數據庫POLARDB,如今,阿里巴巴數據庫技術得到了極大的提升,領跑數據時代。前不久,Gartner公布了2018全球數據庫魔力象限,阿里云以國內云廠商第一成為首個入選的中國企業,分析師更是認為POLARDB云原生數據庫在使用場景的應用值得期待。相信作為國產數據庫的領跑者,阿里云將一直在為使命而努力奮斗,讓我們拭目以待。