如今的分布式數據庫中,為這些PT級數據弄個可靠的快照可不是件容易的事
IT界都知道:動了軟件棧的一部分,有很大的可能性另外一部分也不得不動。不用舍近求遠,看看大數據,秒懂。
首先,大數據沖擊了數據庫領域,開拓了“向外擴展”技術新門類。那是被諸如Hadoop、MongoDB和Cassandra的產品例證的模型,數據不再被打包進一個單獨的巨大的服務器,而是分散存放在多個商品服務器上。
其中的美學,當然在于靈活性:要容納更多PT數據,只需要增加一兩臺廉價的機器,而不需要數出大量的鈔票來將原來大象級的服務器升級成猛犸級。
一切看起來如此美好,但現在,問題來了:備份和恢復咋辦?
Gartner副總裁戴夫·拉塞爾說:“傳統備份產品無法應對超大數據量備份問題。該架構向外擴展的特性也讓傳統備份應用難以處理。”
今天的橫向擴展數據庫確實包含了一些可用性和恢復的功能,但通常都不像IT用戶已經習慣了的那么健壯。
這是一個能讓大企業在遭遇停電時陷入大麻煩的問題。但也是新一類數據保護產品開始嶄露頭角的機會。
數據恢復初創公司 Datos IO 的RecoverX就是其中之一。
“如果你用的是像Oracle或MySQL這樣的傳統數據庫,只能是擴充升級,而且需要持續的日志。” Datos IO 共同創始人兼CEO塔倫·塔庫爾說。
這種情況下,那份日志的副本,就是當問題發生時的備份了。
而在今天這種數據分布式存儲在多個小機器上的下一代數據庫時代,事情遠沒那么簡單。
“由于沒有主控,每一個節點都獨立負責自己的事務,持續性日志這種概念是不存在的。”塔庫爾解釋道,“不同的節點有不同的權限,每個節點都對操作有不同的視圖。”
出現這種情況,有部分原因是出于對適應大數據“3V”要求(容量volume、速度velocity、多樣性variety)的權衡。尤其是,為在適應瘋狂高速涌來的多樣化數據的同時提供可擴展性,今天的分布式數據庫已經脫離了傳統關系數據庫遵循的“ACID”標準(原子性Atomicity、一致性Consistency、隔離性Isolation、持久性Durability),轉而采用大規模分布式系統的“BASE”理論(基本可用Basically Available、軟狀態Soft State、最終一致性Eventual Consistency)。
這是決定性的不同。最相關的就是傳統數據庫全程提供強一致性的地方——也就是ACID中的C,分布式數據庫則是努力謀求所謂的“最終一致性”。或快或慢地,更新最終會覆蓋到所有節點,但,中間肯定會有時間差。
“如果你需要可擴展性,就得放棄一致性,二者擇其一。”
這讓獲得可靠的整體快照以進行實時恢復變得很難。不僅是更難以在任意時間點追蹤哪些數據移動到了分布式數據庫的哪里,而且根植到更新的分布式數據庫中的彈性特性(比如復刻),在數據被損壞的情況下也無法保護你。
“你不過是復刻了那些被損壞的數據而已。”
本月早些時候,Datos IO 發布了RecoverX,打算用被其稱之為可擴展版本控制和語義式重復數據刪除功能來解決這些問題。結果就是,既節省空間,又本地格式可用的集群一致備份。
美國第一資本汽車金融公司原CTO兼工程管理副總裁索維克·達斯率先感受到了備份的危機。
現在已是醫療保健初創公司 Grand Rounds 工程高級副總裁的達斯稱,采用傳統數據庫數年之后,第一資本在幾年前進行了“大轉型”,鋪開了類似Cassandra這樣的新分布式技術。
這意味著,要找尋新的備份和恢復策略。
“大多數備份廠商和軟件通常都會調整適應他們正在備份的那類系統。”
在新分布式數據庫上用老式備份產品會引發問題。
“要么軟件完全不知道怎么備份新的數據存儲,要么只能以非最佳方式運行。”達斯說,“我們知道,得找另一種備份解決方案了。”
Datos IO 和Talena——另一家該領域的主要廠商,都在第一資本的考慮范圍內。
傳統的備份產品廠商也在逐漸調整自己的產品以適應大數據,不過現下的備份廠商要支持更新的技術還需要花點時間。
退回10年,一開始是非常難以為VMware虛擬機做備份的。這讓Veeam這樣的公司在現有廠商的鼻子底下擠進了市場,偷走了VM備份市場份額。