今天的存儲行業(yè)正處于在大變革的前夜。由于采購成本和運(yùn)維成本高、可擴(kuò)展性、靈活性不足等原因,傳統(tǒng)存儲正面臨來自各種新技術(shù)的嚴(yán)峻挑戰(zhàn),大有風(fēng)雨欲來風(fēng)滿樓之勢。軟件定義存儲是其中的領(lǐng)頭羊,不過新技術(shù)也不僅限于軟件定義存儲,如今又一個(gè)強(qiáng)有力的挑戰(zhàn)者來了,這就是CDM(Copy Data Management,復(fù)制數(shù)據(jù)管理),也稱副本數(shù)據(jù)管理。
CDM是什么東東?對于CDM Gartner有一個(gè)定義:它是從生產(chǎn)環(huán)境通過快照技術(shù)獲取有應(yīng)用一致性保證的數(shù)據(jù)在非生產(chǎn)存儲上生成“黃金副本(Golden image)”,這個(gè)“黃金副本 ”數(shù)據(jù)格式是原始的磁盤格式,可再虛擬化成多個(gè)副本直接掛載給服務(wù)器,分別用于備份恢復(fù)、容災(zāi)或者開發(fā)測試。
至于為什么要用這一技術(shù),這可能還得從數(shù)據(jù)存儲與備份當(dāng)前面臨的問題說起。為了預(yù)防系統(tǒng)宕機(jī)、病毒或者人為錯誤,數(shù)據(jù)的備份是一個(gè)現(xiàn)代企業(yè)的基本需求,對一些關(guān)鍵業(yè)務(wù)系統(tǒng),備份更是必選項(xiàng)。一般而言,當(dāng)企業(yè)數(shù)據(jù)量不大、業(yè)務(wù)系統(tǒng)也不多時(shí),備份并不是一個(gè)特別大的挑戰(zhàn)。然而,隨著企業(yè)要備份的數(shù)據(jù)越來越多,企業(yè)內(nèi)部的業(yè)務(wù)系統(tǒng)也越來越多的時(shí)候,備份就會成為一件越來越困難的事情了。
備份之難首先體現(xiàn)在要消耗大量的存儲資源。一方面是由于各種自動化數(shù)據(jù)采集設(shè)備的應(yīng)用,企業(yè)數(shù)據(jù)在不斷產(chǎn)生,如來自各種物聯(lián)網(wǎng)設(shè)備的,同時(shí),社交媒體的大量使用也成為一個(gè)重要的數(shù)據(jù)來源;另一方面,同一份數(shù)據(jù)被反復(fù)拷貝,一些關(guān)鍵的數(shù)據(jù)在企業(yè)平均有7-10份副本,消耗了大量的存儲空間,這也讓企業(yè)在數(shù)據(jù)管理上面臨更大的挑戰(zhàn)。
備份之難還體現(xiàn)在備份窗口越來越窄,業(yè)務(wù)系統(tǒng)留給后臺做備份的時(shí)間越來越短,使得傳統(tǒng)的各種備份手段面臨很大挑戰(zhàn)。
由于有望幫助克服上午問題,CDM成為一種近年來逐步受到關(guān)注的存儲和備份技術(shù)。正如Gartner的定義所述,它是基于快照技術(shù)來實(shí)現(xiàn)的。快照對存儲界的人士而言并不新鮮,它是數(shù)據(jù)在某個(gè)時(shí)間點(diǎn)(拷貝開始的時(shí)間點(diǎn))的映像。由于其本質(zhì)上是指向保存在存儲設(shè)備中的數(shù)據(jù)的引用標(biāo)記或指針,而不是數(shù)據(jù)的全拷貝,因此它的復(fù)制很快,占用很少的存儲空間,也基本不會影響系統(tǒng)性能,但是可以作為一種數(shù)據(jù)備份來看待。
那么,同樣是利用快照技術(shù),CDM有什么特點(diǎn)之處?“其最大的優(yōu)勢之一,它是一種可以直接使用的數(shù)據(jù)拷貝,可以直接掛載給應(yīng)用程序使用的備份,這使得CDM的備份數(shù)據(jù)可以在原數(shù)據(jù)出現(xiàn)問題之后迅速發(fā)揮作用,最快幾分鐘之內(nèi)就可以完成。而采用傳統(tǒng)備份技術(shù)的系統(tǒng)則可能茶館長達(dá)幾小時(shí)甚至一整天。”Actifio中國區(qū)技術(shù)總監(jiān)毛立峰介紹說。
Actifio中國區(qū)技術(shù)總監(jiān)毛立峰
毛立峰所在的Actifio是一家專注于CDM技術(shù)的美國公司,成立于2009年,2014年正式進(jìn)入中國市場,從默默無聞到伴隨著CDM市場的興起而逐漸被業(yè)界了解。他解釋說,CDM之所以能有這樣的能力,是因?yàn)閭鹘y(tǒng)備份技術(shù)將數(shù)據(jù)備份為一種專用的文件格式(比如.tar),在需要恢復(fù)的時(shí)候,要先把數(shù)據(jù)從備份介質(zhì)中恢復(fù)為原來的格式,然后掛載的應(yīng)用。這種恢復(fù)的過程通常是很漫長的,有的可能長達(dá)一天。而CDM保存的是原始數(shù)據(jù)的一份映像,可以直接使用。
CDM有什么用?CDM是作為一種備份技術(shù)出現(xiàn)在市場。它的第一個(gè)應(yīng)用也就是用于數(shù)據(jù)的備份,特別是那些對數(shù)據(jù)恢復(fù)時(shí)間有嚴(yán)格要求的系統(tǒng),CDM非常具有競爭力。據(jù)Actifio中國區(qū)銷售總監(jiān)孫峻松,目前Actifio的CDM客戶中最主要的應(yīng)用場景就是數(shù)據(jù)備份。正如上面所述,CDM具有非常出色的快速恢復(fù)能力,對于那些關(guān)鍵的不可中斷的業(yè)務(wù)系統(tǒng),這幾乎是不二之選。
除此之外,CDM占用較小的存儲空間也是其優(yōu)勢之一。CDM除了第一次備份時(shí)是全量備份之外,以后可以一直采用增量備份。而傳統(tǒng)備份方法通常是全量備份加上一段時(shí)間的增量備份,然后又一次全量備份再加上增量備份,如此循環(huán),占用存儲空間不說,對業(yè)務(wù)系統(tǒng)的干擾也大。
CDM的另一個(gè)應(yīng)用場景是用于數(shù)據(jù)的開發(fā)和測試。CDM可以用一套數(shù)據(jù)來滿足各種不同的開發(fā)和測試需求,而對于每個(gè)開發(fā)和測試團(tuán)隊(duì)而言,都擁有一個(gè)獨(dú)立的數(shù)據(jù)庫,大家的工作(包括增、刪、改)互不干擾。其背后的原理還是快照技術(shù),因?yàn)槊總€(gè)團(tuán)隊(duì)其實(shí)是擁有一組快照,并不是一個(gè)真正的實(shí)體數(shù)據(jù)。
對于開發(fā)測試而言,CDM的優(yōu)勢也很多,其中之一是節(jié)省數(shù)據(jù)存儲空間。“現(xiàn)代很多應(yīng)用所需測試數(shù)據(jù)量很大,超過100TB的情形也并不少見,同時(shí)需要數(shù)據(jù)的團(tuán)隊(duì)也很多,在存儲空間上的節(jié)省是非常明顯的。”毛立峰說。
CDM的第二個(gè)優(yōu)勢是節(jié)省開發(fā)和測試環(huán)境搭建的時(shí)間。眾所周知,開發(fā)和測試環(huán)境的搭建是非常耗時(shí)的,少則幾天多則幾周甚至更長時(shí)間,而CDM這種方式數(shù)據(jù)的準(zhǔn)備幾乎是實(shí)時(shí)的。
CDM的第三個(gè)優(yōu)勢是數(shù)據(jù)集中管理,可以按照統(tǒng)一的安全規(guī)則來規(guī)范使用,防止數(shù)據(jù)泄露。
“在我們看來,CDM就是一個(gè)數(shù)據(jù)服務(wù)平臺。你需要一份數(shù)據(jù)我就給你一份,至于數(shù)據(jù)是如何保存的,其實(shí)用戶不用關(guān)心。這也非常符合當(dāng)下的IT服務(wù)化的理念。”毛立峰告訴記者。
毛立峰透露,Actifio創(chuàng)始人初期的想法就是想用CDM來降低存儲空間。“我們的創(chuàng)始人注意到,在開發(fā)和測試時(shí)每個(gè)不同應(yīng)用都有一份拷貝,多的可能達(dá)到10-20份,相互之間是獨(dú)立的。他希望將10-20份拷貝縮到2-3份。”
CDM的第三個(gè)應(yīng)用場景則是作為容災(zāi)系統(tǒng)的一部分。毛立峰介紹說,現(xiàn)有的容災(zāi)系統(tǒng)在硬件容災(zāi)上已經(jīng)做得相當(dāng)不錯,比如雙機(jī)熱備、兩地三中心等,但是,如果軟件出現(xiàn)問題,比如有人為的誤操作或者系統(tǒng)中病毒,需要重啟系統(tǒng),時(shí)間就會很長,而CDM具有可以快速掛載的特點(diǎn),有助于系統(tǒng)的快速恢復(fù)。
采訪中毛立峰也坦言,作為存儲領(lǐng)域的一個(gè)挑戰(zhàn),CDM對于現(xiàn)有存儲系統(tǒng)是一個(gè)很大的巔峰,不管是從理念上還是架構(gòu)上。正是因?yàn)檫@個(gè)原因,CDM在普及過程中也面臨著一定的阻力。當(dāng)然,這也是每項(xiàng)新技術(shù)都要經(jīng)歷的,一個(gè)真正適用的技術(shù)終究也會通過這個(gè)考驗(yàn)而被市場接受。
目前,CDM的上升勢頭引起了一些研究機(jī)構(gòu)的注意,比如Gartner已經(jīng)決定把CDM從備份軟件領(lǐng)域中單列出來獨(dú)立研究。而接下來CDM是否能被廣泛接受,其在市場上到底能走多遠(yuǎn),還是交由市場來回答吧!