Datos IO公司打造出一套獨(dú)特的數(shù)據(jù)保護(hù)實(shí)現(xiàn)方案,其與以往基于介質(zhì)服務(wù)器的數(shù)據(jù)保護(hù)有所區(qū)別,轉(zhuǎn)而使用專用型備份設(shè)備。
該公司解釋稱,此套方案主要強(qiáng)調(diào)應(yīng)用程序?qū)τ跀?shù)據(jù)的存儲(chǔ)與管理方式,這一點(diǎn)與其它數(shù)據(jù)保護(hù)廠商(例如Cohesity、Rubrik以及Veeam等新興企業(yè))有所不同。
我們就此與該公司CEO兼聯(lián)合創(chuàng)始人Tarun Thakur進(jìn)行了交流,希望通過(guò)一系列問(wèn)題以了解這種差異的具體細(xì)節(jié)。我們對(duì)于談話內(nèi)容進(jìn)行了編輯以確保更易于理解。而大家可能會(huì)注意到,他給出了一些相當(dāng)全面的回應(yīng),足以幫助大家明確了解其觀點(diǎn)。
記者:專用備份設(shè)備(簡(jiǎn)稱PBBA)市場(chǎng)為何會(huì)遭遇下滑?
Tarun Thakur:我們的基本前提在于由“應(yīng)用程序”定義對(duì)IT堆棧的實(shí)際選擇:從數(shù)據(jù)庫(kù)的選擇到存儲(chǔ)的選擇,再到數(shù)據(jù)管理方案的選擇。而其中的數(shù)據(jù)管理方案則包括從備份與恢復(fù)軟件到專用備份文件系統(tǒng)/設(shè)備、到歸檔軟件、再到存儲(chǔ)管理軟件以及歸檔存儲(chǔ)的一切因素。
考慮到以下現(xiàn)狀:
傳統(tǒng)應(yīng)用程序正逐步轉(zhuǎn)移至云端(對(duì)于一切非恢復(fù)用例,例如測(cè)試/開(kāi)發(fā)與主要應(yīng)用程序?qū)嵗?各類第三方平臺(tái)應(yīng)用程序(分析、物聯(lián)網(wǎng)等等)開(kāi)始以云作為開(kāi)發(fā)平臺(tái);應(yīng)用程序數(shù)據(jù)如今開(kāi)始全面進(jìn)行預(yù)壓縮,這意味著傳統(tǒng)的重復(fù)數(shù)據(jù)刪除功能將不再具有實(shí)際意義;開(kāi)始廣泛使用非共享型非關(guān)系型與云原生數(shù)據(jù)庫(kù)架構(gòu);云基礎(chǔ)設(shè)施植根于計(jì)算與存儲(chǔ)的云原生層——而非LUN或者虛擬機(jī);豐富的分析服務(wù)(例如Amazon Athena)現(xiàn)在已經(jīng)能夠以原生方式直接應(yīng)用于云存儲(chǔ)。這一切都令以往專用備份設(shè)備(簡(jiǎn)稱PBBA)所引以為傲的經(jīng)典可變長(zhǎng)度或固定數(shù)據(jù)塊重復(fù)數(shù)據(jù)刪除功能變得毫無(wú)用武之地,意味著其已經(jīng)無(wú)法適應(yīng)全新應(yīng)用程序與多云時(shí)代的實(shí)際要求。
這些影響因素綜合起來(lái)共同造成了PBBA市場(chǎng)全面下滑的現(xiàn)狀。
記者:公有云的崛起給數(shù)據(jù)保護(hù)市場(chǎng)帶來(lái)了怎樣的影響?
Tarun Thakur:一系列研究已經(jīng)證實(shí),與傳統(tǒng)的內(nèi)部部署交付模式相比,Amazon/Azure云部署方案能夠帶來(lái)更為可觀的投資回報(bào)且投資回報(bào)周期更短。
正因?yàn)槿绱耍偌由螴T方案的主要消費(fèi)者如今正轉(zhuǎn)變?yōu)閼?yīng)用程序所有者及DevOps人員,同時(shí)傳統(tǒng)應(yīng)用程序越來(lái)越多遷移至云端,而下一代應(yīng)用程序甚至開(kāi)始以原生方式在云端進(jìn)行開(kāi)發(fā)。
由于存在這種架構(gòu)化差異以及新的約束條件(即無(wú)需訪問(wèn)虛擬機(jī)管理程序、無(wú)需SAN/NAS存儲(chǔ)設(shè)備介入等等),因此能夠在云環(huán)境中獲得成功的數(shù)據(jù)保護(hù)解決方案必須在數(shù)據(jù)保護(hù)架構(gòu)與設(shè)計(jì)方面進(jìn)行全面重構(gòu)。
……傳統(tǒng)數(shù)據(jù)保護(hù)解決方案只是簡(jiǎn)單將產(chǎn)品升級(jí)至云端,這也導(dǎo)致其對(duì)于本地仍然對(duì)于本地附加存儲(chǔ)具有嚴(yán)重的依賴性,且實(shí)現(xiàn)成本也要遠(yuǎn)高于公有云直接提供的可擴(kuò)展對(duì)象存儲(chǔ)方案(例如Amazon S3)。而Datos IO公司正是面向此類云原生解決方案進(jìn)行自身產(chǎn)品優(yōu)化。
最重要的是,傳統(tǒng)備份軟件產(chǎn)品的以往架構(gòu)會(huì)徹底破壞數(shù)據(jù)的原生格式,這意味著客戶會(huì)被自己的數(shù)據(jù)所脅持,因此幾乎沒(méi)有能力實(shí)現(xiàn)數(shù)據(jù)貨幣化或者跨多云邊界進(jìn)行數(shù)據(jù)調(diào)動(dòng)。
記者:您是否認(rèn)為客戶將全面投入公有云環(huán)境,或者其更傾向于將內(nèi)部與公有云IT堆棧同某種形式的數(shù)據(jù)管理方案加以結(jié)合,從而同時(shí)涵蓋這兩種環(huán)境?
Tarun Thakur:我們堅(jiān)信,任何擁有大量應(yīng)用程序與數(shù)據(jù)庫(kù)的企業(yè)都必將生存在“多云”世界當(dāng)中:一部分應(yīng)用程序?qū)⒁员镜胤绞竭\(yùn)行,而其它應(yīng)用程序則立足公有云環(huán)境保持運(yùn)行。
因此,我們認(rèn)為趨勢(shì)的最終走向絕不會(huì)是二中選一的“非此即彼”。
企業(yè)已經(jīng)開(kāi)始并將繼續(xù)保留內(nèi)部基礎(chǔ)設(shè)施以承載一部分關(guān)鍵性業(yè)務(wù)應(yīng)用程序。具體來(lái)講,這部分應(yīng)用包括各類輔助型應(yīng)用用例,例如災(zāi)難恢復(fù)、測(cè)試/開(kāi)發(fā)、性能分級(jí)以及持續(xù)集成/持續(xù)交付等等。
這些企業(yè)當(dāng)然也希望有能力建立一份適用于公有云平臺(tái)的應(yīng)用程序版本,從而幫助開(kāi)發(fā)人員獲得更理想的敏捷性/生產(chǎn)效率,同時(shí)將一部分IT支出由傳統(tǒng)的“采購(gòu)”形式轉(zhuǎn)化為公有云提供的“租賃”形式。
記者:您的意思是數(shù)據(jù)保護(hù)業(yè)務(wù)在本質(zhì)上屬于數(shù)據(jù)復(fù)制業(yè)務(wù),而客戶應(yīng)當(dāng)有能力對(duì)這類數(shù)據(jù)副本采取更多操作,而非單純借此防止源系統(tǒng)發(fā)生故障或者遭遇數(shù)據(jù)泄露?
Tarun Thakur:……在內(nèi)部環(huán)境當(dāng)中,數(shù)據(jù)保護(hù)的本質(zhì)確實(shí)在于數(shù)據(jù)復(fù)制,這是因?yàn)榇蠖鄶?shù)應(yīng)用程序都被綁定至單一數(shù)據(jù)庫(kù)。而云服務(wù)的出現(xiàn)正在重新定義這種范式:云環(huán)境中的數(shù)據(jù)保護(hù)不再只是數(shù)據(jù)復(fù)制,這種作法只是種新瓶裝舊酒的自我重復(fù)(云環(huán)境作為瓶子存在)。
……我們的副本不再處于LUN層、虛擬機(jī)副本或者虛擬機(jī)文件備份當(dāng)中; 相反,Datos IO公司致力于立足表格、記錄(行)以及列理解您的應(yīng)用程序數(shù)據(jù)。因此,我們的產(chǎn)品允許您立足輔助存儲(chǔ)(實(shí)現(xiàn)數(shù)據(jù)庫(kù)的快速恢復(fù)與維護(hù)(即保留原生格式)、在不同存儲(chǔ)點(diǎn)內(nèi)建立分布式應(yīng)用程序狀態(tài),并最終實(shí)現(xiàn)由內(nèi)部環(huán)境指向云或者多云環(huán)境的高效遷移。
記者:如果PBBA供應(yīng)商將其軟件運(yùn)行在云環(huán)境中,會(huì)造成怎樣的問(wèn)題?我們又該如何解決這些問(wèn)題?
Tarun Thakur: PBBA供應(yīng)商已經(jīng)開(kāi)始采取一種以面向其“應(yīng)用節(jié)點(diǎn)”寫(xiě)入為基礎(chǔ)的架構(gòu)。他們將這些“節(jié)點(diǎn)”遷移至昂貴的軟件計(jì)算節(jié)點(diǎn)之內(nèi),同時(shí)掛載高成本EC2存儲(chǔ)以處理那些無(wú)法給“云”解決方案帶來(lái)任何實(shí)質(zhì)性效率或者經(jīng)濟(jì)收益的寫(xiě)入工作負(fù)載——事實(shí)上,這類方案最終仍然要將數(shù)據(jù)轉(zhuǎn)移至S3之內(nèi)。
……直接被照搬至云端的PBBA與介質(zhì)服務(wù)器仍然基于原本的附加存儲(chǔ)設(shè)計(jì)思路,其實(shí)現(xiàn)成本相較于Amazon S3等公有云存儲(chǔ)基礎(chǔ)設(shè)施要高出一個(gè)量級(jí)。
全部受保護(hù)數(shù)據(jù)必須由終端應(yīng)用節(jié)點(diǎn)被引流至介質(zhì)服務(wù)器。這種作法在地理分布廣泛的多云世界中根本沒(méi)有任何擴(kuò)展性可言。PBBA已經(jīng)成為一種性能瓶頸,且無(wú)法處理目前云環(huán)境中廣泛流行的大規(guī)模數(shù)據(jù)。
……相當(dāng)一部分?jǐn)?shù)據(jù)類型——例如向外擴(kuò)展數(shù)據(jù)庫(kù)事務(wù)——在結(jié)構(gòu)上具備bit惟一特性,意味著我們無(wú)法利用逐bit數(shù)據(jù)拆分/數(shù)據(jù)塊重復(fù)數(shù)據(jù)刪除機(jī)制對(duì)其進(jìn)行體積削減……
記者:目前已經(jīng)有其它一些廠商邁入所謂云數(shù)據(jù)管理領(lǐng)域,并提供多種數(shù)據(jù)保護(hù)與其它服務(wù)——包括Veeam、Cohesity以及Rubrik等。Datos IO的技術(shù)方案與Veeam、Cohesity以及Rubrik存在哪些區(qū)別?
Tarun Thakur:Veeam公司基于一套介質(zhì)服務(wù)器架構(gòu),其中數(shù)據(jù)由VMware(或者其它同類服務(wù)器)被導(dǎo)流至配備有附加存儲(chǔ)的介質(zhì)服務(wù)器上的目標(biāo)代理內(nèi)。而其重復(fù)數(shù)據(jù)刪除技術(shù)部分作用于來(lái)源,部分作用于目標(biāo)。
我們與Veeam的方案存在以下根本性區(qū)別:
所有受保護(hù)數(shù)據(jù)皆需要通過(guò)Veeam介質(zhì)服務(wù)器進(jìn)行導(dǎo)流,而這種方式將無(wú)法在地理分布廣泛的多云環(huán)境下實(shí)現(xiàn)規(guī)模化擴(kuò)展。其中的介質(zhì)服務(wù)器將成為瓶頸所在,且其對(duì)附加存儲(chǔ)的高強(qiáng)度使用將帶來(lái)十倍于云部署模式的成本水平。Veeam主要用于處理不透明的數(shù)據(jù)塊與文件,因此無(wú)法提供細(xì)粒度數(shù)據(jù)保護(hù)或者搜索等高級(jí)數(shù)據(jù)管理服務(wù)。盡管Veeam方案因運(yùn)用VSS而更擅長(zhǎng)實(shí)現(xiàn)應(yīng)用程序事務(wù)一改,但由于Veeam無(wú)法理解受保護(hù)數(shù)據(jù)的具體結(jié)構(gòu),因此其不具備真正的“以應(yīng)用程序?yàn)橹行?rdquo;特性。隨著對(duì)越來(lái)越多進(jìn)行數(shù)據(jù)壓縮以提升傳統(tǒng)及下一代應(yīng)用程序的計(jì)算吞吐量,采用可變長(zhǎng)度重復(fù)數(shù)據(jù)刪除功能的作法將無(wú)法進(jìn)一步實(shí)現(xiàn)存儲(chǔ)空間壓縮以及WAN加速。Veeam將云數(shù)據(jù)存儲(chǔ)視為長(zhǎng)期保留目標(biāo),而Datos IO則利用語(yǔ)義重復(fù)數(shù)據(jù)刪除技術(shù)將這些數(shù)據(jù)存儲(chǔ)用于二級(jí)存儲(chǔ)。記者;那么Rubrik與Cohesity的方案又存在哪些問(wèn)題?
Tarun Thakur: Rubrik與Cohesity(即PBBA替代性供應(yīng)商)均采用基于介質(zhì)服務(wù)器的設(shè)計(jì)架構(gòu),其中數(shù)據(jù)由VMware(或者其它同類服務(wù)器)被傳輸至配備有集成化存儲(chǔ)資源之超融合型介質(zhì)服務(wù)器上的目標(biāo)代理當(dāng)中。
以下則是我們與Rubrik以及Cohesity的根本差異所在:
由于超整合型方案的天然特性,所有受保護(hù)數(shù)據(jù)都必須被導(dǎo)流至介質(zhì)服務(wù)器。與Veeam類似,這種方式無(wú)法在地理分布極為廣泛的多云環(huán)境下實(shí)現(xiàn)規(guī)模化擴(kuò)展,并將成為整套體系中的瓶頸所在。集成化存儲(chǔ)方案在操作成本方面要比云部署模式高出一個(gè)量級(jí)。這套面向不透明數(shù)據(jù)塊與文件的保護(hù)方案無(wú)法提供細(xì)粒度數(shù)據(jù)保護(hù)或者搜索等高級(jí)數(shù)據(jù)管理服務(wù)。盡管VSS能夠提供出色的應(yīng)用程序一致性表現(xiàn),但Rubrik與Cohesity仍然缺乏對(duì)于所受保護(hù)數(shù)據(jù)之具體結(jié)構(gòu)的認(rèn)知。隨著對(duì)越來(lái)越多進(jìn)行數(shù)據(jù)壓縮以提升傳統(tǒng)及下一代應(yīng)用程序的計(jì)算吞吐量,采用可變長(zhǎng)度重復(fù)數(shù)據(jù)刪除功能的作法將無(wú)法進(jìn)一步實(shí)現(xiàn)存儲(chǔ)空間壓縮以及WAN加速。Rubrik與Cohesity皆將云數(shù)據(jù)存儲(chǔ)視為長(zhǎng)期保留目標(biāo),而Datos IO則利用語(yǔ)義重復(fù)數(shù)據(jù)刪除技術(shù)將這些數(shù)據(jù)存儲(chǔ)用于二級(jí)存儲(chǔ)。Rubrik與Cohesity在本質(zhì)上面向第二平臺(tái)或者M(jìn)ode 1應(yīng)用程序(即基于SQL服務(wù)器或者虛擬機(jī))類工作負(fù)載,而非云原生應(yīng)用程序、非關(guān)系型數(shù)據(jù)庫(kù)、分布式應(yīng)用程序以及第三平臺(tái)時(shí)代下的各類工作負(fù)載。
記者: Datos IO公司希望在未來(lái)五年內(nèi)實(shí)現(xiàn)怎樣的產(chǎn)品能力?
Tarun Thakur: ……我們將繼續(xù)……構(gòu)建數(shù)據(jù)保護(hù)以及移動(dòng)用例,確保其適用于廣泛的運(yùn)營(yíng)數(shù)據(jù)源集合——同時(shí)包含MySQL等傳統(tǒng)場(chǎng)景以及Amazon DynamoDB等面向云之場(chǎng)景。
這種對(duì)豐富數(shù)據(jù)源的支持能力使得我們能夠捕捉更為龐大的數(shù)據(jù)量,進(jìn)而使我們得以為應(yīng)用程序及業(yè)務(wù)所有者交付更多先進(jìn)數(shù)據(jù)管理服務(wù)。以此為基礎(chǔ),我們還能夠建立起“云規(guī)模數(shù)據(jù)中樞”這一發(fā)展愿景,即涵蓋以下服務(wù)方向的廣闊功能范疇:
……我們希望提供一套全球分布式元數(shù)據(jù)目錄,用以涵蓋公有云與私有云之間的一切數(shù)據(jù)孤島。
……在特定數(shù)據(jù)保護(hù)與移動(dòng)實(shí)例當(dāng)中,數(shù)據(jù)管理員將擁有這樣的底層用例:隨處備份、隨處恢復(fù)、隨處遷移。
評(píng)論意見(jiàn)Datos IO公司的技術(shù)主要面向身處或者使用公有云環(huán)境的應(yīng)用及數(shù)據(jù),且特別適合各類云原生類工作負(fù)載。根據(jù)該公司CEO所言,這是一套遠(yuǎn)超傳統(tǒng)或者遺留備份軟件、專用備份設(shè)備(包括Data Domain)、專注于虛擬服務(wù)器之產(chǎn)品(例如Veeam)以及其它新型產(chǎn)品(Cohesity與Rubrik)的強(qiáng)大數(shù)據(jù)保護(hù)方案。
雖然說(shuō)得非常漂亮,但其產(chǎn)品是否真的如此卓越?這個(gè)終極問(wèn)題的答案恐怕只能交由時(shí)間來(lái)判斷了。