當涉及到云數據備份時,并沒有放之四海皆準的方法,所以企業(yè)一定要仔細選擇自己的備份服務。我們在第一部分《不要讓你的云備份策略退居次位》中介紹了云供應商所做的努力。這里是第二部分。
能夠實現數據備份的方式有很多。在虛擬化技術最為興盛的時期,首選方式是使用數據保護軟件,在hypervisor層進行備份或者復制整臺虛擬機,比如Veeam Backup以及Zerto提供的同步軟件。
對于使用VMware云的IT部門來說,這種方式現在仍然能夠發(fā)揮工作。VIF Eduation是一家國際教育機構,其同時運行著本地、SaaS和IaaS應用程序。對于其Google Apps和Salesforce應用來說,VIF在本地開發(fā)、傳統應用程序以及基于云的教師管理平臺(其運行在一個本地服務提供商的vCloud Air環(huán)境當中)當中使用Spanning和Veeam Backup進行備份。但是兼容性并不是特別好,這家公司的IT經理Matt Torcasso表示,他希望能夠在本地和云備份流程之間實現更好的集成性。
“確定方向是一件十分艱難的事情——在(混合)環(huán)境當中如何完善數據備份,”Torcasso表示,“這是一個十分復雜的市場,有太多種方案可供選擇。”
VMware vCloud Air只是整個公有云市場的一小部分,Dell和EMC的合并傳聞也為市場帶來了未知因素。而運行在AWS(Amazon Web Service)和微軟Azure當中的絕大多數云應用程序應該怎樣進行備份呢?
一種非常古老的方式是使用安裝在操作系統當中的備份軟件,比如Veritas NetBackup。
“當你使用云技術之后,必須重新思考軟件代理程序,” Virtualization Practice公司的Haleky表示。你可以以代理程序為基礎,將數據備份到附近數據中心的容器當中,并且將數據同步到另外一個云當中,以防止受到大規(guī)模云故障的影響。
事實上,云的出現為基于軟件代理的備份方式帶來的新的機遇。比如Veeam以傳統代理軟件為基礎推出了新的產品,能夠在操作系統當中實現備份。Veeam Backup for Linux“更少關注本地Linux,而將重點轉移到云應用程序上,”Veeam產品戰(zhàn)略部副主席Doug Hazelman介紹說。加上另外一種適用于Windows的基于軟件代理的產品——Veeam Endpoint Backup——公司將會在今年內構建完成“全新的云策略,”并且其中包含了管理功能。
技術仍在不斷發(fā)展
同時,現在使用AWS這樣主流云平臺的企業(yè)并不喜歡云廠商所提供的備份方式,而是在等待傳統備份廠商及時追趕上云時代。
現在,所有主流云服務提供商都提供了“窮人版?zhèn)浞莘桨?rdquo;——將塊數據存儲替換為成本更低的對象存儲,為其制作時間點快照,CloudVelox公司聯合創(chuàng)始人兼CEO Rajeev Chawla表示,CloudVelox是一家云數據遷移和恢復軟件提供商。
為什么將其稱之為“窮人版?zhèn)浞莘桨?rdquo;?因為“一切都是手動的——企業(yè)必須自己完成所有配置——并且其時間點采用的是crash consistent方式,而不是application consistent,”他說。盡管現在能夠從單個快照當中恢復單個服務,但是許多應用程序包含多種服務,確保它們能夠作為整體進行恢復就需要以整體方式實現數據保護。
如果你愿意花費額外的費用,那么云服務提供商將會為你的數據庫制作快照備份。AppNeta是一家應用程序性能管理軟件托管提供商,2010年開始針對AWS提供服務,其備份方案依賴于磁盤快照特性。對于快照來說,“制作實例的時間常常以小時、天或者星期為單位,”公司的主架構師Chris Erway表示。
但是現在企業(yè)越來越依賴于AWS提供的RDS(關系型數據庫服務),其中包含了周期性的時間點快照。幾年之前,AWS開始推薦用戶使用RDS而不再手動管理數據庫。“他們開始說‘這種常規(guī)性任務就交給我們來做——我們將會管理數據,你只需要專注于邏輯層業(yè)務就好,’”Erway說。AppNeta也參與到其中,現在依賴于“RDS來完成高效備份。”
AppNeta將超過170TB的備份數據都存放在Amazon Simple Storage Service(S3)當中——因為AppNeta每天需要處理74億個事件,并且使用AWS S3 infrequent訪問層——這樣能夠縮小相對昂貴的S3和低成本但是特別緩慢的Glacier歸檔存儲之間的差距。
在我們信任的云中
除了為數據創(chuàng)建時間點鏡像之外,另外一種數據保護原則是在異地存放數據備份。之前,這種方式意味著需要將備份磁帶保存在Iron Mountain公司位于廢棄鹽礦深處的安全環(huán)境當中。而現在,IT公司只需要將備份的數字版拷貝發(fā)送到異地,可以在云中,也可以不是。但是如果你的應用程序已經在云中——是否需要出于安全考慮而將其從云中轉移?或者云所自帶的彈性會對其造成過度影響?
對于這個問題來說,不同的人會給出不同的答案。即便還沒有在AWS當中遇到過任何“大規(guī)模故障”,但是ACI公司的Moyer還是將數據導出,備份到第二家云提供商,比如Rackspace或者Google Cloud平臺,以滿足其“有些偏執(zhí)的想法(如果AWS出現任何嚴重問題怎么辦?)”
但是多云備份并不適合于所有人。“我們設想過將數據從AWS當中移出來,保存到另外一個云服務提供商當中,但是如果將數據移出,AWS會收取相當多的費用,并且網路帶寬費用也對成本節(jié)約造成很大影響,”AppNeta公司的Erway表示。此外,AWS宣稱S3當中的數據是非??煽康?mdash;—默認情況下其可用性能夠達到99.999999999%,也就是說每年的平均故障率是0.000000001%。“他們不斷強調系統的彈性有多強,”Erway說,“在某種程度上你必須相信他們。”使用跨區(qū)域復制配合減少冗余版本的S3也是可選方案,但是“成本往往會成為一個問題。”
通常來說,對于使用多個云來保護數據的需求非常少,CloudVelox公司的Chawla表示,對于大部分公司來說,使用單個云的不同區(qū)域和分層存儲服務就足夠了。“這其中并不涉及太多的技術問題——我們可以在不同云當中同步數據——需要考慮的通常是業(yè)務方面,”他說。在多云環(huán)境當中,“你擁有兩個服務供應商,兩套合同,”如果你使用一種云的原生特性,那么也許不能在另外一個云中使用這種特性。“現在并非所有的云都是通過相同的方式創(chuàng)建的,”他說。
之前云存儲提供商Nirvanix突然宣布停止服務,只留給客戶兩周時間來將數據遷出,而現在情況已經發(fā)生了變化。對于所有抱有這種顧慮的用戶來說, 現在一線的云服務提供商肯定不會出現停止服務的情況,Chawla說。
但是對于廠商鎖定和由此產生的憂慮該如何處理呢?擔心云服務提供商可能倒閉并不是想要避免廠商鎖定的唯一原因,云服務提供商還有可能大幅度提高價格。
但是目前為止,這種情況還沒有發(fā)生過,AppNeta公司的首席市場營銷官Damian Roskill表示,“不同于IBM對客戶進行鎖定然后漲價的做法,AWS雖然也對用戶進行鎖定,但是卻在降價,”他說。。此外,亞馬遜通過AWS賺取的利潤已經表明他們能夠在可預見的未來繼續(xù)推行低價策略。從企業(yè)的數據安全角度來說,我們希望Roskill說的是對的。
備份分布式數據庫
現代企業(yè)開始以下一代分布式數據庫為基礎開發(fā)應用程序,比如Cassandra、Mongo和 DynamoDB——但是由此也會帶來數據保護問題。
企業(yè)需要跨結點創(chuàng)建分布式數據庫才能夠實現可擴展性,其實質就是“最終一致性,”Datos IO公司的聯合創(chuàng)始人兼CEO Tarun Thakur表示,這家公司為大數據和云應用開發(fā)恢復軟件。但是最終一致性和時間點備份不能同時實現。為了解決這種問題,Datos為分布式數據庫創(chuàng)建了集群一致的時間點鏡像,允許企業(yè)以這些云數據庫為基礎開發(fā)應用程序,而不用再擔心數據的完整性。
還有其他企業(yè)采用MacGyver方式。ACI Information Group是一家內容整合服務提供商,需要大量使用AWS DynamoDB和AWS NoSQL數據存儲服務。
“其擁有不錯的性能表現,但是并沒有提供內置的備份服務,”ACI公司技術副總裁Chris Moyer表示。Moyer的解決方案是:在事件流之外調用Lambda函數,自動將數據從指定表或區(qū)域導出到S3當中。這樣做能夠實現怎樣的效果?“實時備份和驗證以及版本控制,”Moyer表示。