可以肯定地說,服務器虛擬化對今天實施災難恢復(DR)的方式有很大影響。將虛擬機(VM)復制到遠程站點或云,當發生故障時將生產系統切換到保存的虛擬機副本上,這已經改變了我們通常認為的災難恢復方式。
災難恢復即服務(DRaaS)供應商已經接納了這一技術,推出基于云的應用快速恢復。對許多組織來說,這是一個福音,因為這種方法可以比傳統的將數據復制到災備站點花費少得多,并提供同樣快速的恢復時間。這一切聽起來很不錯,但在選擇基于云的災難恢復方案之前,有一些擔憂你必須預先知道。
盡管云災難恢復能提供很多好處,但它仍然是一個新興技術。根據Forrester Research的2014年報告顯示,從云災難恢復發布之日起,19%的受訪者已經采用這種方案,另有22%準備采用。企業選用基于云的災難恢復主要有以下三大好處:
以更低的成本獲得更好的功能
更容易,更便宜的測試
合同方式更靈活
報告解釋說,成本之所以能夠保持低位是因為用戶通常只需要在云存儲容量上產生花費。計算資源只有在發生災難或測試的情況下才需要支付。測試也可在不中斷業務的情況下進行,這讓用戶可以更頻繁地進行演練。這是一個巨大的優勢,因為對于傳統的災難恢復測試,這歷來是個痛點。而相較于傳統的災難恢復外包模式,合同設置比較受限,且期限較長,相比之下云災難恢復的合約設置更加靈活,有些服務甚至不以時間作為合同約束因素。
根據你的具體需求,有無數方法可以幫助你實現基于云的災難恢復,但各種可選項基本可以劃分為兩大類:業務連續性/災難恢復(BC/ DR)服務和災難恢復的云托管(Cloud DR hosting)方式。當然這種劃分不是固定不變的,但對于考量基于云的災難恢復,這是很好的出發點。
業務連續性/災難恢復(BC/DR)服務
有一些受控災難恢復服務提供商提供基于云的災難恢復,大多采用混合云的方式,即把現場備份的數據再復制到云存儲中。這種方案使得在數據丟失或損壞的情況下快速還原,而遠端副本只是在服務器宕機或整個數據中心中斷的情況下才使用。
有些云災難恢復提供商是大型企業,在全球范圍內擁有數據中心并提供各種各樣的BC/ DR服務。 比如SunGard的Availability Services和IBM的Business Continuity and Resiliency Services(BCRS)就是這種類型的典型例子。將業務拓展到云災難恢復,以此來擴大自己的服務組合,對于這些公司來說,是自然而然,毫不奇怪的一步。其他一些提供商,例如Axcient、Barracuda Networks、EVault、惠普、IBM、iland和Rackspace,也都提供了各自不同的云災難恢復服務/方案。
規模較小的云服務提供商也與備份軟件供應商合作,共同提供基于云的災難恢復。例如Asigra,通過渠道專門銷售其備份軟件,并通過其虛擬災難恢復功能為用戶提供 “即時恢復”。此功能允許用戶配置對他們的虛擬機進行備份,從而在備份操作完成后,最新的副本也會保存在服務提供商的云中。許多備份軟件供應商與管理服務提供商(MSP)結成合作伙伴關系,提供從虛擬機備份中運行應用程序的功能。此類產品的一些例子包括CommVault的Simpana,賽門鐵克的 NetBackup以及Veeam的Backup &Replication。
BC/ DR服務通常按照付費訂閱的方式收費,并根據存儲的數據量及消耗的計算資源量,用戶還需要支付一筆固定費用。各家服務因供應商的不同而異,而且在很多情況下,可以根據企業的具體需求進行定制。例如,有些客戶可能需要更健壯的自助服務選項,而另一些則更多地依賴管理服務提供商的專業知識。在選擇合適的云災難恢復提供商時,很重要的一點就是要衡量你的IT的優勢和劣勢。此外,云提供商所能提供的服務水平可能相差很大——稍后我們將探討這個話題。
災難恢復的云托管
災難恢復的云托管類似傳統托管,企業無需購買和維護額外的場外硬件。換句話說,用戶需要負責管理將生產數據復制到云,以及執行恢復任務。與上面詳細介紹的BC/ DR服務模式相比,這種模式下服務提供商的角色比較有限。
主要的基礎設施即服務(IaaS)提供商像亞馬遜,谷歌和微軟都提供災難恢復的云托管業務。以亞馬遜為例,提供三種不同層次的災難恢復云托管:
備份和恢復。用戶將數據(使用支持亞馬遜作為備份目標的備份軟件)備份到亞馬遜的S3存儲。在發生故障情況下,用戶可以使用Amazon Machine Images(AMIS)在EC2中啟動應用。AMI可以與操作系統和應用程序棧的適當部件進行合理配置。這是最便宜的選擇方案,但需要的恢復時間也最長。
快速恢復指示燈。與上述情況類似,但你的系統中最關鍵的核心要素已在AWS中配置。當需要進行恢復的時候,你可以圍繞這些關鍵核心快速配置起一個全面的生產環境。
熱備份。在這種情況下,一個具備完全功能的環境的縮小版本始終運行在云中。熱備份方式對指示燈方式下的元素和準備進行了擴展。由于一些服務始終在運行,這進一步減少了恢復時間。 這種類型的災難恢復云托管可能只對擁有內部員工可以遠程管理這些流程的大型企業具有吸引力。小規模公司由于內部BC/ DR的經驗有限或者完全沒有的,只能依賴云提供商的專業知識。
云災難恢復所面對的挑戰
盡管云災難恢復能夠帶來諸多好處,但你也應該了解它所面對的一系列挑戰。
其中最重要的一件事情是,根據Dragon Slayer咨詢公司的Marc Staimer,你要知道不是所有的云災難恢復服務提供商都是一樣的。對于較小的云服務供應商尤其如此,他說。 “巨頭擁有資源。像IBM和Sungard這樣的公司有經驗和能力長期提供DRaaS,”Staimer說。 “小型云提供商可能有技術,但人力資源是它們最大的限制。”
Toigo Partners International的Jon Toigo也表達了相同的擔憂。 “你在乞求服務提供商的憐憫,”他說。 “他們到底有多么敏捷?你的供應商必須非常熟悉你的應用以及如何使它們啟動并正常運行。這絕不像聽起來那樣容易。這不是即插即用”。
Staimer指出,較小的云提供商對于一些要求按天提供云災難恢復服務的客戶可能會好一些。 “但是當出現一個區域性災難時會發生什么?”他問。 “如果災難是廣泛的,他們能夠一次處理多少客戶的需求?”
除了關于人員配備方面的質疑,云服務提供商的計算資源也常常被夸大。你的提供商是否具有足夠的計算資源以應對他的所有客戶的應用程序在同一時間需要啟動? “人們很少去檢查這些東西,”Toigo說。
選擇災難恢復云托管的路線并自行管理自己的一切,可以避免這些問題。但是,如上所述,這需要企業內部具備相關的技能和資源,而許多選擇云托管方案的公司其實并不具備。
如果你選擇與管理服務提供商簽署合約,請做足功課。Staimer和Toigo都建議你向可能的云災難恢復提供商問盡可能多的問題。 “確保你可以做測試。確保你的用戶能夠獲取數據,了解該供應商可以并發處理多少個用戶請求。與他們討論參考資料。與多個供應商都進行洽談,”Staimer說。 “另外,你需要把服務水平協議(SLA)寫進合約。”
Toigo最后的一番建議是關于“對價格謹慎”。 “在許多情況下,較小的云服務提供商是從大型云供應商例如微軟,谷歌和亞馬遜租借空間,”他說。 “現在,價格戰使得云計算和存儲的成本都在下降。而當它結束時,預計價格將會走高了。”
他接著說,了解你的退出策略是很重要的,尤其是當成本開始走高,你需要退出服務的時候。 “如何拿回你的數據?”他說。 “Dternity使用磁帶。其他云提供商也有使用磁帶的。云提供商是否能夠導出你的所有數據到磁帶,這一點也是值得考慮的。”