所謂的云殺手級應用——基于云的災難恢復在大多數企業范圍內都執行著快速、經濟的恢復作業。
一直以來,災難恢復都被稱為是云平臺的殺手級應用?;谠频臑碾y恢復(DR)解決方案具有超越傳統災難恢復解決方案的一些引人矚目的優勢,這些傳統的應用場景通常會涉及一個在輔助設施或異地運行的可移除式存儲介質中維護的一個專用IT基礎設施。
云災難恢復在基礎設施和管理費用兩方面都實現了更高的簡便性、更快速的恢復以及更低廉的成本。簡而言之,使用云作為災難恢復的運行平臺可以提供比傳統方法更高的附加值,它實際上可以讓這樣一個更高效的災難恢復解決方案成為眾多從微小型到超大型企業均切實可行的方案。
本文給出了基于云的災難恢復的定義,詳細討論了云災難恢復技術(或災難恢復即服務)這一熱門話題,并介紹了多種不同類型的云計算災難恢復解決方案。我們還就這一技術背后的一些詳細信息進行了討論,這也是企業用戶在實施這類服務前就應當了解的內容。
災難恢復定義
所謂災難就是導致服務器或應用程序出現非計劃停機的任何東西,確保制定一個處于第一位的災難恢復計劃是非常重要的。這樣的一個定義意味著,一次災難可以是由一個孤立的硬件故障、存儲系統上的數據損害或者管理員意外關閉服務器所導致的。它不一定就是在數據中心中發大水或者遭遇龍卷風什么的。事實上,大多數的停 機時間并不涉及一個全站點范圍的災難。
恢復則是指重新啟動應用程序并在其與用戶和其他應用程序之間重新建立連接——并不只是恢復數據而已。 在過去,高效的恢復會要求配備冗余的基礎設施,但是,歸功于新的虛擬化技術,現在一個可用于運行關鍵虛擬機(VM)副本的輔助主機就可以構成一個災難恢復解決方案。一個真正可靠的災難恢復解決方案要付出大量的努力而不僅僅只是在云數據中心內建立若干虛擬機,但是這一技術可以大大簡化恢復過程并潛在地降低了 傳統災難恢復解決方案的成本。
基于云的災難恢復定義
云災難恢復可以有若干個定義,但是鑒于我們的目的,我們認為云災難恢復涉及一家企業在它自己的數據中心運行關鍵任務應用程序并將相關數據以虛擬機鏡像的形式移至云。其解決方案通常包括在虛擬機鏡像被保存的主機基礎設施上重新啟動這些虛擬機的能力。
服 務器虛擬化已極大地簡化了恢復過程。把一整個服務器實例封裝至一兩個文件就已經讓虛擬機重啟了,其簡易程度就如同恢復一個VMDK或VHD文件一樣。雖然 這樣一個解決方案可能是無法滿足所有企業需求的,但是一個裸機災難恢復解決方案可以是很簡單的,就好像確定一個備份版本虛擬機的位置并將其相關文件復制回原來的服務器或者一臺備用服務器。
恢復到位
通過指向一臺在備份存儲位置的恢復服務器,用 戶還可以“到位地”運行這些虛擬機。這是一個能夠把基于云備份轉至云災難恢復的高效功能,它催生了災難恢復即服務(DRaaS)的細分市場。雖然它承諾它的恢復速度比把虛擬機鏡像從云導回要快得多,但是還是存在著一些用戶需要知道的潛在問題——其大部分都與延遲性相關(參見“云備份成為云”中的相關章 節)。
云災難恢復服務供應商
實施基于云的災難恢復通常有兩種方法:
讓現有的備份供應商在其云中增加存儲和運行虛擬機鏡像的功能選項。讓現有的云存儲供應商、計算供應商或者基礎設施即服務供應商新增加一個災難恢復服務。1.云備份供應商
在 某些方面,備份和災難恢復是相互重疊的,而對于一個完整的數據保護解決方案來說,這兩者又都是不可或缺的。有鑒于此,讓一個提供異地存儲服務的現有備份供 應商順應這一趨勢而增加云災難恢復服務將是比較合乎邏輯的。一個通用的架構涉及:使用一個現場設備、一臺物理機器或虛擬機來控制本地備份并管理數據傳輸至 云計算。這一類解決方案中的很多都提供了“物理-虛擬”的轉換,這樣他們就可以為裸機(非虛擬化的)服務器提供需要被納入災難恢復計劃中的數據保護了。
大部分的服務供應商還提供了在云中運行虛擬機的選項,通常就是在他們自己的云設施中。但是,故障轉移和故障恢復流程是隨供應商不同而有所不同的,因此他們的云基礎設施的復雜性亦是如此。很多這類產品都是專為中小型企業而量身定做的,并把他們的災難恢復服務吹捧為“一鍵式”的解決方案。很顯然,企業用戶需要了解這些解決方案的工作原理以及其中蘊含的相關潛在風險。也就是說,這一方法也是有著一些優勢的。
這樣一個備份和災難恢復的功能組合可以簡化數據保護,而使用一個現場設施則意味著,如有需要,可以使用一個數據的本地副本以便于實現更快速的文件恢復和服務器恢復。因為大多數的停機時間都是由一個單臺服務器或應用程序而不是整個站點范圍的故障造成的,所以擁有一個本地副本來進行數據恢復則是一個既合乎邏輯又比較高效的解決方案。一個混合實施可使用云平臺來簡化數據傳輸并承擔這一過程的開銷。通過處理與主機服務器的同步,它還提供了一些選項以改進故障恢復。
有很多的供應商都使用了一個現場設施以便于在其數據保護解決方案中增加云災難恢復功能,其中包括了Acronis nScaled、Axcient、Barracuda Networks、Datto、Quantum、Quorum以及Unitrends等。而有一些包含了災難恢復選項的云備份解決方案并沒有采用現場設 施,但是混合方法是最常見的實施方法,因為它具有一些顯著的優勢。
2.云基礎設施供應商
基于云的災難恢復的其它常見方法通常涉及運行主機或基于云的存儲和計算基礎設施業務的服務,另外還增加了一個災難恢復選項。有些則提供了集成存儲系統的特定平臺解決方案,他們的客戶目前使用該存儲系統以利用其內嵌的復制功能。但是,大多數都提供了支持從云存儲和運行虛擬機的通用云存儲與計算服務。
他們的產品各有不同,從由供應商負責現場安裝和管理的完整交鑰匙解決方案到簡單地向企業用戶提供用于從根本上建立企業自有云災難恢復解決方案的“積木”。所用的具體架構主要取決于服務供應商和客戶企業的環境,但是大多數解決方案都涉及在專用服務器或虛擬機上運行以用于處理與云相關的數據傳輸的軟件。
這 些供應商們通常都會重點關注較高端的市場,強調這一需求而不僅僅只是在云中的一臺主機。他們的說法是,云基礎設施的質量不應當被認為是理所當然的,而且大多數供應商所提供的過程和支撐服務也不應是必須的。當一個應用程序發生故障而轉移至云時,很多供應商都致力于為用戶提供一個轉移無縫的使用體驗,解決讓用戶和其它應用程序重新連接至故障服務器的“前端”問題,而不只是運行被存儲虛擬機鏡像的“后端”工作。
一些提供這些服務的企業正活躍于傳統 災難恢復市場,他們提供了冗余基礎設施的解決方案,但是他們現在已接受了基于虛擬機的災難恢復技術的好處。這里稍舉幾個供應商,如亞馬遜(通過合作伙 伴)、Databarracks、Egenera、IBM SoftLayer、Rackspace、Seagate的EVault 以及 Windstream等。VMware公司還使用其基于管理程序的復制引擎以建立一個云災難恢復服務,從而將虛擬機鏡像移至它的云計算。
云災難恢復的若干關鍵考量
1.不要忘記本地的災難
雖然颶風和自然災害事件會占據所有的新聞頭條,但是企業用戶所面臨應用程序停用事件往往源于硬件故障、受損的軟件或者人為錯誤等。正是由于這個原因,一個包括了現場存儲組件和提供針對故障服務器基于LAN的恢復功能的云災難恢復解決方案可以具有相當大的吸引力。
2.云備份成為云
當一家企業需要在云中運行應用程序時,它與云供應商的關系也會變化——云備份供應商變成了云供應商。他們需要了解供應商提供了哪一種的服務等級協議 (SLA),以及他們可以支持運行企業應用程序多長時間。在發生區域性災難的情況下,如果多家企業同時啟用恢復功能,那么云備份供應商的計算基礎設施可能很快就會不堪重負。為了確保他們能夠得到期望的服務,企業需要確保提供計算級的SLA而不僅僅只是盡最大努力保證。
3.不要忘記重新連接
在云中發生故障的服務器中,重新啟動是恢復過程的第一個步驟,但卻不是唯一的步驟。用戶和其它的應用程序服務器還需要與這些虛擬機重新建立連接。如果尋求基于云的災難恢復服務的企業希望在檢修他們的主要基礎設施時能夠在云中運行生產應用程序,那么他們就需要進一步了解相關的詳細信息,如網絡、防火墻、端口監 控、入侵保護以及安全性等等。
4.退出策略
最后,企業需要了解他們的退出程序 ——故障轉移是如何運行的,以及它將花費多長時間。如果一個應用程序在云中運行的時間越長,那么它通過廣域網與主服務器進行同步所需花費的時間也越多。對于大型數據集而言 ,它的解決方案可能包括存儲設施出貨,但是這個過程仍然會涉及重新同步以適應運貨時間。
云災難恢復的底線
云災難恢復是當前云技術和虛擬化技術的一個良好應用范例。服務器虛擬化、云服務以及混合備份解決方案的發展讓災難恢復成為了企業用戶的一個切實可行的選擇, 而這些企業可能永遠都無法證明傳統災難恢復基礎設施的建設可行性。但是,用戶還是必須考慮云災難恢復解決方案的細節,尤其是恢復方面,例如供應商是否提供 了SLA,云環境是如何處理用戶和應用程序的重新連接的,以及災難事件結束后退出策略是什么樣的等等。企業還應當考慮在解決方案中包括一個從本地或有限災 難提供恢復功能的現場設施。
何為DRaaS?
災難恢復(DR)即服務實際上就是我們所定義的云災難恢復。事實上,這兩個詞被大多數希望盡可能擴大吸引力的企業交替使用著。這與基礎設施每月支付費用有所不同,就好像云供應商只是租用云資源或者還提供了一些現場設施。但是,由于云災難恢復并不是一種用戶提供設備的主機托管解決方案,所以他們仍然將災難恢復打包作為服務進行銷售。
原文鏈接:http://www.searchcloudcomputing.com.cn/showcontent_87380.htm