由于某些類型的災難所造成的停機時間,將給有關公司帶來每小時數萬美元的損失。傳統物理服務器的災難恢復不僅運行速度緩慢而且其成本相對較昂貴。但是,實施基于云計算災難恢復(DR)就可實現虛擬服務器的快速恢復,而其成本也僅為傳統災難恢復的一小部分。但是為了實現低成本的快速恢復,云計算經理們必須控制生產場所和災難恢復場所。
數據恢復取決于你的恢復時間目標(RTO),或者你從停機事件中完成恢復的速度要求以及你愿意為之付出的成本。在坐標圖中曲線的緩慢-廉價一端,你可以使用需五至七天RTO的離線恢復方法。
而在曲線的另一端(快速-昂貴)則可以采用只需數分鐘RTO的熱現場恢復。該方法涉及SAN-SAN復制,該方法的特點在于數據在生產場所與DR場所之間始終進行著復制操作。毋庸多言,這一DR方法的代價是極其昂貴的。
當然還有眾多走中間路線的災難恢復方法。例如,冷現場恢復就是指在災難恢復場所提供服務器,但并不載入生產場所的備份。溫現場恢復中的服務器可供管理員們進行設置并在開始恢復之前移動數據庫。
如果你沒有使用生產場所和災難恢復場所之間SAN或SAN-SAN同步備份物理服務器,那么傳統的裸機恢復(BMR)應用就提出了一些挑戰:
• 你需要在災難恢復場所使用一臺物理服務器與在生產場所試圖恢復的物理服務器,它們都具有完全相同的配置、BIOS、驅動器等。這是很難做到的,除非你在完全相同的時間購買了這兩臺服務器。
• 你無法在災難恢復場所找到一臺具有你所需相同配置的物理服務器,因此你必須選擇另一臺服務器、負載和打過補丁的操作系統、負載和打過補丁的應用程序,載入數據,然后配置系統。如果所有的步驟正確完成,系統就可恢復。
• 你還必須配置你的網絡以確保其匹配生產場所的網絡,因此所有虛擬專用網絡(VPN)和VLAN都必須進行相同配置,同時防火墻規則也需相同。事實上,真正延緩IT基礎設施恢復時間的是網絡配置。
轉移至基于云計算的災難恢復
與傳統物理服務器恢復相比,基于云計算的災難恢復不僅加快了恢復速度,而且它還允許你在之后某個時間非現場發送應用程序和相關數據以實現恢復。
但是,當成本是一個問題時、當你無法承受SAN-SAN同步時或者當你不擁有整個物理基礎設施以恢復服務器時,恢復過程可能需要花費很長的一段時間。這就意味著你需要在生產場所和災難恢復場所之間完整復制你的網絡及其變更管理。此舉將確保你在生產場所進行的任何操作都會被復制到災難恢復場所。當你為你的生產場所新增了一個物理服務器,你需要確保你的變更管理過程也會在災難恢復場所中復制一臺物理服務器。
而采用了云計算技術,使用管理程序通過一臺虛擬服務器一旦捕獲了一臺物理服務器,虛擬服務器基本上就會成為一個文件(即VMware vSphere ESXi上的一個VMDF文件)。因此,不同于的發送數據和應用程序至一臺傳統非現場備份并經歷漫長恢復過程的做法,你只需每隔幾個小時將虛擬服務器文件送至災難恢復場所就可實現備份工作。當你需要恢復數據時,只需打開虛擬服務器并確保網絡的正確配置。恢復工作就完成了。
可以周期性地將虛擬服務器文件發送至災難恢復場所,可以是每隔四至六個小時,或者更頻繁。如VEEAN備份與復制這樣基于VMware云計算環境的專用工具就可用于完成該過程。
如果你控制了生產現場和災難恢復現場,這一基于云計算的災難恢復流程將會發揮其作用。例如,如果生產場所使用微軟公司的Hyper-V以完成服務器虛擬化,而災難恢復場所是基于VMware vSphere ESXi的虛擬服務器,那么整個災難恢復過程可能就會無法正常工作。你需要找到一家基于云計算的災難恢復服務供應商,并聘請他來管理Hyper-V虛擬服務器文件。
一個好辦法,也許也是最簡單的辦法就是在云計算中處理災難恢復,即使用一個能夠處理多租戶云計算服務器和提供基于云計算災難恢復服務的托管供應商。由托管服務供應商來控制生產場所和災難恢復場所。
并不是所有的人都能看到基于云計算災難恢復的好處的。其中一個問題就是,當在云計算中管理災難恢復時,企業并沒有真正得到傳統的災難恢復。批評人士認為,那些企業實際上只是得到了備份即服務(BaaS)。可以說,當單一組織掌握生產場所和災難恢復場所時,你只能得到基于云計算的災難恢復。
災難恢復:當錢不是一個選擇時
如果撇開成本預算問題不談,一個完整和傳統的災難恢復方法較之基于云計算全面災難恢復方法又如何呢?在恢復的成本和時間上是否存在著差異呢?
如果錢不是問題,企業可以使用兩種方法的SAN-SAN復制。他們可能會把一切的東東都移至SAN,并在生產場所和災難恢復場所之間執行同步或異步的復制操作。這將快速減少恢復點目標(RPO)并提升你的恢復能力。
由于你需要復制整個文件結構、文件系統等等,所以使用同步SAN的傳統災難恢復方法和基于云計算災難恢復方法所需要的恢復時間基本上是一致。但是傳統方法的總成本要明顯高于基于云計算災難恢復方法。
如果比較不采用SAN-SAN同步的傳統物理災難恢復方法和基于云計算災難恢復方法,那么后者不僅成本低廉而且恢復速度也要快得多,當然其前提條件是生產場所和災難恢復場所以及復制網絡配置的變更都完全處于你的掌控之下。在許多情況下,無法提供網絡變更管理是災難恢復無法正常工作的一個主要原因。
因為,基于云計算的災難恢復方法需要的物理服務器更少、相關任務更少。基于云計算災難恢復方法中的物理服務器包括一些多個虛擬服務器的虛擬托管服務器。例如,可對二十臺物理服務器進行虛擬化,而只需在生產場所和災難恢復場所分別運行兩臺虛擬托管服務器。
規劃一個基于云計算的完整策略
為了設計貴企業的災難恢復策略,你需要確定災難恢復預算和當災難發生時你需要完成服務器恢復的時間。如果你的預算不夠寬裕,而傳統災難恢復方法速度也較慢。而為了提升物理服務器恢復的速度,則要求你投入更多的花費。但是,因為眾多企業用戶正在高速發展虛擬化,所以基于云計算的災難恢復方法就成為了他們災難恢復規劃的一部分。
與使用物理服務器的傳統方法相比,基于云計算的災難恢復可承諾大幅降低災難恢復的成本和時間。基于云計算災難恢復的關鍵在于一個企業應當控制生產場所和災難恢復場所;企業還需要使用變更管理流程復制生產場所的網絡配置。
你可以創建你自己的虛擬化數據中心和獨立的災難恢復場所,它可允許你控制生產場所和災難恢復場所。你還可以使用一個管理流程在災難恢復場所復制生產場所的網絡配置。但是,這是一個工作量非常大的工作,同時價格亦是較為昂貴。盡管這種方法可讓企業的IT部門控制環境,但是構建這種類型的災難恢復環境的成本幾乎等同于重新構建生產場所的費用。
企業還可以選擇一個災難恢復托管供應商,其所使用的虛擬化技術與企業用于實現數據中心虛擬化的技術相同。這將創建一個私有云計算環境,但是將迫使企業與災難恢復托管供應商共同確定變更管理流程。這是很難做到的,因為是由兩個組織而非一個組織行使控制權限。