摘要:從根本上說,災(zāi)難恢復(fù)計劃的過程并不是以技術(shù)為中心的。所以,當(dāng)企業(yè)在發(fā)生計劃外的停運(yùn)之后,虛擬化要如何才能使其更快、更容易的恢復(fù)服務(wù)呢?現(xiàn)如今,虛擬化已經(jīng)徹底改變了我們在數(shù)據(jù)中心部署應(yīng)用程序的方式,而這種改變甚至可以說也已然延伸到了災(zāi)難恢復(fù)領(lǐng)域。
現(xiàn)如今,虛擬化已經(jīng)徹底改變了我們在數(shù)據(jù)中心部署應(yīng)用程序的方式,而這種改變甚至可以說也已然延伸到了災(zāi)難恢復(fù)領(lǐng)域。
以前,需要花費(fèi)數(shù)周或數(shù)月的時間來完成的服務(wù)器的配置,現(xiàn)在轉(zhuǎn)變成了僅僅在幾分鐘內(nèi)就能自動完成的任務(wù)。虛擬化通過諸如快照、vMotion和HA / FT(高可用性/容錯)等功能,為企業(yè)用戶提供了敏捷性、靈活性和更大的彈性。
與此同時,企業(yè)的災(zāi)難恢復(fù)也發(fā)生了轉(zhuǎn)變,在物理服務(wù)器環(huán)境中,從一次計劃外停運(yùn)的恢復(fù)的過程需要將故障轉(zhuǎn)移到一處復(fù)制的主環(huán)境或具備相同的硬件和操作系統(tǒng),以便讓備份可以恢復(fù)。
有人聲稱,虛擬化摒棄了許多這樣的過程,使企業(yè)的災(zāi)難恢復(fù)得以更容易和更簡單的部署,但到底到了什么程度了呢?
在這篇文章中,我們將分析并研究災(zāi)難恢復(fù)規(guī)劃、配置過程的每個階段,評估虛擬化在多大程度上可以提供幫助。
物理到虛擬的比較
服務(wù)器虛擬化是用來整合和簡化應(yīng)用程序工作負(fù)載的一款相當(dāng)棒的工具。由于硬件往往未被充分利用——通常都是每款操作系統(tǒng)都只安裝了一款單一的應(yīng)用程序——而虛擬化則為每臺服務(wù)器在提供了隔離和管理效益等好處的同時,使得該物理資產(chǎn)變得更有效。
虛擬服務(wù)器是虛擬磁盤文件的組合,其代表了物理磁盤,再加上處理器、內(nèi)存和其他附屬設(shè)備的配置信息。這使得虛擬服務(wù)器/或虛擬機(jī)(VM)成為高度便攜的,并允許虛擬化提供諸如高可用性(在硬件發(fā)生故障后,將一臺虛擬機(jī)安置到另一臺服務(wù)器之上)和容錯性(如果硬件出現(xiàn)故障,運(yùn)行一個虛擬機(jī)的ghost 圖像,來接管服務(wù))等功能,而無需配置額外的硬件或許多復(fù)雜的配置。能夠把一臺虛擬機(jī)當(dāng)作一組文件的功能意味著備份和恢復(fù)也變得很簡單了。虛擬機(jī)運(yùn)行在其之上的硬件可以改變(在一定范圍內(nèi)),這使得將物理硬件轉(zhuǎn)換到虛擬設(shè)備成為了虛擬機(jī)管理程序的工作。這意味著虛擬機(jī)及其封裝的工作負(fù)載比以往更輕便。
災(zāi)難恢復(fù)規(guī)劃及其執(zhí)行
讓我們來看看一個典型的災(zāi)難恢復(fù)計劃的關(guān)鍵要素,然后在看看虛擬化技術(shù)在這一過程中可以提供怎樣的幫助吧。
實施災(zāi)難恢復(fù)計劃的第一步便是要了解業(yè)務(wù)的需求,并為其服務(wù)等級目標(biāo)匹配相應(yīng)的應(yīng)用程序。在災(zāi)難恢復(fù)領(lǐng)域,標(biāo)準(zhǔn)的幾個考察要點是恢復(fù)時間目標(biāo)(RTO)和恢復(fù)點目標(biāo)(RPO)。
RTO通過應(yīng)用程序指定了其可以容忍的服務(wù)中斷的時間,在該時間范圍內(nèi),服務(wù)必須恢復(fù)。關(guān)鍵任務(wù)應(yīng)用程序的容忍度低,甚至是零(這就意味著服務(wù)必須在任何時候都是持續(xù)穩(wěn)定的)。
RPO 描述了一款應(yīng)用程序所能夠容忍的數(shù)據(jù)丟失量。其可能是零(即,不能出現(xiàn)數(shù)據(jù)損失的情況)或以分鐘或小時為單位進(jìn)行測量。一些非核心的應(yīng)用程序(如用于報告的應(yīng)用程序)可以忍受長達(dá)24小時的RPO,特別是對于那些數(shù)據(jù)可以由其他來源產(chǎn)生的。
在這一點上,技術(shù)的選擇沒有軸承。開展業(yè)務(wù)影響/風(fēng)險分析是基于對業(yè)務(wù)需求的人工評估。但隨著我們在災(zāi)難恢復(fù)規(guī)劃過程中的進(jìn)一步發(fā)展,我們會發(fā)現(xiàn)逐步會有更多的技術(shù)選擇出現(xiàn)。那么,問題來了:虛擬化技術(shù)到底在哪里可以為企業(yè)的災(zāi)難恢復(fù)提供幫助呢?
災(zāi)難恢復(fù)風(fēng)險評估
在災(zāi)難恢復(fù)規(guī)劃過程中的下一個步驟便是利用服務(wù)要求分析得出影響,并進(jìn)行風(fēng)險評估。
對于每一款應(yīng)用程序或系統(tǒng),我們均可以映射 RTO/RPO 要求到可能發(fā)生的風(fēng)險類型,評估這些風(fēng)險發(fā)生的可能性,并分別開始針對每一款應(yīng)用程序或系統(tǒng)制定減災(zāi)和恢復(fù)策略。下表顯示了一些例子:
從這一點上,我們可以看到,可以在物理和虛擬基礎(chǔ)架構(gòu)之間進(jìn)行選擇。
第一個示例演示了如何利用一款基于物理硬件的集群解決方案來實現(xiàn)服務(wù)要求的交付。該應(yīng)用程序可以容忍長達(dá)30分鐘的中斷,雖然數(shù)據(jù)丟失是不可接受的。
這可以從一個成本非常昂貴、鏡像故障轉(zhuǎn)移的物理基礎(chǔ)設(shè)施;或者一臺虛擬機(jī)、采用高可用性(如VMware HA),實現(xiàn)交付。此功能可以自動重啟一款應(yīng)用程序到二級硬件,這可以使用共享的存儲基礎(chǔ)設(shè)施,以確保零RPO。
第二個例子展示了一家企業(yè)的網(wǎng)站需要確保24/7 全天候無停機(jī)時間。在這種情況下,應(yīng)用程序是基于靜態(tài)數(shù)據(jù)的,因此可以從一臺或多臺web服務(wù)器實現(xiàn)所有對同一數(shù)據(jù)池訪問的交付。如果任何一臺服務(wù)器出現(xiàn)狀況,負(fù)載均衡軟件將把訪問流量重定向到一臺新的。
在這種情況下,虛擬化可以通過在單獨(dú)的虛擬機(jī)提供Web服務(wù)器提供幫助。如果某硬件發(fā)生故障,一臺新的web服務(wù)器可以從一個模板進(jìn)行部署,并添加到負(fù)載均衡列表,而無需更復(fù)雜的HA或集群軟件。該解決方案也可以跨多個地理位置實現(xiàn)交付。
第三個例子強(qiáng)調(diào)了一款傳統(tǒng)的應(yīng)用程序可以如何通過傳統(tǒng)的或基于虛擬機(jī)的備份得到保護(hù)。較之使用物理基礎(chǔ)設(shè)施,一款虛擬的解決方案還可以提供更快的備份和恢復(fù)功能。
建立一套災(zāi)難恢復(fù)計劃
現(xiàn)在,我們已經(jīng)確定了企業(yè)業(yè)務(wù)對于應(yīng)用程序的需求,并量化了相關(guān)的風(fēng)險,然后,我們就可以開始全面映射減災(zāi)和恢復(fù)方案,并將其作為一款應(yīng)用程序和基礎(chǔ)架構(gòu)設(shè)計的一部分了。在這其中,較之純物理服務(wù)器的操作,虛擬化提供了一些獨(dú)特的特性,可以幫助實現(xiàn)業(yè)務(wù)連續(xù)性。其中包括:
·能夠在幾分鐘之內(nèi)啟動新的虛擬機(jī),基于模板的應(yīng)用程序工作負(fù)載功能。
·通過容錯和高可用性的應(yīng)用程序恢復(fù),消除了對于復(fù)雜的恢復(fù)解決方案的需要,其中包括對于部署地理位置的要求。
·使用諸如VMware的站點恢復(fù)管理器等工具,實現(xiàn)集成整合和虛擬機(jī)故障的自動轉(zhuǎn)移到遠(yuǎn)程位置。
·較之生產(chǎn)現(xiàn)場,抽象硬件允許虛擬機(jī)從不同的硬件恢復(fù),其可以是更低或更高的規(guī)格或整合。
·虛擬機(jī)/服務(wù)器備份基于來自底層存儲的基于文件圖像的拷貝。
·利用故障轉(zhuǎn)移的集成整合,通過使用基于主機(jī)的工具,以避免崩潰一致的(crash-consistent)的副本,實現(xiàn)更高的應(yīng)用程序恢復(fù)幾率。
·災(zāi)難避免通過使用諸如VMotion這樣的工具。
所有這些功能允許應(yīng)用程序得以通過比采用物理服務(wù)器所能夠達(dá)到的更有效的方式被部署在基礎(chǔ)設(shè)施。
測試和驗證
在災(zāi)難恢復(fù)計劃設(shè)計完成之后,就需要對其進(jìn)行測試和驗證。是否使用虛擬基礎(chǔ)設(shè)施,該計劃必須包括驗證應(yīng)用程序能夠在災(zāi)難恢復(fù)模式和恢復(fù)正常運(yùn)營后,滿足每款系統(tǒng)的服務(wù)水平目標(biāo)的相關(guān)條款 (RPO/RTO)的功能。
虛擬化也不能避免測試(以及確認(rèn)基礎(chǔ)設(shè)施各部分的配置是否正確的工作),但它可以使測試過程變得更簡單。例如,在一個災(zāi)難恢復(fù)站點測試功能和數(shù)據(jù)完整性采用會更容易,同時還能夠保持虛擬機(jī)的隔離,以避免與生產(chǎn)環(huán)境的沖突。這可以在不影響災(zāi)難恢復(fù)過程的前提下實現(xiàn),而如果采用物理服務(wù)器進(jìn)行測試,直到測試結(jié)束的整個測試過程,生產(chǎn)服務(wù)都存在風(fēng)險。
總結(jié)
虛擬化為實現(xiàn)更高效、更簡單的災(zāi)難恢復(fù)提供了許多機(jī)會。但是,正如我們所看到的,其并不是一個經(jīng)過了深思熟慮的、詳細(xì)而全面、且基于企業(yè)業(yè)務(wù)需求而制定的災(zāi)難恢復(fù)計劃的替代。隨著技術(shù)的不斷發(fā)展,災(zāi)難恢復(fù)計劃需要不斷進(jìn)行審查和更新,以反映當(dāng)前的虛擬化功能,以便成為確保業(yè)務(wù)連續(xù)性的一個“活”的文件。