許多災(zāi)難恢復(fù)(DR)規(guī)劃旨在當(dāng)災(zāi)難事故發(fā)生后,將關(guān)鍵的系統(tǒng)和數(shù)據(jù)恢復(fù)(或稱故障切換)到另一個站點(diǎn),并在之后恢復(fù)(或稱故障恢復(fù))至原來系統(tǒng)的原始運(yùn)營狀態(tài)。而當(dāng)系統(tǒng)恢復(fù)到其原始運(yùn)營狀態(tài)時(shí),企業(yè)就能夠恢復(fù)業(yè)務(wù)運(yùn)作。
故障切換和故障恢復(fù)流程相當(dāng)之復(fù)雜,并且必需在事先仔細(xì)規(guī)劃并測試。當(dāng)切換到一個備用站點(diǎn),相應(yīng)的技術(shù)應(yīng)當(dāng)能夠接管應(yīng)用,尤其是運(yùn)營系統(tǒng)、網(wǎng)絡(luò)訪問以及帶寬、足夠的數(shù)據(jù)存儲、數(shù)據(jù)庫、文件和設(shè)備。不過,在切換回原系統(tǒng)之前必需解決一些額外的情況。本篇將分析在故障切換和恢復(fù)系統(tǒng)至主站點(diǎn)之前所要解決的各項(xiàng)問題。
如果企業(yè)規(guī)模較大,有諸多辦公室和完善的IT部門,那么在你故障切換和故障恢復(fù)時(shí)可能不會遇到太大的障礙。這是因?yàn)槟阍趥}庫中應(yīng)當(dāng)會留有備份資源,比如服務(wù)器、桌面系統(tǒng)、筆記本電腦和其它設(shè)備,在恢復(fù)站點(diǎn)可以進(jìn)行快速地替換。不過如果你的企業(yè)規(guī)模較小并且沒有這種額外的資源,你的恢復(fù)選擇可能會比較局限。
對于中小型企業(yè)(SMB),有許多種災(zāi)難恢復(fù)可供選擇,不過必需在財(cái)務(wù)資源、員工、物理空間、已有系統(tǒng)和所需數(shù)據(jù)之間進(jìn)行平衡。
不過當(dāng)你準(zhǔn)備恢復(fù)(故障恢復(fù))至原系統(tǒng)時(shí),事故發(fā)生后的環(huán)境可能和之前一樣,但也可能不一樣。在故障恢復(fù)時(shí),你通常有兩種可能性:你之前的辦公環(huán)境(假如和事故前沒什么兩樣);抑或是一個不同的場所,部分或甚至全部失去了你原有的辦公空間。
在故障切換時(shí),應(yīng)當(dāng)將以下問題作為整體解決的一部分加以考慮確認(rèn):
現(xiàn)有系統(tǒng)和相關(guān)軟件可以復(fù)制在備用站點(diǎn)中(物理設(shè)備和基于云的解決方案)。
所有的重要數(shù)據(jù)(例如日常工作文件)和信息(例如用戶記錄)可以復(fù)制在備用站點(diǎn)中,并且時(shí)間節(jié)點(diǎn)盡可能接近事故發(fā)生時(shí)。
特定的故障切換軟件(例如Double-Take)在兩個站點(diǎn)都可用來啟動故障切換作業(yè)。
有足夠的網(wǎng)絡(luò)帶寬(例如通過因特網(wǎng))傳輸數(shù)據(jù)至進(jìn)行故障切換的備用站點(diǎn)。
當(dāng)準(zhǔn)備恢復(fù)至原站點(diǎn)時(shí),測試系統(tǒng)和基礎(chǔ)架構(gòu)來確保其工作正常;確保有足夠的存儲容量處理返回的系統(tǒng)和數(shù)據(jù);并且確保有足夠的網(wǎng)絡(luò)帶寬來用于故障恢復(fù)。
現(xiàn)在,如果你的原站點(diǎn)并不可用,你的災(zāi)難恢復(fù)規(guī)劃必須啟動如下步驟:
獲取新的硬件(例如服務(wù)器、存儲和路由器)和軟件(例如操作系統(tǒng)和應(yīng)用程序)來支持你實(shí)現(xiàn)和原環(huán)境類似的運(yùn)作環(huán)境。
確保空間來放置新的IT設(shè)備。
獲取新的桌面系統(tǒng)和周邊設(shè)備。
安裝故障切換/故障恢復(fù)軟件,如果在你的恢復(fù)規(guī)劃中有這部分策略的話。
確保網(wǎng)絡(luò)帶寬足以支持故障恢復(fù)工作。
再次提醒下,如果你是中小型企業(yè),請考慮購買數(shù)TB的外部存儲來備份你的系統(tǒng)和數(shù)據(jù)。這些存儲設(shè)備可以在許多辦公供應(yīng)商那里購得。同時(shí),部署“第二層備份”也是個不錯的作法,以防你的故障切換和故障恢復(fù)部署沒有如期工作。
好消息是市場上有大量用于中小型企業(yè)(以及大型企業(yè))的故障切換和故障恢復(fù)工具。無論部署何種策略,你需要牢記以下關(guān)鍵點(diǎn):
確保災(zāi)難恢復(fù)規(guī)劃中的故障切換和故障恢復(fù)活動的正常運(yùn)作。
和已確定的數(shù)據(jù)恢復(fù)供應(yīng)商協(xié)作安排應(yīng)急備份和恢復(fù)。
將災(zāi)難恢復(fù)規(guī)劃文檔化,其中清晰地概括故障切換到備用站點(diǎn)以及故障恢復(fù)回主站點(diǎn)或新站點(diǎn)的各項(xiàng)步驟(例如具體腳本)。
建立IT硬件和軟件的主和備用源。
每年測試故障切換和故障恢復(fù)流程和系統(tǒng),確保其工作正常。(最好每周末時(shí)進(jìn)行一次測試,不過桌面的演練同樣有效)
明確災(zāi)難事故中員工的角色和職責(zé)。
培訓(xùn)IT員工故障切換和故障恢復(fù)的流程內(nèi)容總結(jié)
確保在進(jìn)行災(zāi)難恢復(fù)規(guī)劃時(shí),你會考慮將IT運(yùn)營故障切換至另一個備用站點(diǎn),并且你如何恢復(fù)(故障恢復(fù))至原始站點(diǎn)或可能的新站點(diǎn)。很有可能你的故障恢復(fù)會比故障切換更為復(fù)雜,因此準(zhǔn)備好仔細(xì)檢驗(yàn)所有的可用方式。