但是,IT災難不僅限于網絡攻擊,硬件故障、人為錯誤、停電以及颶風或地震等自然災害也有可能破壞企業的業務流程,并將有價值的數據置于風險之中。
這凸顯了企業需要采取措施確保最小化停機時間的重要性,不過好在很多企業正在為此做出積極的響應。根據Spiceworks公司最近的一項研究,95%的組織都制定了災難恢復計劃,其中90%的計劃包括災難恢復(DR)計劃中的數據完整性和備份。
其他領域包括維護網絡和互聯網連接(62%),電源/電力連續性(57%)和本地服務器/應用程序正常運行時間(57%)。但是只有28%的企業表示,在其災難恢復計劃中包含云計算或托管服務,考慮到現在有大量的企業依賴基于云計算的平臺,這一點令人驚訝。
這表明,災難恢復并沒有一個萬能的解決方法,企業需要投資滿足其獨特需求,并確保選擇最適合其特定需求的災難恢復解決方案。
尋找合適的人選
企業需要回答的第一個問題是“災難恢復解決方案如何適合現有的基礎設施?”。一般來說,大多數探索和采用災難恢復解決方案的企業屬于三個部門之一:擁有物理數據中心,并希望其災難恢復服務基于數據中心基礎設施的組織;擁有物理數據中心,但希望其災難恢復解決方案基于云平臺中的組織;以及希望其數據中心基礎設施和災難恢復解決方案都是基于云計算的組織。
對于將數據存儲在物理數據中心,并希望災難恢復位于數據中心基礎設施上的組織來說,它們通常需要單獨的副本環境,以便能夠提供全部或部分客戶的服務。這可能是一種成本高昂的方法,因為企業必須考慮與維護設施、支付電力和購買額外硬件相關的成本。
而擁有物理數據中心但希望其災難恢復解決方案位于云平臺中的組織,以及希望其數據中心基礎架構和災難恢復解決方案基于云計算的組織,都依賴云計算提供商的數據中心作為恢復站點。
雖然每種方法各有利弊,但基于云計算的系統被證明是最具成本效益和最有效的方法,可以最大限度地減少災難事件的影響。但是如前所述,最有效的災難恢復計劃是滿足業務特定需求的計劃。
可以理解,在這三種環境中實施災難恢復所需的流程和解決方案(內部部署、混合部署或云計算)各不相同。企業可以根據需求制定計劃,同時考慮到需要保護的不同基礎設施的性質以及停機對業務的影響。
那么,在制定災難恢復計劃時,企業需要記住什么?將如何選擇確保正確的解決方案?
規劃災難恢復
對于任何災難恢復策略,第一步是將業務應用程序與服務級別目標相匹配,其中有兩個特定的衡量參數:恢復點目標(RPO)和恢復時間目標(RTO)。
恢復點目標(RPO)表示發生災難時業務流程的數據丟失容限(即數據丟失量超出業務需求可接受的數量),而恢復時間目標(RTO)表示在中斷后恢復業務服務所需的時間。不同的應用程序將根據其重要性和業務類型而有不同的要求。例如,eBay公司或亞馬遜公司等主要在線零售商將要求其核心電子商務系統具有較低的恢復點目標(RPO)和恢復時間目標(RTO),而規模較小的企業中的一些應用程序能夠在24小時內脫機。
通過映射其環境并分析特定應用程序的風險和要求,企業可以確定最有效地滿足恢復點目標(RPO)和恢復時間目標(RTO)參數的災難恢復解決方案。他們可能會意識到,內部部署方法最符合其未來目標,或者將所有內容移至云端是滿足客戶需求的最佳方式。
企業可能還必須考慮內部可用的技術技能水平。 雖然這對于擁有大型IT團隊的大規模組織來說并不是什么問題,但是那些根本無法獲得所需技能的小規模組織來說,可能不得不選擇托管的基于云計算的災難恢復服務。
最后,重要的是要記住,不同的需求需要不同的方法實施正確的災難恢復解決方案滿足特定需求,因此企業必須分析其基礎設施類型,并將這些需求考慮在內。
在這個持續可用性預期的時代,很多企業根本無法承受停機的損失,當然必須投資于防止災難發生的解決方案,但當這些解決方案無法阻止災難發生時,企業必須準備好立即做出反應,否則將會面臨客戶投訴的風險。