在系統和應用程序分散在企業和云中的時代,IT領導者必須重新考慮其災難恢復計劃。
多年以來,編寫災難恢復計劃一直是IT部門的責任,但是現在必須重新調整這些計劃,以針對邊緣計算和云計算環境進行故障轉移。有哪些新功能?組織如何修改其計劃?
規則1:IT團隊無法控制邊緣計算
考慮到采用了邊緣計算和其他分布式計算策略,IT團隊不能使用圍繞數據中心構建的標準集中式災難恢復計劃來控制所有這些分布式計算。例如,在使用機器人技術和自動化進行的日常制造中,由生產線主管和制造人員來運行機器人,并負責確保這些資產在不使用時在鎖定區域內安全可靠。在許多情況下,這些制造人員還可能自己安裝和監視/維護設備,或與供應商合作。這些人員在安全性或資產保護以及維護/監視方面沒有IT背景。同時,在IT之外安裝新的邊緣計算網絡和解決方案會使可能發生故障的IT資產數量成倍增加。需要在某個地方記錄災難恢復和故障轉移計劃并對其進行培訓,以便涵蓋這些資產。發生這種情況的最合邏輯的地方是在IT 災難恢復和業務連續性計劃中。
要修改該計劃,IT團隊必須與這些不同的分布式計算小組開展合作。關鍵是讓每個人都參與進來,并致力于記錄災難恢復和故障轉移計劃,然后定期參與和測試。
規則2:云計算應用意味著云計算災難恢復交付
在2018年,Rightscale公司對近1,000名IT專業人員進行了調查,發現他們所在公司采用的云平臺平均數量接近4.8個。
有趣的是,會有多少個公司記錄了災難恢復程序來處理云平臺的中斷。當專家查看客戶使用的云計算供應商時,就想到了這個問題,發現幾乎所有云計算供應商的合同中都有條款,如果發生災難,采用這些條款可以免除責任。
要點:如果企業的IT部門尚未這樣做,則應將其合作的每個云計算供應商都寫入災難恢復計劃中。供應商承諾進行備份和恢復的服務等級協議(SLA)是什么?如果出現故障,企業(或其供應商)的災難恢復計劃是什么?企業是否與供應商達成協議,以每年測試企業在云上用于災難恢復故障轉移的應用程序?
規則3:人身安全很重要
企業的IT團隊越傾向于邊緣計算,找到進入生產工廠或現場辦公室的途徑,物理安全就越來越與災難恢復聯系在一起。如果偏遠沙漠地區的現場辦公室過熱,服務器出現故障怎么辦?或者未經授權的員工進入制造工廠的重要區域并篡改機器人的操作該怎么辦?企業的災難恢復計劃應包括在分布式物理位置(而不僅僅是在中央數據中心)對設備和設施進行定期檢查和測試。
規則4:災難恢復通信必須變得更好
幾年前,一家銀行的數據中心所在地發生了一次地震,IT部門停機中斷,雖然數據中心受到的損害很小,但是整個區域的網絡和通信都已中斷,因此分支機構的員工必須通過保留人工分類帳來處理客戶交易,以便在系統服務返回時將其輸入系統。
在這段時間里,客戶詢問一名柜員出了什么問題,她表示,“我們的服務器都受到了影響。”這個消息在整個社區和媒體中廣泛傳播,很多客戶蜂擁而至,試圖關閉賬戶。
當更多的人控制IT資產(例如邊緣計算)時,這種情況會加劇。這就是為什么擁有良好的溝通如此重要的原因,它解釋了在災難中誰與誰溝通了什么內容,與誰溝通,并且每個人都堅持這樣做的原因。
通常,溝通行為應該是企業的公共關系團隊實施。該團隊與高層管理人員進行協調,并向社區和媒體發布有關災難的聲明。
如果在員工心中沒有牢固地建立和鞏固這種溝通渠道,那么企業可能會發現與實際的災難相比,企業將更多的時間花在從錯誤的溝通中進行災難恢復上。
規則5:災難恢復必須適用于多個地區
隨著邊緣計算和遠程辦公室的興起,毋庸置疑,災難恢復不能集中在一個位置或數據中心。特別是如果企業將云計算用于災難恢復,需要選擇具有多個地理位置的云計算提供商。這樣可以在主數據中心或云計算數據存儲位置發生故障的情況下,將故障轉移到正常運行的位置。這些故障轉移數據中心方案應包括在災難恢復計劃中并對其進行測試。
規則6:必須重新校準災難恢復測試計劃
如果企業要將更多的IT交付給云計算,并部署更多的邊緣計算,則應將新的災難恢復測試方案添加到企業的計劃中,以確保針對所有這些新位置進行災難恢復文檔和測試。企業想知道其災難恢復必須適用于所有公司的災難恢復方案。
規則7:首席代表必須為災難恢復提供更多的口頭服務
向云計算和邊緣計算的遷移使災難恢復變得復雜。這意味著大多數組織都需要審查和修訂其災難恢復計劃。對于大多數組織而言,災難恢復和評審和修訂需要花費時間,而這并不是大多數組織的工作重點,而且往往落后于需要退出的大量項目。由于云計算和邊緣計算技術給IT帶來的變化,首席信息官需要向管理層和董事會說明這些變化對災難恢復的影響,以及需要投入精力和時間修改災難恢復計劃。
規則8:邊緣計算和云計算供應商參與災難恢復應該確保安全
如前所述,大多數云計算供應商在合同中并未對災難恢復和故障轉移給予太多保證。在與云計算供應商簽署合同之前,供應商災難恢復承諾和支持應成為招標書的一部分,也是重要的討論點。
規則9:網絡冗余至關重要
許多組織將重點放在災難發生時的系統和數據恢復上,而很少將重點放在網絡上。但是,考慮到當今全球互聯網和廣域網的作用,網絡災難恢復故障轉移和冗余也應該內置到災難恢復計劃中。