云計算災難恢復是一種備份和恢復策略,不僅適用于數據,還適用于整個虛擬機、服務器和企業網絡。稱其是一種策略,是因為企業需要自己決定如何更好地使用這樣的服務。
與其簡單地訂閱服務選項并希望獲得最佳服務,不如提前了解組織的優先級,以便制定適當的災難恢復計劃。否則,當災難發生時,企業可能無法及時訪問關鍵資源。這種錯誤的結果可能成本非常高昂,甚至是致命的,因此了解可用云計算災難恢復選項之間的權衡是很重要的。
對于任何規模的組織而言,云計算災難恢復都是一個具有吸引力的選擇。這是因為云計算災難恢復與傳統的災難恢復方法相比具有速度和成本的優勢。隨著企業基礎設施繼續變得更加虛擬化,越來越多的數據和IT運營正在向云平臺轉移。因此,他們的災難恢復策略需要不斷發展。
不同的云計算災難恢復方法的優缺點
云計算災難恢復比傳統形式的災難恢復更靈活,因為訂戶擁有更多災難恢復解決方案。例如,云計算用戶沒有將數據從數據中心備份到磁帶,而是有更多選項,其中包括:
•從數據中心備份。
•從私有云備份。
•從用于存儲數據的同一云計算服務備份。
•從混合云環境備份。
•恢復到原始環境。
•恢復到云端而不是內部部署。
鑒于云計算災難恢復具有更大的靈活性和相對較低的成本,它是一個有吸引力的選擇,而很多企業明智地首先考慮其優先級。實際上,任何良好的云計算災難恢復計劃的一部分都優先考慮資產的災難恢復。如果發生災難,那么哪些數據是關鍵,哪些不是?
例如,當涉及到數據時,就有了熱存儲、暖存儲和冷存儲的概念。“熱數據”是指需要隨時可用的數據。在這三種數據類型中,“熱數據”是最經常訪問的數據。“暖數據”是指訪問頻率低于“熱數據”的數據,例如用于報告目的的歷史數據。“冷數據”是很少使用但必須保留的數據。數據的分層方法通知相關的服務級別協議(SLA)以及存儲數據的相關成本。
這種類似溫度類型的概念適用于整個站點的災難恢復:
•熱站點是生產站點的完整副本。其目的是在發生自然災害或人為災難時盡量減少停機時間。
•熱站點已在主站點和輔助遠程備份站點之間建立連接。恢復被延遲,但時間沒有冷站點那么長。
•冷站點基本上沒有為災難恢復做好準備,因此當災難發生時,需要花費大量時間才能使站點重新聯機。毫不奇怪,冷站點是成本最低的選擇,盡管在災難發生時,從總成本的角度來看,它可能被證明是一個昂貴的選擇。
云災難恢復使用了一個從冷到熱的類似模型。具體來說,客戶可以選擇備份(時間最慢和成本最低的選項)、環境的最低版本、環境的部分版本或完整(多站點)災難恢復,這是一種存儲區域網絡(SAN)之間的企業備份復制方法,可在云平臺和內部部署的數據中心運行。多站點的好處是,在恢復過程中流量被重新路由到云平臺。
云計算災難恢復計劃
云計算災難恢復計劃始于許多事物的優先級,其中包括應用程序、數據和服務。每個資產都應具有與之關聯的可接受的恢復目標。了解災難恢復計劃作為服務的重要提示至關重要。
需要優先考慮的原因有兩個:成本和操作。平等對待所有資產既不符合成本效益,也不實用,因為組織可能會過度支付或不支付服務費用。如果某個特定應用程序,其他IT資產或某些類型的數據不可用,會對業務產生什么影響?有些資產比其他資產更重要,因此云計算災難恢復計劃應該反映出這些優先事項。
兩個重要的云計算災難恢復指標是恢復時間目標(RTO),即將業務流程恢復到目標級別所需的時間,以及定義可接受數據丟失級別的恢復點目標(RPO)。目標指標需要定義為計劃的一部分。
了解對業務連續性的威脅范圍也很重要。也就是說,自然災害或人為災害可能導致業務中斷。例如,當哈維颶風襲擊美國休斯頓地區時,該地區的許多企業由于缺乏災難恢復計劃而損失慘重。
影響災難恢復計劃的其他要素包括需要在發生災難時通知相關負責人。IDC公司估計,對于財富1000強公司的非關鍵應用程序,每小時計劃外應用程序停機時間的總成本約為每小時10萬美元。關鍵的應用程序故障每小時可能損失50萬到100萬美元。了解成本和恢復時間之間的權衡對于企業備份和恢復管理至關重要。
云計算災難恢復的好處
•靈活性:組織不依賴于任何特定類型的體系結構,因此無論他們處在云計算的哪個階段,他們都可以選擇滿足其需求的選項。
•成本:云計算災難恢復服務比物理復制環境成本更低。這一事實使中小型組織可以利用他們以前無法承受的災難恢復選項。
•更快的恢復時間:從云計算備份比從磁帶備份更快。托管這兩個站點或將數據存儲在與云計算災難恢復服務相同的云平臺中可以獲得額外的時間優勢。云計算的虛擬化特性也優于物理服務器。例如,如果虛擬化服務器出現故障,則可以在幾分鐘內啟動另一個虛擬服務器。而虛擬化服務器是獨立于技術的,因此可以在其上存儲不同的應用程序、操作系統、數據和修補程序,因此所有這些都將使用虛擬服務器自動還原。在非虛擬化環境中,必須單獨還原每個元素。
•彈性:云計算的一般優勢適用于云計算災難恢復。隨著數據的增長和環境變得更加復雜,可擴展性不是問題。
•合規性:更快的恢復時間有助于避免因錯過截止日期而受到處罰。
云災難恢復的風險
•安全性:最大的問題是托管備份環境或數據的云環境的多租戶性質。
•恢復:如果沒有全面的規劃,可能需要更長的時間。應考慮資產優先級、服務等級協議(SLA)和原始環境與備份環境之間的連接帶寬。
•數據控制:數據很容易進入云計算環境,但可能并不容易。請務必閱讀使用條款,并注意細節。
•中斷:云計算環境并不完美。明智的做法是將此風險視為整體災難恢復策略的一部分。
云災難恢復服務
云計算提供商和托管服務提供商(MSP)可提供云計算災難恢復服務。兩者都提供云計算服務,但它們之間的區別在于托管服務提供商(MSP)提供更高級別的IT支持。在這兩種情況下,確保服務水平協議(SLA)由企業的優先級、恢復時間目標(RTO)和恢復點目標(RPO)驅動是很重要的。
云計算提供商
•亞馬遜AWS
•Iland
•Microsoft Azure
托管服務提供商
•Acronis
•AT&T
•IBM Cloud
•Rackspace公司
•Solar Winds
云災難恢復選項
備份 | 最小 | 部分 | 復制 | |
恢復速度 | 最慢 | 較慢 | 較快 | 最快 |
優點 | 費用 | 成本——無論其定義什么,首先恢復核心 | 恢復速度——任何定義為最高優先級的部分環境 | 恢復速度——原始數據和備份數據保持同步。 |
缺點 | 恢復速度 | 恢復速度 | 成本 | 成本 |
成本 | 最慢 | 較低 | 較高 | 高 |