摘要:云基礎設施的出現,無論其是公共云或是私有云,都極大地改變了當今數據中心的操作運營方式。其增加了數據中心的靈活性,可擴展性和可靠性,同時降低了成本。但還有一個方面,云計算可以發揮其他任何措施都無法代替的重要作用:可用性。
通常情況下,數據中心工作負載被分為兩類:關鍵性的和非關鍵性的。關鍵性工作負載無法容忍哪怕幾分鐘的停機時間,通常用實時復制解決方案保護。這些解決方案需要一個重復系統作為恢復實例,應生產工作負載經歷停電。另一方面,非關鍵工作負載可以容忍范圍廣泛的停機時間,因而典型地是未保護的或以圖像或磁帶歸檔的解決方案備份。云技術帶來了一個折中的解決方案,這使得非關鍵工作負載也可以獲得昂貴和復雜的高可用性解決方案,如故障轉移的好處的可能性,而無需高成本。
數據中心管理人員可以利用如下四種方法通過采用云基礎設施來提高他們數據中心的可用性。
1、利用云規模縮放和云爆發減少資源爭用。
雖然引發計劃外停機發生的原因有很多,其中一方面便是由于處理進程爭奪資源(資源競爭)所造成的。隨著數據中心業務的增長,進程對于資源的需求也在隨之增長,數據中心的工作負載通常不是用來處理這方面需求的,因此,在高峰負荷時,就可能會出現停機中斷。而這便是云的規模縮放和云爆發發揮用武之地的時候了。云計算通過允許在云上很容易自動創建附加工作負載,而無需改變或定制其應用程序的做法,提供了一種管理工作負載的急劇變化需求。公共云尤其更是如此,因為數據中心可以“突發”或擴展他們的基礎設施到公共云。這種方法通過在必要時自動縮放規模到云,從而改善資源爭用的狀況,并確保資源能夠適應高峰時期的需求,防止出現停機時間,提高整體可用性。
2、在云中復制工作負載以創建不對稱的“熱備份”。
云基礎設施創造了非凡的克隆完整工作負載堆棧的能力(操作系統、應用程序和數據)。當通過利用技術將底層基礎架構與解耦的工作負載堆棧結合,這種“便攜式”工作負載可以導入到公共云或私有云。在停機就生產工作負載的情況下,可以重新連接到云,進程處理服務就可以恢復,即使生產工作負載和恢復工作負載是在不同的基礎設施。云計算使數據中心超越傳統的“冷”備份,而在“冷”備份中,只有數據是被保護的,這就需要操作系統,并允許應用程序在數據恢復之前執行手動恢復。不對稱的“熱備份”的概念正是因為有了云而成為可能的,因為每個工作負載以圖像形式被現場存儲,運行虛擬機,可以當生產服務器正在修理時接管工作負載。這種方法不同于傳統的復制解決方案,其中復制一套硬件被要求接管工作負載應當在生產工作負載失敗時。生產情況發生了變化,定期復制到恢復實例以保持最新狀況。云計算帶來了一個靈活恢復實例以節省成本的效益,因為熱備份可以在不使用時“停放”,或可以配置一個較小的實例。
3、針對關鍵工作負載使用“故障轉移(failover)”和“自動恢復(failback)”的概念。
軟件復制技術已經存在了幾十年,被用來保護和復制“實時”的生產和恢復工作負載。通常這些設置從軟件和服務的角度來看,非常昂貴。因為他們往往需要重復相同的恢復安裝,從而使得維護和操作基礎設施的成本加倍。同時,在數據中心的其余工作負載則只有低水平的保護,通常只有恢復存儲圖像和磁帶格式,這往往需要幾天的時間來恢復,同時還要耗費大量的人力。而通過自動切換用戶或進程從生產狀況到恢復情況,對于數據中心多數低水平保護的工作負載停機時間可降低高達80%。
4、為“異地”冗余使用不同的基礎設施。
為了增加保護,數據中心應該考慮采用不同的云基礎設施作為災難恢復策略的一部分。云基礎設施可以很容易出現故障,而數據中心需要額外的保護,工作負載可以被復制到異地的不同的云服務提供商。物理機到物理機,物理到云,或云到云的復制可以提供保護,強大到足以抵御拒絕服務網站的攻擊,黑客入侵或自然災害。