技術(shù)架構(gòu)師Steve Hannah起初開始部署服務器虛擬化是為了減少數(shù)據(jù)中心中對占用大量空間的物理服務器的需求。但是位于威斯康辛州格林維爾市的輔助學習用品供應商School Specialty公司的Hannah和IT團隊都意識到,虛擬化災難恢復的敏捷性和靈活性可能會徹底革新公司的標準方法。
School Specialty最初的災難恢復策略是來自一個傳統(tǒng)的熱站點服務供應商,它是通過公司主數(shù)據(jù)中心的服務器備份來提高物理服務器的速度。
“要實現(xiàn)物理服務器的恢復,我們就必須持續(xù)地了解確切的硬件,其中包括模型種類和BIOS級別,以便保證它在熱站點中的復制,”Hannah說道。
但是建立傳統(tǒng)的熱站點并且運行是需要使用公司數(shù)據(jù)中心的備份磁帶進行物理傳輸。Hannah預計,使用這個方法來恢復School Specialty的系統(tǒng)至少需要一周時間。
“使用備份磁帶運行其他人的站點實際上是毫無優(yōu)勢的,”他說道。“虛擬化能夠為我們實現(xiàn)磁帶和純物理服務器恢復無法達到的速度。”
服務器虛擬化給服務器硬件增加了一層抽象,從而在不需要改變硬件驅(qū)動器或者確保軟件兼容性的情況下,就能夠?qū)崿F(xiàn)了虛擬機器在物理服務器之間的移動,Hannah說道。
虛擬化災難恢復開創(chuàng)了一種新策略
School Specialty的新災難恢復有大約1/3是通過服務器虛擬化計劃來規(guī)劃和實現(xiàn)的,從而必須建立一個新的附屬遠程數(shù)據(jù)中心來利用服務器虛擬化的移動性。Hannah已經(jīng)確定將公司600個虛擬機鏡像中的50個作為關(guān)鍵任務負載虛擬機,它們必須與遠程的數(shù)據(jù)中心實現(xiàn)同步。School Specialty使用VMware的vCenter Site Recovery Manager來管理虛擬環(huán)境,同時他還使用部署的虛擬化存儲解決方案來復制主儲網(wǎng)絡和遠程存儲網(wǎng)絡上的虛擬機器。這個遠程站點不僅控制著主數(shù)據(jù)中心的一部分服務器刀片和硬件,而且設計時還考慮了出現(xiàn)災難事件時恢復重要虛擬機的功能。
Hannah決定這個遠程站點與主數(shù)據(jù)中心的距離為30到50英里。“我們很幸運,居住在一個不會受到諸如龍卷風或者地震等大型自然災害影響的地區(qū),因此我們可以使我們的遠程站點保持相對較近的距離,”他說道。
與只在災難恢復期間才可用的傳統(tǒng)熱站點不同,School Specialty可以持續(xù)地使用新的遠程站點的基礎架構(gòu)。公司的開發(fā)人員和管理員將遠程數(shù)據(jù)中心作為升級商業(yè)應用程序的開發(fā)運輸環(huán)境。在將新升級的應用程序部署到主數(shù)據(jù)中心的生產(chǎn)環(huán)境之前,這些應用程序都必須在這個開發(fā)環(huán)境中進行性能測試、用戶接收測試和任何形式的最終質(zhì)量檢查。一旦發(fā)生了災難,公司可以在遠程站點啟用最新的生產(chǎn)虛擬機,而不需要從磁帶或者其它備份介質(zhì)上進行恢復。在需要的情況下,生產(chǎn)環(huán)境和開發(fā)環(huán)境可以并行地運行。
“在啟動災難事件處理過程時,我們可以決定是否關(guān)閉開發(fā)實例以便釋放一些容量,”School Specialty的Unix系統(tǒng)管理員Jason Seymour說道,“我們事實上是喜歡這種將開發(fā)環(huán)境和災難恢復環(huán)境共享同一個硬件的做法。實際上,我們是在我們的災難恢復硬件上運行一個持續(xù)的測試。”
通過一個運行在他們的遠程站點上的實時環(huán)境,管理員可以利用與生產(chǎn)環(huán)境相同的監(jiān)控和管理工具來檢測和修復任何可能發(fā)生的問題,例如硬件故障或者過程失效。這與全部依靠第三方熱站點供應商來接管災難發(fā)生時的負載方式是截然不同的。
由于School Specialty完全掌握附屬環(huán)境的控制,因此它總是可以在超重負載期間選擇將生產(chǎn)負載轉(zhuǎn)移到該環(huán)境上。通過這種方法,災難恢復站點就成為了虛擬環(huán)境的另外一個組成部分,而不是那種每年都需要測試但僅僅在極少發(fā)生的危急情況下使用的一個服務。