在過去幾年中,隨著以磁盤為基礎的備份裝置緩慢但卻堅定地取代企業環境中的傳統磁帶機制,災難恢復方案的發展前景也出現了劇烈變化。布朗大學的Nancy Magers表示她的團隊目前正經歷著這樣的過渡階段,希望借此降低硬件成本并從運營層面顯著改進數據保護成效。她在SiliconANGLE CUBEConversation的最新一集當中與Wikibon聯合創始人兼首席分析師Dave Vellante分享了她在這項工作中的所見所感。
作為位于羅得島普羅維登斯的一所知名高校,布朗大學在美國各大院校的建校時間排行中位列第七,同時也是聞名遐邇的常青藤聯盟的成員之一。擔任校方數據恢復與存儲副主任的Magers負責維護大學中的相關基礎設施,整套環境用于支持并保障全校約兩萬名學生、教師以及其他工作人員順利完成日?;顒?,并在故障發生時處理后續問題。2009年布朗大學開始全盤推廣IT現代化項目,由此開始備份與恢復運營的工作內容與任務目標也迎來了更為關鍵的重要地位。
重新構建數據中心
客觀帶來的重大挑戰之一在于,布朗大學的數據中心已經擁有超過二十年運轉歷史,而從頭開始建立一套新的基礎設施在成本上太過高昂。有鑒于此,學校管理層最終認定重新構建數據中心才是最為行之有效的處理手段,但這項工作在執行過程中需要保證終端用戶高度依賴的全部關鍵性任務流程始終處于在線狀態。“即使是對于專門處理數據保護工作的我們來說,這樣的要求也實在難以完成。這意味著我們需要對基礎設施中的所有供電、冷卻、地板乃至墻面進行調整,但同時又不能影響到系統的正常運作,”Magers向Vellante解釋道。
在此之前,布朗大學一直使用磁帶作為備份介質,即在夜間使用量較低時向利用磁帶驅動器記錄數據、再將這些副本運送至第三方存儲供應商處。這種解決方案除了速度緩慢而且價格昂貴之外,其實際效果也不夠可靠;因為校方從來沒有利用災難恢復測試來檢驗保存在外部環境下的信息是否能夠及時而全面地滿足檢索需求。
“我們總要時不時地對某些數據進行恢復,規模較小的備份工作也確實能夠順利進行,但我們從未以全局服務乃至存儲在磁帶上的數據問題為著眼點審視過這套恢復方案,”Magers進一步分析道。在這樣的條件下,數據中心的重新構建工作根本無法展開。在了解情況之后,校方決定撥款以建立一套能夠實際快速恢復、并在施工停機期間保障業務全面連續性的應對方案。
Magers和她的團隊從零開始,為校方的各位決策制定者耐心作出情況說明并幫助對方了解當前所面臨的各項挑戰。“我們讓他們意識到這項改造工程涉及到大量施工作業,其中必然會出現導致服務中止、切斷水流通路乃至其它多種會對日常工作造成嚴重影響的潛在后果。經過此番交流,他們才真正了解到工程引發服務中斷的可能性,”她指出。
接下來的階段是對日常運轉與終端用戶生產率可能遭受到的負面影響作出量化。技術團隊將總計33套關鍵性任務應用納入考查范疇,并根據其各自對停機時長的容忍能力以及校方所能承受的相關數據丟失量對這些應用進行了嚴格的評估與分級,Magers回憶稱。上述工作完成之后,IT部門旋即開始對詳細信息加以整理。
改造前、后對比
如今,布朗大學利用EMC的Symmetrix Remote Data Facility(簡稱SRDF)復制軟件對其數據庫及主要加以保護,并利用該公司的RecoverPoint連續數據保護工具捍衛其VMware虛擬環境。除此之外,布朗大學現在利用內部網絡備份與內部DataDomain重復數據刪除方案相結合,從而徹底取代了向第三方供應商配送磁帶驅動器的陳舊機制。目前數據會被復制到位于紐約的輔助站點當中,這就確保了當颶風等大規模自然災害出現時、校方能夠擁有可靠的數據恢復效果。
就目前的測試結果來看,布朗大學正常運轉所必需的全部33項服務每年都需要接受超過48小時的評估論證周期。“我們會假設災難已經發生并以此為出發點對這些服務進行測試,整個過程依賴另一套獨立網絡環境加以實現。我們讓用戶真正切換到這套獨立網絡當中,從而難這些服務在備用網絡環境下的運行效果以及實際滿意程度。因此現在我們已經明確證實這些服務具備可恢復性,既定目標已經達成而且我們的用戶也通過客觀感受驗證了這一結論,”Magers指出。
此次重新構建工程幫助布朗大學降低了基礎設施運營風險、節約備份介質使用成本,并且幫助Magers和她的團隊得以對校內高達PB級別規模的非結構化數據進行打理。她解釋稱,如果繼續沿用傳統解決方案、如此規模的數據內容根本無法備份。也正是基于這一考量,他們才決定選擇Isilon向外擴展NAS系統、并利用內置SyncIQ軟件以異步方式將信息復制到位于紐約的備用基礎設施當中。