大多數(shù)組織都非常關(guān)注備份和恢復(fù)策略。如果IT環(huán)境出現(xiàn)問題,目標(biāo)是讓系統(tǒng)在最快時間內(nèi)恢復(fù)到你已知的某個結(jié)點。
任何備份與恢復(fù)的策略都是設(shè)法將一切恢復(fù)到距離現(xiàn)實最近的時間節(jié)點。從技術(shù)角度來說,這意味著恢復(fù)點目標(biāo)(RPO)和恢復(fù)時間目標(biāo)(RTO)越接近接好。通過快照和虛擬機(jī),停機(jī)時間往往在幾小時甚至幾分鐘。
在RPO和RTO之間依舊存在問題,在此期間無法提供服務(wù)。IT平臺要么宕機(jī)要么正忙于恢復(fù)。直到數(shù)據(jù)中心啟動并恢復(fù)運行,在此期間業(yè)務(wù)不斷流失:IT是導(dǎo)致失敗的原因。
擁有高可用性需求而且財力雄厚的公司研究了過去的業(yè)務(wù)持續(xù)性方案,要么是通過集群與虛擬化實現(xiàn)IT組件的N+1冗余,或者在另外一個遠(yuǎn)程數(shù)據(jù)中心完全鏡像整個線上環(huán)境。雖然鏡像意味著災(zāi)難性故障只需在幾分鐘內(nèi)就能切換到功能齊全的備用環(huán)境,問題在于代價高昂。投資遠(yuǎn)比建造單獨一個數(shù)據(jù)中心的兩倍還多,不但需要額外的數(shù)據(jù)中心與設(shè)備,同樣還需要軟件以及工具來監(jiān)控與維護(hù)系統(tǒng),并且在確認(rèn)故障發(fā)生時完成切換。只有少數(shù)企業(yè)能承擔(dān)這筆費用。
然而時代在改變,IT服務(wù)連續(xù)系,或者與之類似的方案越來越貼近大多數(shù)組織。
新的IT服務(wù)持續(xù)性規(guī)劃
你現(xiàn)有的IT平臺可能混合了承載單業(yè)務(wù)的服務(wù)器也或者物理集群的虛擬化環(huán)境,甚至還可能有一兩個平臺運行在私有云。你已經(jīng)擁有虛擬化基礎(chǔ)設(shè)施上的虛擬機(jī),這就有可能會在未來部署容器。容器技術(shù)包括了Docker、CoreOS的Rocket、微軟Azure Drawbridge for Windows Server和Canonical的LXD Linux容器。
IT持續(xù)性規(guī)劃始于建立企業(yè)應(yīng)用程序涉及到的所有資產(chǎn)數(shù)據(jù)庫。對于大多數(shù)組織來說,連續(xù)性并不意味著和主要設(shè)施一樣,將所有的業(yè)務(wù)都以相同的用戶體驗進(jìn)行鏡像。相反,企業(yè)需要確保核心業(yè)務(wù)流程能夠保持,直到主數(shù)據(jù)中心重新上線。
運行關(guān)鍵任務(wù)應(yīng)用程序的物理服務(wù)器必須能在斷電的時候繼續(xù)運作,但它可能不需要被作為一個物理系統(tǒng)完全復(fù)制。將應(yīng)用程序配合虛擬機(jī)來運行,可以讓IT在非常短的時間內(nèi)讓業(yè)務(wù)快速運轉(zhuǎn)起來,這是一個提供足夠好的用戶體驗的權(quán)宜之計。那些非關(guān)鍵任務(wù)的業(yè)務(wù),如工資單或采購程序,可以在中斷時忽略。
評估工具可以管理工作負(fù)載從原平臺遷移到可持續(xù)性管理平臺的狀況。廠商如Vision Solutions,提供Double-Take產(chǎn)品組合,能夠提供將工作負(fù)載從一個環(huán)境遷移到另一個環(huán)境的高可用性和業(yè)務(wù)連續(xù)能力。
一些產(chǎn)品包還能提供將應(yīng)用程序或容器從一個環(huán)境遷移到另一個,產(chǎn)商有StackIQ Inc.、Platform9 Systems Inc.、Verilume和Electric Cloud(該廠商更專注于發(fā)布自動化,但還搭售打包和配置工具,實現(xiàn)高度可控、可審計功能)。這些工具不需要熱目標(biāo)環(huán)境;他們支持動態(tài)遷移裸機(jī)、虛擬機(jī)或云環(huán)境。
通過結(jié)合云計算和虛擬化制定的恢復(fù)計劃,組織并不需要支付與鏡像數(shù)據(jù)中心那樣的龐大費用——甚至不需要支付其他未使用的資源。只需支付平臺以及所需IT服務(wù)連續(xù)性的使用費——這些支出基本在大多數(shù)組織的可接受范圍內(nèi)。
如何處理中斷期間的數(shù)據(jù)
處理中斷期間留下的數(shù)據(jù)是個難題。沒有辦法向打包應(yīng)用程序那樣輕易的打包數(shù)據(jù)。應(yīng)用程序是個相對靜態(tài)的實體,而數(shù)據(jù)是高度動態(tài)的。你可以使用備份和恢復(fù),但RPO和RTO都是針對一個整體備份和恢復(fù)策略來規(guī)劃的,同樣存在問題。
數(shù)據(jù)庫虛擬化是一個更好的辦法。供應(yīng)商如Delphix Corp.提供工具可以在短時間內(nèi)完成數(shù)據(jù)庫副本的制作,并且只消耗很少本地資源。還可以遠(yuǎn)距離使用相同的技術(shù):初始化數(shù)據(jù)庫的拷貝傳輸先完成,之后只需跨區(qū)域復(fù)制增量數(shù)據(jù)。任何主環(huán)境中發(fā)生故障,在遠(yuǎn)程站點的數(shù)據(jù)拷貝都擁有實時備份。這意味著在目標(biāo)站點上擁有非常多資源,同時也意味著非常高的業(yè)務(wù)連續(xù)性。
一旦主站點重新上線并且恢復(fù)運行,備份數(shù)據(jù)會與主數(shù)據(jù)庫同步,在此期間不會有任何數(shù)據(jù)損失。