容備建設概念
根據(jù)國家標準《信息系統(tǒng)災難恢復規(guī)范》(GB/T 20988-2007)的定義:災難是指由于人為或自然的原因,造成信息系統(tǒng)嚴重故障或癱瘓,使信息系統(tǒng)支持的業(yè)務功能停頓或服務水平不可接受、達到特定的時間的突發(fā)性事件。典型的災難事件包括機房內事件(如系統(tǒng)單點故障、機房電源系統(tǒng)故障、廣域網(wǎng)故障、機房漏水、空調系統(tǒng)故障、存儲陣列關鍵設備故障、人為破壞、軟件邏輯錯誤、信息安全故障等)、建筑物災難(如建筑物外部火災、建筑物內部火災、機房內部火災、長時間停電、光纜中斷等)和區(qū)域性災難(指機房所在區(qū)域或有緊密聯(lián)系的地區(qū)交通、電訊、能源及其它關鍵基礎設施遭到嚴重破壞,或大規(guī)模人口疏散的事件,如地震、大規(guī)模衛(wèi)生事件、恐怖襲擊、電網(wǎng)故障等)。
災難備份是指為了災難恢復而對數(shù)據(jù)、數(shù)據(jù)處理系統(tǒng)、網(wǎng)絡系統(tǒng)、基礎設施、專業(yè)技術支持能力和運行管理能力進行備份的過程;而災難恢復是指為了將信息系統(tǒng)從災難造成的故障或癱瘓狀態(tài)恢復到可正常運行狀態(tài)、并將其支持的業(yè)務功能從災難造成的不正常狀態(tài)恢復到可接受狀態(tài),而設計的活動和流程。災備系統(tǒng)的建設包含七要素:數(shù)據(jù)備份系統(tǒng)、備用數(shù)據(jù)處理系統(tǒng)、備用網(wǎng)絡系統(tǒng)、備用基礎設施、專業(yè)技術支持能力、運行維護管理能力、災難恢復預案。
《信息系統(tǒng)災難恢復規(guī)范》將災難恢復能力劃分為6級,災難恢復能力等級越高,對信息系統(tǒng)的保護效果越好,但同時成本也會迅速上升。災備等級主要從RTO(恢復時間目標)和RPO(恢復點目標)來考慮,RPO(恢復點目標)是指發(fā)生災難前最后一次備份的時間點距離當前時間差(數(shù)據(jù)丟失時間);RTO(時間恢復目標)是指發(fā)生災難后恢復物理系統(tǒng)環(huán)境的時間。大部分的用戶關注的是數(shù)據(jù)安全性,即RPO值(RPO越小,數(shù)據(jù)丟失越少),但是用戶往往談的更多的是RTO(RTO越小,恢復生產越快)。
基于上述定義,災備系統(tǒng)可以理解為以"備份"為手段,以"恢復"為目標,是一項周密的系統(tǒng)工程。這一工程不僅需要進行備份中心的建設以及相關IT系統(tǒng)的購置,還需要在生產中心與備份中心之間搭建一張安全可靠的災備傳送網(wǎng)絡。