談災備,就會細談數據保護與容災備份。然而,相關的概念經常有人混淆。我們搜集和參考公開資料進行初步梳理。
一、數據保護
在云與大數據時代,海量增長的數據容量,給數據的存儲和保護帶來新的挑戰,從傳統熟悉的IT架構到以云架構、虛擬化、超融合為代表的技術升級迭代,使得數據保護的技術手段也要加速。
1、數據保護的重要性
數據是企業重要的生產資料,關鍵數據的丟失可能會給企業致命一擊。比如在911事件中,Bank NewYork在數月后因數據的丟失被迫破產清盤。
為什么后果如此嚴重?因為數據是計算機系統存在的原因和基礎,數據往往是不可再生的。一旦發生數據丟失,企業就會陷入困境:客戶資料、技術文件、財務賬目等客戶、交易、生產數據可能被破壞得面目全非。
2、數據丟失的可能性
概括起來,數據丟失分三個層次。一是邏輯錯誤,包括軟件bug、病毒攻擊、數據塊被破壞等;二是物理損壞,包括服務器、磁盤損壞等;三是自然災害對數據中心的摧毀等。
數據的危害時刻都在發生,比如曾經發生過的“刪庫跑路、漏洞后門、系統本身脆弱性、云服務商故障、誤操作配置、數據中心火災”等事故,都是數據丟失方面最沉痛的教訓。
3、數據復制技術
為了應對數據丟失造成的損失,必須對數據進行復制保護,并且企業信息化程度越高,相關的恢復措辭就越重要。一般數據從生產到存儲,主要經過應用、中間件、數據庫、操作系統、存儲或者磁盤驅動、服務器硬件、網絡、存儲交換機到存儲。在傳統的數據備份恢復基礎上,通過數據復制技術提供多數據副本,保證副本數據的可用性從而實現數據保護。
從技術角度看,分為中間件和應用層復制、數據庫層復制、主機操作系統及存儲層復制。
中間件和應用層的數據復制,是中間件或者應用層面的雙寫,根據業務需求,通過應用架構設計實現數據主本和副本的更新;根據需要進行強一致性、弱一致性、最終一致性設計,來保證主本和副本之間的一致性、完整性、時效性。
數據庫層復制:不管是開放的數據庫還是大機的數據庫,都提供相關的數據復制軟件,實現數據庫數據的物理復制和邏輯復制。主要技術流派包括邏輯復制和物理復制兩種。前者利用數據庫的重做日志、歸檔日志,將主本所在站點的日志傳輸到副本所在站點,通過重做SQL的方式實現數據復制。邏輯復制只提供異步復制,主副本數據的最終一致性,無法保證實時一致性;后者通過Redo日志或者歸檔日志在副本站點的同步或者異步持久化寫、Redo Apply來實現復制功能,同時副本站點的數據可以提供只讀功能。
主機操作系統層、存儲層復制:基于系統的IO、底層物理卷、數據塊,通過存儲硬件、備份恢復、存儲虛擬化等技術實現數據復制,與上層的應用和邏輯無關。主要技術流派包括磁盤鏡像技術、操作系統層基于卷管理的數據復制技術、存儲層的存儲虛擬化技術、優化的備份恢復技術及網絡數據存儲集中管理技術、英方特有的系統內核字節級數據復制技術等。
二、容災備份
這實際上是兩個獨立的概念,備份不等于容災,備份是保護數據,容災是確保業務連續性。在災備一體機出現后,這兩個概念所代表的功能往往被包含在里面,所以也造成在一些用戶在采購純軟件產品時,將備份與容災產品混為一談,以至于廠商不知道用戶到底需要備份產品還是容災產品,或者是備份+容災的產品。
1、備份
備份,是預定義的數據集合的副本,是數據保護的根本方法,它反映了數據集合在某個時刻的靜止狀態,備份文件是所有數據保護架構的支柱,備份的目的在于恢復。
關于備份,存在兩個誤區:一是雙機熱備不屬于備份;二是硬件備份≠數據備份。
在備份架構演進方面,有本機備份、網絡備份、LAN-Free(SAN)備份、Server-Free (脫機)備份等四種架構。
本地備份:優點是備份速度快、結構簡單;缺點是不適合多主機環境,多主機備份的管理復雜。
網絡備份:優點是集中備份,集中管理,充分利用磁帶庫資源;缺點是占用網絡資源,網絡的瓶頸在大數據量備份時非常明顯。
LAN-Free (SAN) 備份:優點是備份速度快,不存在傳統網絡所造成的備份瓶頸, 適合大數據量高速備份;缺點是價格比較高。
Server-Free (脫機)備份:優點是生產服務器中不會引起備份的額外開銷,生產系統的性能不會有絲毫降低;缺點是必須具備特殊的設備。
在備份技術的演進路線方面,則遵從了定時備份——快照備份——實時備份的路線。
定時備份:優點是軟硬件支持范圍廣,適合長期保存的備份;缺點是需要打開文件備份,文件夾內的文件發生變化,導致的不一致性問題,另外需要專門的備份時間窗口,RPO也非常大。
快照備份:為了解決打開文件、備份時文件發生變化的問題而生;缺點是快照備份的兼容性問題,快照備份時對生產系統性能影響較大,另外RPO也較大。
實時復制(如CDP):為了解決了打開文件、備份時文件發生變化的問題、快照的兼容性受限問題而生;可以實現任意時間點恢復RPO≈0.英方基于字節級的實時數據保護CDP技術就是代表性產品之一。
2、容災
備份是對數據進行保護,容災是在備份的基礎上,保障企業的業務連續性,從這個層面,一般將容災劃分為數據容災和應用容災。
數據容災是指建立一個異地的數據系統,該系統是本地關鍵應用數據的一個實時復制。
應用容災是指在數據容災的基礎上,在異地建立一套完整的與本地生產系統相當的備份應用系統,在災難發生時,備端系統迅速接管業務繼續運行。
三、關鍵術語: RPO、RTO
RPO(Recovery Point Objective)是指災難發生后,容災系統能把數據恢復到災難發生前時間點的數據,它是衡量企業在災難發生后會丟失多少生產數據的指標。RPO可簡單的描述為企業能容忍的最大數據丟失量。
RTO(Recovery Time Objective)則是指災難發生后,從系統宕機導致業務停頓之刻開始,到系統恢復至可以支持業務部門運作,業務恢復運營之時,此兩點之間的時間。RTO可簡單的描述為企業能容忍的恢復時間。
四、GB/T 20988—2007
《信息安全技術信息系統災難恢復規范》國家標準(GB/T20988-2007)是我國災難備份與恢復行業的第一個國家標準。該標準由國務院信息化工作辦公室領導編制的,并于2007年11月1日開始正式實施。該標準規定了信息系統災難恢復應遵循的基本要求,適用于信息系統災難恢復的規劃、審批、實施和管理,并參照國際標準SHARE78的7個層級定義,確定了符合中國國情的6個災備能力等級要求。下面,概括性地介紹各個層級的內容:
1級:數據定時備份+異地存放。
2級:數據定時備份+異地設備冷備。
3級:數據定時備份+異地部分業務熱備接管。
4級:數據定時備份+異地業務熱備接管。
5級:數據實時備份+異地業務熱備接管。
6級:零數據丟失+遠程自動接管支持。