容災技術實現手段中最為重要的一個步驟就是通過網絡的連接,將本地端數據復制一份到遠程保存,聽起來似乎并不難,但在復雜的IT架構下,要想成功實現確也并不容易。數據復制技術作為容災備份技術系統的核心,已經成為容災架構的重要部份。數據復制對容災系統的數據一致性和可靠性以及容災系統的應變能力具有舉足輕重的作用,決定著容災備份技術系統的可靠性和可用性。
目前市場中的容災復制技術,主要包括主機應用層面的容災技術、基于存儲系統的容災復制技術,以及當前市場主流的虛擬化網關容災復制技術。
基于主機的容災復制技術
基于主機的異地容災技術,簡單地說,就是通過安裝在服務器的數據復制軟件(Symantec Volume Replicator軟件、Oracle數據庫的Dataguard、goldengate相關工具),利用TCP/IP網絡連接遠端的容災站點的服務器,實現異地數據復制。
主機型遠程容災的優點是在數據的復制是建立在應用主機之上的,用戶不需更換太多現有的系統架構,也不用擔心后端存儲系統的兼容性問題。
主機型的異地容災的缺點也顯而易見,以Symantec Volume Replicator為代表的卷復制技術,需要結合Symantec Foundation使用,需要更改用戶的存儲格式,這種基于數據卷的異地容災方案,對于帶寬的占用非常大,無精簡能力。并且,所復制的容災數據僅限于受管理的存儲數據,而無法實現操作系統的異地容災。
基于存儲系統的容災復制技術
顧名思義是基于存儲系統(磁盤陣列、NAS)的模式。通過存儲系統內置的增值功能,通過IP網絡或DWDM、光纖通道等傳輸界面連結,將數據以同步或異步的方式復制到遠端。目前各個主流存儲廠商均可以提供這種容災技術。與主機型遠程容災相比,存儲系統型遠程容災的優點就是將數據與運行分開,對主機系統的運行資源影響比較小。加上存儲系統本身具備一定的磁盤Raid容錯能力,使之具有一定的運行性能和可靠性。而存儲系統型遠程容災最大的限制就在于其昂貴的構造成本,由于用戶必須在本地端和災備端分別配置兩套相同的存儲系統,不僅采購成本高,而且還要受制于單一的設備廠商,未來的擴展性勢必缺乏彈性。此外,光纖通道存儲系統如果要構造遠程容災,必須在本地端和災備端各安裝一臺FC-to-IP轉接器,再加上網絡帶寬成本,整體費用投入定會令人咋舌。另外,存儲型容災方式對于數據庫的一致性容災存在很大的缺陷,對于有數據庫應用復制要求的用戶不適用。
市場主流的虛擬化網關容災復制技術
虛擬化網關容災技術,是在前端應用服務器與后端存儲系統之間的存儲區域網絡(SAN),加入一層存儲網關,這個網關和我們所了解的網絡網關不同,不僅可以實現本地存儲系統的應用保護而且可以實現異地數據的復制。虛擬化網關容災的優點是功能強大。由于數據復制是通過存儲網關來執行,它對主機的性能無影響。另外,通過存儲網關虛擬化技術,可以整合前端異構平臺的服務器和后端不同品牌的存儲設備。
之前我們已經提這,基于存儲虛擬化網關的容災復制技術是當前市場最為主流的容災復制技術,多家知名大廠的產品都是基于這種技術,包括IBMSVC、EMCVPlex、飛康NSS。讓我們再深入分析一下這幾種容災復制技術到底有哪些不同之處。
IBMSVC
采用Global Mirror全球鏡像技術,全球鏡像是以存儲為基礎,與應用和主機無關的數據遠程鏡像功能,理論上來講可以實現遠程復制的目的,但由于Global Mirro對于復制數據精減能力有限,往往需要結合其他網絡設備的數據壓縮能力,來實現對于復制帶寬的節約,壓縮比僅僅可以達到2:1的比例。但即使是這樣,對于復制帶寬的節約也非常有限,與存儲復制帶寬相比差異不大。
EMCVPlex
EMCVPlex對于復制帶寬要求較高,需要借助于其他產品(EMC Recovery Point)來實現遠距數據復制,官方文檔提供的WAN壓縮處理性能指標顯示單臺設備處理能力為30MB/s,如下圖(數據來源EMCRecover Point3.5Release Notes):
圖1 EMC RecoverPoint WAN壓縮處理指標
飛
康NSS
飛康NSS提供的WAN優化復制技術,利用Micro Scan 技術,只有真正發生變化數據才會按顆粒度或是磁盤扇區(512字節)進行傳輸,同時,MicroScan 并不受限于某個廠商,具備完全的開放性,可以與任何標準的存儲陣列協同工作,極大的削減了傳輸數據量的同時節省傳輸帶寬。
數據庫和文件系統在向磁盤寫入數據時是以“塊”為單位進行的,每個塊從4~256K不等(視數據庫和文件系統類型)。所以,應用程序在保存數據時每次最少寫入的數據都會在一個塊的大小,哪怕只寫入一個字節。如下圖2(數據來源Falcon Sto NSS whitePaper)