針對不同的用戶需求,IBM異地容災(zāi)方案產(chǎn)品線非常豐富,各種數(shù)據(jù)備份技術(shù)和應(yīng)用方案層出不窮,處于全球領(lǐng)先地位。它的這些容災(zāi)方案不可能全在本文中介紹清楚,所以只選三個常見的方案類型向大家介紹。
一、數(shù)據(jù)級災(zāi)備——PPRC
IBM異地容災(zāi)方案的PPRC(Peer to Peer Remote Copy,點對占點遠(yuǎn)程復(fù)制)復(fù)制技術(shù)是基于ESS企業(yè)級數(shù)據(jù)存儲服務(wù)器,通過ESCON(Enterprise Systems Connection,企業(yè)管理系統(tǒng)連接,是一種光纖通道)通道建立配對的邏輯卷容災(zāi)技術(shù)。這是IBM的最高級別容災(zāi)方案,主要適用于大、中型和電信企業(yè)選用。
在標(biāo)準(zhǔn)的實時備份方案中,服務(wù)器主機(jī)通過SAN與IBM企業(yè)存儲服務(wù)器ESS相連接,兩臺ESS之間通過ESCON通道實現(xiàn)同步遠(yuǎn)程拷貝。受ESCON傳輸距離的限制,當(dāng)主、備機(jī)房的距離超過2公里時,需要加光纖延伸器。光纖延伸器可以從多個不同的廠商購得,比如IBM 2029 Fibre Saver、INRANGE的9801等IBM異地容災(zāi)方案。在光纖延伸器的幫助下,IBM異地容災(zāi)方案PPRC數(shù)據(jù)備份可達(dá)到100公里以上。
在這種IBM異地容災(zāi)方案中,核心設(shè)備就是IBM的ESS的企業(yè)級存儲服務(wù)器,目前最新的型號主要有IBM TotalStorage Enterprise Storage Server (ESS) Model 750/800這兩種。
ESS 800型企業(yè)級存儲服務(wù)器支持IBM的多種Windows、UNIX、NetWare等服務(wù)器平臺之間的存儲共享,通過雙RISC架構(gòu)SMP處理器、大容量高速緩存和串行磁盤連接提供出眾的性能;使用冗余的硬件、鏡像映射的寫高速緩存和RAID-5及RAID-10級別的磁盤陣列技術(shù)保護(hù)支持關(guān)鍵業(yè)務(wù)應(yīng)用程序的高可用性。對通過ESCON、FICON、光纖通道、2GB光纖通道/FICON或Ultra SCSI連接的主機(jī)支持快速率的數(shù)據(jù)傳輸;通過Web瀏覽器、CLI(命令行界面)或者通過使用ESS API來提供高效、集中的操作管理;使擁有不同種類主機(jī)的企業(yè)不僅能升至55.9TB的物理磁盤容量,同時能保持最優(yōu)性能。
對于這種IBM異地容災(zāi)方案中可能用到的SAN交換機(jī)在前面已有了這方面的產(chǎn)品介紹,在此不再贅述。不過要注意的是,在這些IBM異地容災(zāi)方案中都要求全套設(shè)備最好采用IBM自己的,所以在這種容災(zāi)方案中的SAN交換機(jī)也需要選擇IBM自己的。在IBM中提供多種不同檔次的SAN交換機(jī)產(chǎn)品,如F08/16/32、M12等機(jī)型,可以全面滿足各類企業(yè)需求。
IBM異地容災(zāi)方案PPRC能夠自動將源卷上的數(shù)據(jù)同步到目標(biāo)卷,實現(xiàn)以存儲為基礎(chǔ)的、實時的、與應(yīng)用無關(guān)的數(shù)據(jù)遠(yuǎn)程鏡像功能,可根據(jù)需要選擇同步或異步方式。PPRC實現(xiàn)較為簡單,純粹基于硬件,是無數(shù)據(jù)丟失且具有完全恢復(fù)功能的災(zāi)難恢復(fù)解決方案,需要兩個中心均配置IBM的ESS存儲服務(wù)器。
在同步方式下,IBM異地容災(zāi)方案PPRC將確保如果備份卷不能被更新,那么即使源卷更新成功,整個寫操作也會返回失敗——徹底保證源卷和目的卷的數(shù)據(jù)一致。同步方式可以保證數(shù)據(jù)完全不丟失和很好一致性保證。數(shù)據(jù)的一致性非常重要,特別是對于系統(tǒng)和數(shù)據(jù)庫中的數(shù)據(jù),不一致的數(shù)據(jù)無法保證數(shù)據(jù)的安全,嚴(yán)重時還可能造成數(shù)據(jù)庫無法啟動。但要注意,采用同步復(fù)制方式對系統(tǒng)性能有較大影響,特別是當(dāng)兩個數(shù)據(jù)中心服務(wù)器不夠強(qiáng)壯時。
在異步工作方式下,PPRC能夠在遠(yuǎn)端更新未完成的情況下,通過本地更新成功向主機(jī)返回“寫成功”信號。其好處是: 在主備機(jī)房之間數(shù)據(jù)鏈路帶寬成為瓶頸時,采用異步方式對數(shù)據(jù)中心主機(jī)房生產(chǎn)系統(tǒng)性能的影響不大。缺點是采取這種方式的數(shù)據(jù)將有可能丟失。所以當(dāng)采用異步方式時,IBM建議先采用IBM ESS的快速拷貝功能“FlashCopy”,備份需同步的數(shù)據(jù),再進(jìn)行數(shù)據(jù)同步。
IBM異地容災(zāi)方案PPRC在初始連接時需要建立邏輯卷連接,之后PPRC會自動同步該邏輯卷。利用此項功能,可以進(jìn)行ESS之間的數(shù)據(jù)遷移。
實現(xiàn)PPRC各步解釋如下:
① 應(yīng)用程序?qū)?shù)據(jù)寫入ESS服務(wù)器磁盤;
② 生產(chǎn)系統(tǒng)中的磁盤數(shù)據(jù)傳輸?shù)竭h(yuǎn)程備份磁盤;
③ 備份磁盤復(fù)制生產(chǎn)系統(tǒng)數(shù)據(jù);
④ 將寫完操作信息返給生產(chǎn)磁盤,生產(chǎn)系統(tǒng)應(yīng)用繼續(xù)執(zhí)行。
二、IBM異地容災(zāi)方案應(yīng)用級災(zāi)備——HAGEO
IBM的HAGEO(High Availability Geography)的縮寫,是IBM AIX平臺最優(yōu)秀的實時災(zāi)難備份軟件。我們知道,前面介紹的PPRC方案主要是通過硬件來實現(xiàn)的,而此處的HAGEO方案則主要是通過軟件實現(xiàn)的,相對來說比較經(jīng)濟(jì),但對硬件的配置也比較苛刻。
這種備份方案理論上對備份中心距離沒有限制,利用IP網(wǎng)絡(luò),不需要專用光纖;對應(yīng)用程序、數(shù)據(jù)庫類型和存儲設(shè)備類型都是透明的,即在IBM異地容災(zāi)方案HAGEO下應(yīng)用程序不需修改。但性能較以上介紹的PPRC方案差些,適用于中型企業(yè)選用。
HAGEO可以為客戶的數(shù)據(jù)和應(yīng)用提供同步實時鏡像,其中增強(qiáng)型同步(MWC)模式可以提供數(shù)據(jù)的原始性和一致性,同時HAGEO也提供異步模式。HAGEO和應(yīng)用程序緊密結(jié)合,不僅僅實現(xiàn)數(shù)據(jù)的實時鏡像,同時也可以實現(xiàn)應(yīng)用的自動接管,大大減少了災(zāi)難發(fā)生時手工操作。HAGEO可以做到零數(shù)據(jù)丟失,災(zāi)難恢復(fù)時間一般在半個小時左右(指應(yīng)用恢復(fù))。
目前最為主流的IBM異地容災(zāi)方案HAGEO是基于RS/6000平臺的,在這種HAGEO環(huán)境中,每個交易或任務(wù)完成之前,系統(tǒng)都會通過遠(yuǎn)程網(wǎng)絡(luò),先完成生產(chǎn)系統(tǒng)和備份系統(tǒng)的數(shù)據(jù)更新,保障數(shù)據(jù)實時一致性。并且像HACMP雙機(jī)備份一樣,提供故障檢測和自動實時恢復(fù)功能。HACMP是IBM RS/6000平臺上的高可用軟件,它解決了本地多個服務(wù)器之間的互相備份問題。HAGEO將HACMP的功能在地理位置上作了延伸,將HACMP的優(yōu)勢擴(kuò)展到廣域網(wǎng)上,從而提供了一個很好的遠(yuǎn)程備份解決方案。
IBM異地容災(zāi)方案 HAGEO的基本設(shè)想是:生產(chǎn)環(huán)境是兩臺RS/6000服務(wù)器,組成一個本地的雙機(jī)熱備環(huán)境。當(dāng)本地的一臺服務(wù)器發(fā)生故障時,應(yīng)用會自動切換到本地另外一臺服務(wù)器上。在備份地點,由一臺RS/6000服務(wù)器作為備份服務(wù)器。當(dāng)生產(chǎn)環(huán)境中的兩臺服務(wù)器都不能工作時,備份地點的服務(wù)器自動啟動應(yīng)用,恢復(fù)正常的生產(chǎn)環(huán)境。
連接兩地的網(wǎng)絡(luò)帶寬應(yīng)大于2MB,以確保兩地備份服務(wù)器數(shù)據(jù)同步,具體所采用的網(wǎng)絡(luò)連接方式可以多樣,如專線方式的DDN、T3、互聯(lián)網(wǎng)寬帶接入等。如果應(yīng)用對I/O的寫請求很多,應(yīng)提高網(wǎng)絡(luò)帶寬,以保證系統(tǒng)的整體性能不受影響。客戶端如何訪問服務(wù)器也是在做方案時需要考慮的一個重要因素。注意,IBM異地容災(zāi)方案HAGEO只能負(fù)責(zé)到(服務(wù)器)系統(tǒng)這一層,在災(zāi)難發(fā)生后,客戶端如何訪問備份中心,這一點需要在網(wǎng)絡(luò)整體設(shè)計時加以考慮。
三、NAS容災(zāi)方案
雖然NAS方案大家都覺得不如SAN,但它的廉價特性(它是采用傳統(tǒng)的IP技術(shù)),在目前來說SAN還是無法比擬的,特別是對于中小型企業(yè)。針對全國性機(jī)構(gòu)數(shù)據(jù)集中實時數(shù)據(jù)復(fù)制與災(zāi)害備援需求,IBM采用NAS,LTO技術(shù)及NSI Software Double-Take 數(shù)據(jù)同步方案,為全國性機(jī)構(gòu)地市級節(jié)點以及省級中心節(jié)點提供基于NAS存儲平臺的數(shù)據(jù)同步解決方案,以最經(jīng)濟(jì)的方式達(dá)到備援的目的,并保證系統(tǒng)的高可用性。
該IBM異地容災(zāi)方案對于全國性機(jī)構(gòu)地市級節(jié)點的數(shù)據(jù)通過現(xiàn)有的網(wǎng)絡(luò)連接,占用最少的網(wǎng)絡(luò)資源,在第一時間將數(shù)據(jù)文件以增量的方式傳送至省級中心節(jié)點。同時也可實現(xiàn)省級中心節(jié)點向地市級節(jié)點的數(shù)據(jù)發(fā)送。并且在每個地市級節(jié)點還可以實現(xiàn)兩臺NAS存儲設(shè)備之間的數(shù)據(jù)實時同步以及系統(tǒng)的災(zāi)難備援。并且在磁盤介質(zhì)備份的基礎(chǔ)上,可進(jìn)一步實現(xiàn)磁盤到磁帶的數(shù)據(jù)備份,以充分滿足數(shù)據(jù)的安全與可用性。其中一種利用公網(wǎng)進(jìn)行省級與市級數(shù)據(jù)中心數(shù)據(jù)通信的網(wǎng)絡(luò)結(jié)構(gòu)。
1. 省級數(shù)據(jù)中心
省級中心采用NAS300系列或更高級的NAS500存儲服務(wù)器,它上面的數(shù)據(jù)與各地市級NAS200系列上數(shù)據(jù)通過Double Take軟件即時或定時保持同步,為公司提供準(zhǔn)確的營業(yè)數(shù)據(jù)。地市級中心數(shù)據(jù)可通過T3、DDN、WAN等連接方式向省級中心進(jìn)行實時或定時數(shù)據(jù)同步,充分利用各種網(wǎng)絡(luò)資源并最小化投資與運營成本。
基于 I/O 網(wǎng)絡(luò)流量的多少,IIBM異地容災(zāi)方案NAS Gateway 300可以支持每單位1000個以上基于IP的客戶機(jī)。要為每個用戶提供足夠的存儲容量,最多可分配22TB的存儲量。NAS300兼容IBM企業(yè)存儲服務(wù)器(ESS)、FAStT200、FAStT500、FAStT700和其它供應(yīng)商提供的設(shè)備。IBM NAS Gateway 300 預(yù)裝了 Tivoli SANergy軟件,該軟件使用戶能通過較高的吞吐量但較低的開銷以文件、卷和字節(jié)級別訪問SAN 中的存儲設(shè)備。通過它而在IP客戶機(jī)與SAN之間建立的高性能鏈接有助于利用兩個網(wǎng)絡(luò)中的現(xiàn)有投資。
IBM異地容災(zāi)方案NAS 200的存儲容量在109.2GB到3.52TB之間提供了一條不間斷的容量升級路徑,允許您“按增長支付”,保護(hù)您的投資。而且提供數(shù)據(jù)保護(hù)的多級RAID和高級軟件,幫助您確保業(yè)務(wù)連續(xù)性,實現(xiàn)跨平臺(Windows [CIFS]、UNIX [NF