2014年春節(jié),隨著華為IT容災(zāi)現(xiàn)場指揮的一聲令下,華為開始了數(shù)據(jù)中心帶業(yè)務(wù)容災(zāi)演練,將500多個IT系統(tǒng)從深圳總部數(shù)據(jù)中心切換到南京容災(zāi)中心,并在南京支撐全球業(yè)務(wù)正常運行一天后,回切至深圳數(shù)據(jù)中心。
從結(jié)果看來,演練切換和回切堪稱完美,這一過程中,沒有任何數(shù)據(jù)丟失和不一致。數(shù)據(jù)中心關(guān)鍵系統(tǒng)的切換和回切均在2小時內(nèi)完成,其余系統(tǒng)4小時內(nèi)全部完成。
華為數(shù)據(jù)中心帶業(yè)務(wù)容災(zāi)演練實施過程圖
據(jù)悉,在容災(zāi)中心運行期間,有近2500人正常使用ERP等相關(guān)系統(tǒng),近13萬人次訪問企業(yè)BG官網(wǎng),有效支撐了業(yè)務(wù)連續(xù)性運作。
這是一次很有挑戰(zhàn)的容災(zāi)演練。據(jù)華為企業(yè)業(yè)務(wù)BG規(guī)劃咨詢部部長傅依林介紹,一是兩地之間的遠距離,深圳數(shù)據(jù)中心和南京數(shù)據(jù)中心相距1300多公里;二是環(huán)境復(fù)雜,涉及切換的系統(tǒng)超過500多個,各系統(tǒng)之間有復(fù)雜的集成關(guān)系;三是數(shù)據(jù)量巨大。
華為數(shù)據(jù)中心容災(zāi)規(guī)劃
華為從2001年開始,在數(shù)據(jù)中心與容災(zāi)的規(guī)劃、設(shè)計、建設(shè)與運營上積累了豐富的經(jīng)驗。以三個階段劃分,為摸索階段、一主一備階段和未來的兩地三中心階段。
傅依林告訴記者,第一階段從2001年開始,華為在北京建立ERP等關(guān)鍵系統(tǒng)的數(shù)據(jù)容災(zāi),2005年建立關(guān)鍵系統(tǒng)的同城同步容災(zāi),2008年實現(xiàn)國內(nèi)外研究所重要研發(fā)數(shù)據(jù)異地容災(zāi)。第二階段進行了系統(tǒng)性的規(guī)劃和設(shè)計,2009年結(jié)合業(yè)界最佳實踐,華為發(fā)布了完整的容災(zāi)管理體系。2010年啟用南京容災(zāi)中心并整合容災(zāi)為異地互備模式,建立專業(yè)容災(zāi)運維組織。2011年開始,陸續(xù)實施了多項容災(zāi)演練,包括PDM單系統(tǒng)帶業(yè)務(wù)容災(zāi)演練、LTC流程端到端集成容災(zāi)演練、數(shù)據(jù)中心集成功能演練和最近的數(shù)據(jù)中心異地帶業(yè)務(wù)容災(zāi)演練。
未來的容災(zāi)模式是兩地三中心,按照華為規(guī)劃,華為將建成兩地三中心容災(zāi)架構(gòu),實現(xiàn)關(guān)鍵業(yè)務(wù)同城雙活容災(zāi)。傅依林介紹說,“深圳的數(shù)據(jù)中心是4000多平,往未來看,目前數(shù)據(jù)中心的容量是不能滿足未來10-15年的業(yè)務(wù)發(fā)展的。”
未來10-15年,隨著業(yè)務(wù)的發(fā)展,華為企業(yè)數(shù)據(jù)中心面積將需要達到10000平米。“目前,新數(shù)據(jù)中心已經(jīng)完成設(shè)計并開工建設(shè),預(yù)計在2016年7月投入使用。”
同時,在松山湖華為另有一個1200平米的數(shù)據(jù)中心,以后作為同城的容災(zāi)中心。“因為異地的容災(zāi)中心恢復(fù)的時間相對長一些,主數(shù)據(jù)中心一旦出現(xiàn)問題,可以在2小時內(nèi)借助同城容災(zāi)快速恢復(fù)關(guān)鍵業(yè)務(wù)。目標(biāo)實現(xiàn)同城雙活的‘零數(shù)據(jù)丟失’、‘業(yè)務(wù)無感知切換’。”傅依林說。
南京依然作為異地容災(zāi)中心,整體看來,華為兩地三中心的模式已經(jīng)完成了架構(gòu)設(shè)計,并構(gòu)成了容災(zāi)路線圖。
華為容災(zāi)能力
對華為來說,IT容災(zāi)是公司業(yè)務(wù)持續(xù)運行的基礎(chǔ)性保障,對內(nèi)支撐企業(yè)的長期發(fā)展,對外支撐企業(yè)的社會責(zé)任以及客戶與行業(yè)的認(rèn)證要求。華為目前有15萬員工,分布全球150個國家,700多個辦公地點,共有16個研究所。保證業(yè)務(wù)的連續(xù)性,要求IT系統(tǒng)的高可用,是業(yè)務(wù)運作與發(fā)展的首要內(nèi)在要求。
“另外,華為跟很多跨國的運營商打交道,例如BT、Vodafone等,他們對業(yè)務(wù)的連續(xù)性有很高要求,會到華為來認(rèn)證具不具備這種容災(zāi)能力。有了客戶要求,華為還要證明具不具備這種能力,自2005年以來,華為就一直保持ISO20000、ISO 27001等有效認(rèn)證,目前正在進行Cobit評估準(zhǔn)備等。”傅依林說。
華為容災(zāi)以在規(guī)劃、設(shè)計、建設(shè)與運營方面已經(jīng)具備的全方位、端到端的數(shù)據(jù)中心與容災(zāi)能力為支撐,除了在布局、選址、性能容量、技術(shù)標(biāo)準(zhǔn)的規(guī)劃能力外,傅依林表示,在數(shù)據(jù)中心容災(zāi)系統(tǒng)設(shè)計上,華為沿公司主業(yè)務(wù)流分層分級構(gòu)建容災(zāi)環(huán)境,兼顧容災(zāi)效果與成本:劃分為公司生存攸關(guān)的為Vital級別,運營必須的為Critical級別,日常運作需要的為Important級別。通過在業(yè)務(wù)上的一些重要性來確定IT系統(tǒng)的級別,從而來甄別這些IT系統(tǒng)的不同級別的容災(zāi)設(shè)計。
容災(zāi)網(wǎng)絡(luò)設(shè)計與建設(shè)是華為的強項,華為在異地容災(zāi)網(wǎng)絡(luò)中,采用網(wǎng)絡(luò)高可用和網(wǎng)絡(luò)架構(gòu)雙冗余,骨干線路雙供應(yīng)商,分支機構(gòu)同時接入深圳數(shù)據(jù)中心和南京容災(zāi)中心。保證5級QoS,實現(xiàn)重點業(yè)務(wù)重點保障。同時讓容災(zāi)中心應(yīng)用的防火墻策略與生產(chǎn)環(huán)境一致,確保容災(zāi)中心應(yīng)用實時可用。
在運營上,“華為數(shù)據(jù)中心運行管理瞄準(zhǔn)國際標(biāo)準(zhǔn)和最佳實踐,流程成熟度達到了持續(xù)改進級。容災(zāi)管理完美融于與華為IT基于ITIL V3的IT運行流程管理框架。”傅依林說。
基于這一系列能力,即使面臨眾多挑戰(zhàn)下,華為如期完成數(shù)據(jù)中心容災(zāi)演練。傅依林強調(diào),“容災(zāi)演練成功本身就標(biāo)志著華為容災(zāi)能力得到驗證,作為一個全球化運作的企業(yè),這樣的成功案例本身就是一個很好的信息化建設(shè)樣板品,也對其他大型企業(yè)起到借鑒意義。”