自然災(zāi)害是數(shù)據(jù)中心最常見的敵人。颶風(fēng)桑迪(Hurricane Sandy)最近考驗了美國東海岸的云提供商的極限,在“超級風(fēng)暴”破壞了新澤西、紐約、弗吉尼亞等地之后,托管和托管設(shè)備遭遇了斷電、洪水和基礎(chǔ)設(shè)施破壞。
不管地理位置如何,對于云計算和托管提供商而言,關(guān)鍵在于適當(dāng)?shù)臄?shù)據(jù)中心災(zāi)難恢復(fù)(DR)和業(yè)務(wù)持續(xù)性規(guī)劃,從而確保客戶的正常運行時間,尤其是當(dāng)災(zāi)難發(fā)生的時候(災(zāi)害襲來:GIS技術(shù)防止云中斷事件)。
盡管很多地區(qū)再到風(fēng)暴的持續(xù)破壞,導(dǎo)致電力中斷和能源緊缺,一些云提供商和服務(wù)提供商仍舊設(shè)法避免在颶風(fēng)后的服務(wù)終端。其中有三家就是Telx Group、Integrity Virtual IT和CentriLogic,他們分享了其數(shù)據(jù)中心DR以及業(yè)務(wù)持續(xù)性規(guī)劃是怎么做的,從而保持其服務(wù)在線并讓客戶滿意。
Telx渡過難關(guān) 感謝數(shù)據(jù)中心DR預(yù)備
Telx是一家位于紐約的數(shù)據(jù)中心運營商和托管提供商,在紐約市區(qū)有兩大設(shè)備區(qū)以及新澤西兩處設(shè)備中心,;另外還有一個新澤西數(shù)據(jù)中心在建。這四個數(shù)據(jù)中心收到了電力中斷的損失,被迫在颶風(fēng)期間發(fā)電。
預(yù)期到會斷電,Telx過渡了期NJR2設(shè)備到發(fā)電機上,這是位于新澤西的一個更大的數(shù)據(jù)中心,發(fā)電機在風(fēng)暴之前就運作,保持了八小時之久,Ron Sterbenz表示,他是Telx的市場副總裁。在NJR2使用的兩個變電站恢復(fù)在線后,公共電源基本穩(wěn)定,Telx的小一點的數(shù)據(jù)中心NJR1仍舊整天靠發(fā)電機維持。
該公司在曼哈頓的設(shè)備(NYC1)都依靠發(fā)電機運作,直到公共電力恢復(fù)一直都在發(fā)電機上運作,Sterbenz表示。NYC2在大廈管理團隊減少整個大廈的空調(diào)時遭遇了輕微的冷卻問題。Telx已經(jīng)對于風(fēng)暴做出了準備,通過引入風(fēng)扇進行現(xiàn)場冷卻,員工也能夠在雨后打開窗戶。
Telx在風(fēng)暴前也完成了每一個數(shù)據(jù)中心的能源供給,增加了額外的員工在風(fēng)暴期間工作,并存儲了不易腐壞的食物為長時間工作的員工供給,Sterbenz說道。
盡管在每一個風(fēng)暴點中每一個數(shù)據(jù)中心單獨運行在一個發(fā)電機上,盡管NYC2的設(shè)備遭遇過熱的問題,Telx沒有宕機。“我們準備充分,讓我們客戶在颶風(fēng)期間運轉(zhuǎn)自如,”Sterbenz介紹。
Integrity Virtual IT積極應(yīng)戰(zhàn) CentriLogic聚焦人文
同時風(fēng)暴區(qū)域的一些傳統(tǒng)IT服務(wù)提供商依賴云提供商保持正常工作。Integrity Virtual IT是一家IT外包公司,為例馬里蘭州銀泉,使用基于hypervisor的數(shù)據(jù)復(fù)制產(chǎn)品,該產(chǎn)品來自以色列的DR即服務(wù)提供商Zerto,通過Integrity弗吉尼亞和芝加哥的數(shù)據(jù)中心復(fù)制數(shù)據(jù)。
同時弗吉尼亞的數(shù)據(jù)中心沒有斷電,默認其發(fā)電機在風(fēng)暴期間運作。Integrity在兩個網(wǎng)站之間提供給客戶已經(jīng)復(fù)制的數(shù)據(jù),這些數(shù)據(jù)在風(fēng)暴之前就已經(jīng)轉(zhuǎn)移,Integrity CEO Ron Offer如是說道。
Affigent是位于弗吉尼亞的一家技術(shù)咨詢公司,其客戶主要是政府,同時它也是Integrity的客戶,預(yù)測到風(fēng)暴會持續(xù),選擇提前轉(zhuǎn)換到芝加哥數(shù)據(jù)中心。“當(dāng)我們意識到我們會成為風(fēng)暴中心,我們決定將主網(wǎng)站替換到芝加哥,”Matthew Friedman表示,他是Affigent的業(yè)務(wù)運行總管。兩個網(wǎng)站之間的數(shù)據(jù)復(fù)制過程用了不到一小時,而且對于Affigent的政府呵護是透明的。“我們沒有經(jīng)歷斷電或者破壞的復(fù)制流程。”
CentriLogic是一家云、托管和管理服務(wù)提供商,其數(shù)據(jù)中心位于紐約羅切斯特,也沒有因為颶風(fēng)經(jīng)歷斷電,但是卻演示了如何通過颶風(fēng)的考驗,一個提供商DR計劃如何很好的持續(xù)支持不僅僅是基礎(chǔ)架構(gòu)和故障轉(zhuǎn)移功能,還支持人和溝通,Robert Offley表示,他是該公司的CEO兼總裁,“你可以讓你的計算機保持運作,但是提供商需要確保他們的客戶能夠遠程訪問這個系統(tǒng),且其員工可以提供支持的支持,”他指出。
數(shù)據(jù)中心災(zāi)難恢復(fù)(DR)經(jīng)驗總結(jié):明智的設(shè)計設(shè)備
盡管在自然災(zāi)害發(fā)生或者風(fēng)暴臨近時,對于數(shù)據(jù)中心基礎(chǔ)架構(gòu)而言,切實可行的措施不多,但是云提供商和數(shù)據(jù)中心運營商應(yīng)該存儲足夠的能源,包括針對發(fā)電機的能源和應(yīng)急人員的食物,F(xiàn)orrester Research基礎(chǔ)架構(gòu)和運營高級分析師Rachel Dines表示。
食物和燃料是表象,而不是病灶。很多數(shù)據(jù)中心運營商將其發(fā)電機存在大廈的地下室,這部分是最容易受到颶風(fēng)中洪水襲擊的。要讓關(guān)鍵性的基礎(chǔ)設(shè)施組件離開地下室和第一層,這些洪水容易襲擊的地方,這也是供應(yīng)商保護客戶不宕機的第一步,Dines說道。
對于管理服務(wù)或者托管提供商來說,故障恢復(fù)是讓客戶在線最核心的地方。“對于一些位于紐約數(shù)據(jù)中心的客戶而言,最顯著的遭受了宕機影響,像Datagram的客戶,很多至少能夠故障恢復(fù)到另外的地理位置上。”
盡管故障恢復(fù)得當(dāng),在颶風(fēng)桑迪期間一些客戶還是遭遇了主網(wǎng)站和二級網(wǎng)站的宕機。因此,云提供商在選擇數(shù)據(jù)中心地址的時候應(yīng)該考慮地理差異化,Dines表示。“提供商需要考慮他們構(gòu)建數(shù)據(jù)中心的地區(qū)的風(fēng)險預(yù)測,讓其二級網(wǎng)站能夠在不同的地區(qū)運轉(zhuǎn)。”