在多數情況下,觸發數據中心停機的特定事件是不可預知的。企業花費數千萬美元設計建設數據中心的冗余基礎設施和自動故障轉移系統,以彌補不可預測的問題。但是根據定義,這個目標是無法達到的。
英國數據中心運營商UKFast公司日前宣布,一家承包商在12月12日上午意外地在英格蘭曼徹斯特市的一個電力中心觸發了一起事故,切斷了UKFast公司運營的數據中心園區中三個數據中心的其中兩個設施的電力供應。而這兩個數據中心的備用電源系統沒有按照設計要求建設,因此導致數據中心斷電停機。
UKFast公司的曼徹斯特數據中心園區
雖然花費了大約一個小時的時間就將其發電機的備用電源提供給數據中心,但直到次日上午,UKFast公司的工程師們才恢復其所有的客戶服務。一些物理設備由于停電而損壞,不得不被替換,并且使得基礎設施系統正常運行也存在一些軟件的問題。
UKFast公司提供了在曼徹斯特數據中心園區托管的各種數據中心服務,其中包括主機、云計算、專用服務器,以及托管服務。園區內共有三座兩層樓的數據中心建筑:MaNOC 4,MaNOC 5和MaNOC 6和7(建有兩個數據中心的單一建筑)。每棟建筑都有兩層的數據大廳。MaNOC 5和MaNOC 6和7這兩個建筑都遭遇電力中斷。
而這兩個數據中心的UPS供電系統在失去市電時正常工作,而備用電源柴油發電機雖然啟動但未能實現相位同步,UKFast公司表示這種情況歸因于電力電纜的損壞:UPS供電系統為其工作負載提供了電力,并啟動了柴油發電機,然而,由于電力電纜的物理損壞,對現場提供的電力不穩定并且是間歇性的。結果,柴油發電機組無法實現同步并提供備用電源。數據中心工程師只好對柴油發電機實施了手動同步工作。
由于電網通常并不可靠,因此許多數據中心運營商會在其數據中心上建立冗余的電力供應,這些供應通常連接到多個電網。但是這種冗余基礎設施的投資成本高昂,一些數據中心運營商(特別是小型運營商)有時會省卻這些開支,把他們的設備的正常運行時間寄希望于他們備用電源系統的穩健性上。
法國云計算服務提供商OVH公司在斯特拉斯堡的三個數據中心在11月電力中斷后停機。該公司表示,其停電的主要原因之一是數據中心缺乏雙電源回路。 OVH公司表示,雖然使用電源雙饋電架構是企業的標準,但是這個數據中心實施的是一個較舊的標準,沒有提供雙路電源。