上周四,比利時布魯塞爾西南郊的St.Ghislaina小鎮遭遇了雷電天氣。結果,Google位于該鎮的數據中心所存儲的數據,遭到了“嚴重”的損失。
Google比利時數據中心成立時的照片
閃電擊中了數據中心所用的電網,導致主要電力系統供電中斷。數據中心隨即切換到了兩種備用系統:備用供電線路和服務器內置電池。一般來說,兩種災備方案對于數據中心肯定是夠了,但誰曾想到,內置的電池這次出現了問題。
根據Google透露的情況,在從上周四到昨天的時間里,由于部分數據中心服務器的電池耗盡時間太長(extended or repeated battery drain),這些涉事服務器存儲的I/O出現了零星的存取失敗情況:大約百分之0.000001的數據受到了影響。
這些服務器位于Google Compute Engine的北歐區域的europe-west1-b,受影響的服務器在該數據中心比例約為5%。
雖然看起來數據損失比例極小,但對于擁有海量數據的Google來說,本次數據損失并不是一件小事……行業人士估計,Google擁有10-15 exabyte(EB)的數據,每exabyte等于100萬TB,而每TB等于1000GB。如果把這個數字帶入到計算里,百分之0.000001大約等于100多GB的數據。當然,Google雖然沒有公布比利時數據中心的數據存儲量具體有多少,但我們可以估計,至少有數GB到數十GB的數據,在本次雷暴中丟失。
Google比利時數據中心
Google的數據中心架構工作人員正在著手解決這個問題。目前,大部分的服務器已經使用更換了具備更好抗災性的存儲硬件。另外,Google也重申,Google云服務的彈性計算架構遍布全球各地,用戶可以設定在災難發生時自動切換到備用的彈性架構上。目前,Google Compute Engine在全球共有三個服務器,分別位于比利時、臺灣的彰化和美國的愛荷華州。