多年來,安全防護行業警告說,數據中心基礎設施設備很容易受到網絡攻擊,因此電網和其他基礎設施存在潛在的破壞風險,黑客可以通過遠程網絡進行攻擊。2015年底,這個警告已經成真:烏克蘭遭受了嚴重的停電事故,這被認為是黑客的惡意攻擊所造成的。
如果這是真的,那么黑客中斷數據中心運營商的電力意味著什么?
改變了什么?
數據中心與電網的相互聯系發生了什么改變?2014年一個調查機構對美國電網進行了研究,由此提出了關于現代化的電網數據采集與監控(SCADA)系統幾個問題:“矛盾的是,隨著電網日益網絡化,在提高效率和整體態勢感知能力的同時,也越來越容易受到來自網絡空間的入侵和攻擊。”
攻擊的到來
調查機構對于關注電力脆弱性報告的發布正當其時,事實上,黑客成功地攻擊了烏克蘭能源供應商prikarpatjeo blenergo公司的電力設施。
SANS研究所的工業控制系統(ICS)研究團隊試圖揭開這次網絡攻擊的前因后果。ICS隊研究了烏克蘭電網遭受網絡攻擊的惡意軟件潛在的樣本,并對烏克蘭電網的協同攻擊進行了確認,并公布了初步調查結果。
米迦勒·杰·埃斯安特
對于黑客攻擊,SANSICS研究團隊負責人,調查報告的第二作者米迦勒·杰·埃斯安特說:“攻擊者展示了其周密的規劃和協調性,并有效地使用惡意軟件,可能采用直接遠程訪問系統進行調度,引起電力基礎設施配電設施不良狀態的變化,并試圖通過SCADA服務器消除他們引起的中斷延遲的痕跡。”
幸運的是,烏克蘭電力公司的工程師可以使用手動模式關閉惡意軟件感染的SCADA系統,這讓電力工程師們在不到六個小時的時間內恢復整個電網的供電。埃斯安特警告說,如今,電網系統更加依賴自動化設備,今后將有可能無法以類似的方式恢復他們的大部分系統。
數據中心發生了什么事?
對于數據中心來說,遭遇電網停電就是一個重大故障,不管是什么原因造成的。而惡意攻擊造成的電力中斷可能會持續下去,或者說是時間更長和。但保護的措施是相同的,就是部署冗余和后備電源。
有多種方式可以處理電源冗余。大部分的設計采用開關控制器進行控制,在使用備用發電機/電網的電力之間進行選擇,尤其是小型數據中心設施??刂破鲗㈦娫答佀徒oUPS供電系統,UPS供電系統再將電力提供給機房IT基礎設施。
如果電網斷電,開關控制器無法向UPS供電系統傳輸電力。但是,UPS通過蓄電池逆變的電力繼續為關鍵IT設備供電,但持續時間有限。此時,開關控制器有兩個選擇:一是繼續供電(一個指定的時間),繼續等待電網的電力恢復正常,如果電源中斷是暫時的話。
第二個選擇就是啟動備份發電機,這時UPS系統的電池沒有完全耗盡。當電源恢復時,操作過程與此相反。
保持燃料儲備
大多數數據中心運營商都會接受六個小時的停電的事實,類似于發生的烏克蘭電力中斷事件,這是一個偶然事件,而在此期間,即使備用發電機組在滿載情況下,數據中心運營商將會有足夠的時間添加足夠的燃料,以應對更長時間的停電。此外,數據中心運營商一般會與燃油供應商簽署合同,明確說明其數據中心將無限期運行,并對其提供燃料所需要的時間進行了規定。
詹姆斯·漢密爾頓
詹姆斯·漢密爾頓了解數據中心基礎設施的供電方式,他重申燃料合同的重要性。數據中心運營商應堅持獲得最高優先級的供應。漢密爾頓還強調燃料供應商必須供應足夠數量的燃油,而在停電期間提供更多的燃料來源,以及保障提供燃油的方法是重要的。
面臨其他挑戰
在不斷激烈競爭的市場中,數據中心運營商采用了一種稱為功率超額預定技術,為計算設備提供超過功率總量的更多的電能。這允許電力基礎設施托管更多的服務器,而不需要升級。在大多數情況下,超額預定并不是所有的服務器在同一時間達到的最大功耗。
然而,計算設備的總功耗在某些時候超過可用容量,這是完全可能的。此外,由于數據中心運營商并沒有升級電力基礎設施。如果電網停電,并且數據中心設備功耗過大的話(通常是意外或黑客進行所謂的“攻擊”),UPS和備用發電機系統容量較小,則是一個潛在的隱患。
維護和故障
漢密爾頓提出了另外一個建議,就是冗余系統在IT設備正常運行時很少使用,而數據中心電力系統無法處理更多的負荷時,也就是最需要冗余電源系統的時候,而這時冗余系統也有可能不會發揮其保障作用。
保羅·柯萬
答案是顯而易見的,就是要對這些設備進行定期的維護。獨立的IT顧問和作家保羅·柯萬在一個專欄指出:“維護就是定期檢查備用電源系統,并在制造商的建議下進行調度和試驗。維護的另一個重要方面就是進行基準測試。在維護期間執行各種測試,這種測試的結果是最有意義的,而不是簡單地通過計算來判斷其是否合格。”
操作失誤是漢密爾頓的關注的另一個問題。數據中心的工作人員在被迫應對特殊的情況時,可能會面臨越來越大的壓力,或遇到不熟悉的情況,這二者都增加錯誤的可能性。雖然事情并不總是會發生,但必須對此高度關注。
規則和底線
隨著越來越多的企業將其數字業務轉移到云計算,數據中心越來越成為了許多居心叵測的人的新選擇。數據中心運營商要了解這一情況,并確保其設施可以應用對所有已知的手段。
然而,居心不良的人并不會遵守規則。他們可以通過一項對數據中心的所謂“電力攻擊”,就會讓運營商的過度配置不堪一擊。例如通過運行合法租用的服務器,使其達到最大功率,再讓采用數字化變電站供電的數據中心電力中斷。這是出乎人們意料之外的手段,但確實是行之有效的。