英國《泰晤士報》報道,由于主要數據中心供電問題,英國航空公司5月27日的航班受到嚴重影響,大約75000名乘客受到取消航班影響。據稱,這是由于承包商意外關閉數據中心電源造成的。由于影響到公司幾乎所有的IT系統,英國航空公司被迫在公眾假期周末期間取消從倫敦的希思羅機場和蓋特威克機場出發的所有航班。
英國航空公司(BA)表示正在進行“詳盡的調查”,以確定數據中心停電的根本原因。
正如行業媒體“計算機周刊”所報道,這個數據中心電力故障導致英國航空公司的入住,行李處理,預訂和聯絡中心系統在5月27日宕機,導致兩天內的兩個機場的大部分航班被取消。
英國航空公司發言人表示,該公司知道發生了什么事情,但現在正在確定其事故原因。
該公司在聲明說:“由于不受控制的電力中斷,英國的數據中心遭受了巨大的損失,電源浪涌導致我們的IT系統宕機。我們正在進行詳盡的調查,以了解具體情況,最重要的是要確保這種事情不能再次發生。”
在發生混亂的期間,航空專線小組工會就發表了自己的聲明,指責2016年英國航空公司決定將其部分IT功能外包給印度,這是發生中斷事件的一個因素。
英國航空公司的聲明駁回了專線小組的指責,表示決定外包只是為了滿足其資訊科技的要求,并不會造成中斷事件。
據《電訊報》報道,“IT宕機并不是IT設備的失效,與IT外包無關。這是一個電力供應中斷導致的事件。”讓人們對這種中斷有了更多的了解。并表明英國航空公司基于希思羅機場的兩個數據中心之一的故障可能來自不間斷電源(UPS)故障。
這個數據中心的電力最初在5月27日上午8時30分失效,如果UPS正常工作,電力應該被恢復。但是,正如英國航空公司的聲明中所證實的那樣,恰恰相反,沒有提供備用電源,使其服務器發生了“災難性的物理傷害”。
行業媒體“計算機周刊”的數據中心技術和生態高效IT研究副總裁Andy Lawrence表示,大多數數據中心供電系統的設計就是為了應對這種電力中斷問題。他說:“電力系統中的一些系統顯然未能達到預期的水平。”
英國航空公司進行的調查即將結束。然而為什么這么多的航空公司的系統受到影響,Lawrence對此表示不解。
他說:“很顯然,英國航空公司一直在努力解決幾個問題,從電源開始,再擴展到網絡/消息系統,以及數據庫/應用程序設計。從所有這些問題中恢復,當他們跨越多個團隊并涉及多個承包商時,是具有挑戰性的。”
他說,從整體應用架構的轉變可能是一個因素。他表示,隨著時間的推移,這些系統也在不斷變化和發展,開發多個外部依賴關系的每個系統都在做出貢獻。所有這些都要求采用分布式彈性戰略,確保應用程序能夠充分應對部分故障和不完整的數據。”Lawrence說。
他表示,“同樣,數據中心冗余備份和關鍵的相互關聯的系統可能需要在電氣和邏輯上彼此分離。如果它們在同一個數據中心運行,那么這個數據中心規劃和運行方面需要得到良好的實施,以減少其中斷風險。”