日前,在新加坡舉辦的第二個數據中心周中,有專家表示目前數據中心的故障發生過于頻繁。
近年來,數據中心故障屢屢發生,其中包括在新加坡證券交易所電力中斷事件(2014年SGX的停電事故是由于多種因素的組合),雖然這個事件是個例外,新加坡證券交易所還是公布了這個消息。但其他數據中心運營商的數據中心發生的故障,卻由于行業的競爭性處于保密狀態。
保密協議防止學習
“數據中心是一個復雜的定制同源技術系統。人員和技術方面不能分離,對這兩方面都需要揭示到底是什么地方出了錯,而且往往這些失敗是之前發生過的。”i3解決方案公司董事長埃德·安捷在會議上說。
而其他行業如航空業也有同樣的問題,但其可靠性要求更高,因為事故調查規定了可靠性的級別。安捷說,“數據中心是一個年輕的行業,目前不受監管,也沒有絕對的權威,而其最接近的安全法規,有些類似金融服務當局的安全規定或授權(如新加坡金融管理局MAS)。”之所以沒那么高級別的調查,其中一個原因是數據中心的故障不會造成人員傷亡,不像飛機失事那么嚴重。
其實數據中心一系列的故障都是可以避免的。安捷說,例如,數據中心運營商拒絕使用剩余電流探測器安裝在服務器中,這個設備是為了保護人們免受電擊。而數據中心運營商認為這種設備部署在他們的數據中心是不合適的,他們認為部署一個低于30mA的推薦設置,會造成服務器故障,并將造成難以預測的級聯開關的跳閘。
安捷表示,由于故障數據對于其他廠商來說不共享的,這樣的信息和知識并不適用于所有用戶,因此數據中心實現正常運行時間比其期望的低得多。
他預計,在越來越儀器化的世界,數據中心正變得越來越重要,這可能會在未來發生改變。在他看來,最終數據中心出現故障,甚至會發生人身傷害事故。屆時,數據中心行業將不得不接受監管和改變,并將強制共享故障數據。