盤點火災案例
2018年9月30日上午10點26分,據一知情市民介紹稱,此次事發的具體地點為美國西海岸惠普大數據。“說來有點可笑,昨天我剛看到了他們的新聞,說是惠普全球大數據中心雛形初現,沒想到今天就起了一把火,我想知道大數據中心的雛形還在么?會不會給燒沒了!”
西海岸惠普大數據中心火災現場照片
4月5日,擁有信息黃埔之稱的北京郵電大學校園核心機房著火受損,眾多北京高校校園網紛紛崩潰。據來自各校小伙伴們的消息,這一把火,可是燒掉了半個北京的校園網啊。
北京郵電大學校園核心機房火災照片
2015年10月13日,Windows Azure上海數據中心發生故障,是由服務器所在機房著火斷電引起,導致Azure基礎設施離線無法提供正常服務,受影響的用戶包括金融、互聯網、房地產。
2015年5月26日早晨,遠在美國亞利桑那州平頂山的蘋果工廠發生火災,起火點位于該公司數據處理中心屋頂光伏項目;
2015年1月10日亞馬遜公司正在美國弗吉尼亞州建設的一座數據中心著火。
2014年7月20日重慶農商行數據中心發生重大火災,整個機房全部燒毀,直接損失達到一個億以上。
對于數據中心發生的故障,行業專家認為故障多發的原因還是在運維管理上,正所謂“三分技術,七分管理”,數據中心的故障大多源自于人禍。
怎樣預防與處置機房火災
數據中心火災的主要特點是:散熱困難、煙氣量大、用電量大、電氣火災居多、火災損失大、撲救難度大、節點易燃燒。
最需要普及的問題:七氟丙烷并非有毒,而是惰性,它的大量釋放會擠占氧氣的空間,空間中含氧量的迅速降低切斷火源燃燒的條件,但是缺點是他噴放的時間只有短短的幾秒,設置不合理可能無法一次性解決問題。其他配套設施的不妥善安裝也會影響其效果。
絕對不能抱有的僥幸心理:我的機房還好,這么多年都沒出過問題。應該清晰的認識到:我管理的機房還不夠好,還需要多注意日常維護和演練。
如果你的機房是有人值守的機房,全天候有人近距離值班,怎樣最大限度的保證機房安全?
一切前提是有一幫認真可靠的一線運維人員,愿意用專業的知識保護自身和機房的安全運行。
安裝有極早期火災預警探測裝置;
配有氣體消防滅火氣體噴放裝置,可通過消防主機自動啟動;
日常每季度都檢查整套消防裝置的使用聯動性;
日常工作中有建立火災處置流程,將處置角色分配到合適的人身上;
裝有環境監控系統,能夠在告警發生后第一時間將信息傳達到相關人員手中,啟動處置流程;
第一,安裝有極早期火災預警探測裝置是所有一切的前提,煙感、溫感要在機房的合適部位監控這些環境要素,當發生任何一種告警都應當引起足夠注意,因為氣體滅火裝置是在消防主機接收到煙感和溫感同時報警后才會自動啟動的。運維人員不能麻痹大意。這里有一點要提到,根據一位資深工程施工經理的反饋,機房環境他們做過測試,如果用傳統型的煙霧探測器,在火災發生早期敏感度較低,原因是機房內因為氣流調節的關系,煙霧流動較快,早期煙霧濃度達不到探測對應的敏感度,只有到達一定濃度后才能產生告警,這時已經有點晚了。
第二,如果你安裝了了氣體消防主機,不論是二氧化碳的還是七氟丙烷的,都應該設置能夠由消防主機啟動,人員可以在30秒內停止,這里有個前提就是你的人員不能在內,必須馬上逃離。要對逃離機房的路線絕對熟悉。扯遠點的話就是逃生路徑必須通暢不能堆放雜物,限于篇幅這個不展開來講了。
第三,近期發生的一起特大行業事故,其中有一個原因就是發生事故的機房柜式氣體滅火器從建成之日起就沒有再進行過維護,事故發生后氣體鋼瓶已經不能使用,氣壓已經不足以噴放。所以,根據這期事故的原因和其他多起消防事故的成因來看,氣體消防系統必須的也是務必要在半年、一年為單位進行全系統的測試該更換的及時更換,該檢修的檢修。
第四,就是跟日常監控過程有關了,重要的核心機房區域,必須建立值班人員火災事故演練,簡單的說就是,值班的人員都知道自己該干什么,根據日常演練的過程駕輕就熟的操作,避免事故擴大化,將損失降到最小值。如果光靠物理設備控制火災蔓延未免有點太過想當然了。
第五,及時配備環境監控系統,要能夠對消防信號干接點、消防主機、空調機、電路負載等進行實時監控,一有異常及時告警。及時處置,防患于未然。
最后,核心機房的運維細節繁多,質量控制手段的完善程度與機房承載的業務連續性是成正比的。除了日常運維,數據中心的應急預案也很重要,建設災備系統正是其重要的環節一句話,只有平常日常建立完整的處理機制、流程、規章制度并加以遵守,才能從本源上確保機房安全。