近日,某IDC服務商機房宕機直接導致某商業銀行業務中斷,此事引起了銀監會的高度重視,并發布了《中國銀監會辦公廳關于銀行業金融機構數據中心基礎設施外包風險提示的通知》。通知指出,銀行業金融機構要開展自查,從加強外包風險管理,加強對基礎設施主動管理,提高業務連續性管理水平等三方面采取防范和應對措施。
據了解,此次宕機事故的原因是:機房內電力負載過高,造成配電柜開關跳閘,供電中斷,空調停止運行,生產機房溫度升高導致的設備宕機。
其實,類似的事件不是第一次發生了,之前中國信息通信研究院的專家就針對數據中心機房故障的原因做出過總結,專家們表示,數據中心機房故障多發的原因關鍵還是在運維管理上,所謂“三分技術,七分管理”,數據中心的故障大多來自人禍。
結合事件原因及之前案例,我們不難分析,導致此次事故的很大一部分原因也是“運維管理不到位”。
首先在建設數據中心之前沒有對負載做出充分的預估,導致電閘配置不能滿足負載的需要;其次,在發生事故之后,應急處置能力不足,導致不能及時的解決突發事件;另外,機房制冷方面僅依賴空調制冷,沒有設置高溫應急措施,導致機房持續高溫。
頻繁的數據中心故障和宕機事故表明,某些數據中心在一味滿足客戶個性化需求的同時,忽略了自身運維管理能力的提升,導致數據中心可靠性降低,從而發生此類事件。而客戶在選擇數據中心的時候則存在著,不知道該如何選擇優秀的服務商,如何去評估一個數據中心的管理能力,如何規避風險,以及如何審查服務商對合同的執行力度。
在客戶自身無法評估數據中心服務能力的時候,來自政府或權威第三方的權威評估就顯得尤為重要。
自2014年以來,工信部一直關注著數據中心的服務能力。其下屬組織數據中心聯盟,也一直致力于推動數據中心產業的健康發展。為了更好的規范數據中心服務體系,提高數據中心的服務能力水平,保證數據中心客戶在選擇數據中心服務商及相應服務有充分的參考依據。同時,為了將主管單位政策落到實處,在工信部的指導下組織相關領導,技術專家以及行業用戶,完成了數據中心服務能力評價標準的編撰工作。
數據中心服務能力評價標準是從用戶視角出發的評估體系,是目前國內最科學的一套評估體系,它能夠全面體現一個數據中心的整體服務能力。
通過對數據中心進行評估,不但可以很好的幫助客戶解決痛點。同時,也可以幫助數據中心服務商了解自身現狀,增強自身的市場競爭力,留住現有客戶并發展新的客戶,規避運維過程中的各類風險,為客戶提供更加優質的服務。
總而言之,通過科學規范的評估,可以幫助客戶認清服務商,也可以使服務商看清自己,從而減少宕機事件的發生,促進數據中心行業健康有序的發展。