維護計劃
既然數據中心和IT管理人員們一直都在積極努力的避免因數據中心斷電帶來的高貴的企業損失,那么年底則可能是一個很好的時機來充分的排查數據中心的基礎設施的服務戰略,執行必要的維護。在許多企業,IT基礎設施已演變成一個相互依存的,重要業務網絡,包括數據、應用程序、存儲設備、服務器和網絡。在沿網絡的任何一點的電力故障都有可能影響到整個操作,給關鍵業務帶來嚴重后果。
在數據中心進行積極的服務和維護,可以幫助數據中心管理人員實現關鍵基礎設施可用性、容量和效率的最大化。定期執行預防性維護可以顯著減少斷電停機的可能性。
電力設備維修
關鍵電源設備的定期維護應包括:
完整的視覺設備檢查。這應該包括子組件、線束、電纜接觸、電纜和主要組成部分
目測檢查所有斷路器,包括溫度計數、連接和相關控制器。
檢查空氣過濾器的潔凈程度。
檢查交流和直流電源,電容器是否腫脹/或泄漏。
記錄所有的電壓和電流的儀表、控制柜模塊或系統控制柜的讀數。
測量并記錄諧波過濾器/陷波器的電流。
根據系統規格需要檢查和記錄所有的電子設備。
根據需要安裝或執行任何工程現場更改通告(FCN)。
確定并記錄所有低壓電力供應水平。
計算并記錄耦合輸入電壓和電流。
在這些測試服務結束后,執行系統運營測試,包括單元轉移和電池放電。除了關鍵任務的電源和配電設備,所有機械系統需要進行預防性維修,以確保最佳的性能。
散熱產品服務
散熱模塊有些移動部件會最終磨損。維護這些設備的目的是使這些組件盡可能延長使用壽命,執行其最初的設計的運行參數,并在他們報廢之前及時的更換部件。這對于停機將對業務帶來災難性影響的當今數據中心環境,尤其顯得重要。
維護任務因設備的不同而產生差異。應與當地的授權服務代表協作,并要求他們提供設備適用的維護任務的完整列表,征詢他們的用戶手冊意見。
常見的冷卻基礎設施的預防性維護工作應包括:
檢查和更換空氣過濾器。堵塞的空氣過濾器會減少氣流達到系統,增加風機驅動系統的負荷。這可能會降低系統的散熱性能,帶來更高的運營成本,減少風機驅動系統部件的使用壽命,提升數據中心經營設備的溫度。
檢查和維修風機驅動系統。風機皮帶、軸承、電機和車輪的磨損或損壞可能會導致氣流損失或散熱性能降低。
蒸汽發電和紅外加濕器。加濕器可能連接泄漏的閥門和軟管,排水渠可能隨著時間的推移堵塞。紅外加濕器燈泡可能會燒壞。應定期檢查這些組件。
冷凝水排水渠及泵檢查。確認合適的泵功能并驗證水渠是否堵塞。顯然,下水道堵塞和傳感器失敗都會造成泛溢。
檢查和清理再熱元素,排查和加強配套硬件。
檢查壓縮機的油位,并檢查是否泄漏。壓縮機運行過多或過少的油會使使用壽命降低。始終使用相同類型的OEM提供的油料。
蒸發器線圈應定期檢查,以確認他們是否干凈并且無碎片。正如你可能想象的,骯臟的線圈會降低散熱效率。
冷凝器線圈應定期檢查,以確認他們是否干凈并且無碎片。電機應嚴密、軸承應不受約束。
為了減少相關的故障,我們推薦進行對技術人員進行全面維修方案和OEM培訓。當正確實施,維護方案,確保數據中心設備最大的可靠性,提供系統性的檢查,可有效進行初始故障檢測和校正,無論這些故障發生或發展成重大缺陷,都可能導致代價高昂的停機。典型的預防性維護包括檢查、測試、測量、調整、更換零件和內務管理措施。
艾默生網絡能源關于預防性維護(PM)對UPS可靠性的影響研究表明,平均故障間隔時間(MTBF)為單位,每年至少兩次預防性維修服務比沒有預防維護服務的UPS優23倍。根據這項研究,由訓練有素的工程師進行額外的訪問的可靠性繼續穩步增加。
該模型的結果如下圖所示,它描繪了預期的MTBF數據投影到每年六次預防性維護,并將數學模型納入了現實世界的數據得出的結果。“沒有進行預防性維護”的一組的MTBF大大高于簽署了緊急維護服務合同的。MTBF隨著每年進行從零到六次的預防性維護而大幅度提高。
我們推薦每年至少進行兩次預防性維護,但也許需要進行一些額外的維護。根據特定的應用程序停機時間成本,高投資回報率,可以實現在許多情況下增加預防性維護的頻率。
一個正式的維護服務戰略,包括定期的預防性維護,將增加您UPS、PDU和電池的可用性和可靠性。但是應該指出,這只是第一步。您還必須保護您的整個電力基礎設施:從服務入口開關到機架安裝,以確保和維持關鍵業務的連續性。