盡管UPS電源都在盡職盡責地保護著IT設備的正常運行,但故障也是很難避免的。據統計,UPS電源本身的原因造成故障比例不足30%,自然因素和人為的因素造成故障的比例占全部故障數的60%~70%.故障或貌似故障的原因可歸納如下幾種。這里吧引起人們恐慌和驚動廠家的一切機器現象統一成為“故障”。
一、懷疑“故障”
所謂懷疑故障,顧名思義,是指由于值機人員缺乏基本的分析能力和沒有很好地閱讀說明書導致的誤會。有一些10kVA以下小容量的UPS電源,大都沒有采用液晶顯示,而是用4~5只發光二極管LED豎向排列成“棒”狀指示燈,以形象地表示電池電壓或負載的百分比,這種按百分比表示的方法,在裝機時未經進一步校準一般是不太精確的。而大多數用戶的注意力都集中在指示的精確度上,但也有的出現了大誤會。例如,在一次重要的飛機校飛中,一測控站突然驚呼UPS電源帶不上負載了!因為他發現負載指示燈都沒有被點亮。這一非常時間驚動了上級領導和供應商,就在人們等待“維修”的時候,由該UPS電源供電的設備扔在正常工作。一場虛驚的原因是值班員發現負載指示燈不亮。隨機說明書上清楚地寫著,當負載在30%以上時,最下面的一個指示燈才被點亮。
又如,某UPS電源雙機冗余并聯系統正常運行時,值班員突然發現其中一臺UPS電源的控制板上有兩盞燈點亮,而另一臺的控制板上則只有一盞登點亮,這二者的差異引起了恐慌,于是急招廠家修理。原來雙機并聯時,主機亮兩盞燈而副機只亮一盞燈,在產品說明書上已有說明。
二、知識性“故障”
知識性故障主要是由于一些機器管理員自持經驗豐富而實際是既缺乏基本理論只是又缺乏實踐經驗所致。例如,有一雙30kVAUPS電源冗余并聯系統,后面帶一通信機。通信機電源剛一捷通就燒壞冒煙了,換了一臺又燒毀了,又換了三臺,這才工作正常。于是通信機廠家提出此故障是由于UPS電源三相輸出電壓的零點漂移而造成這一相電壓過高所致,急招UPS電源廠家立即解決問題。經現場測量,UPS電源的三相電壓都為220V,三項電流不足10%,又何談零點漂移呢?實際查明是通信機廠家的電源有質量問題。
在早起的傳統雙變換UPS電源中,由于三相逆變采用了統一控制,因此在三相負載極端不平衡的情況下就會產生零點漂移,使三相相電壓有很大差異。后來采用了對三相相電壓分別控制與統一控制相結合的方法后,情況大有好轉,可以使三相相電壓的不平衡度小魚2%.而近來的三相半橋逆變采用了分別控制,而且三相電壓在統一相位的控制下各完全獨立,及時在三相負載100%不平衡的條件下,也可以使三相相電壓的不平衡度小于1%,這就為“非三進單出UPS電源不可”的用戶提供了選擇的空間。
三、操作故障
①為了使UPS電源安全可靠地開機運行,各種產品都有自己“特定”的一套操作程序。所謂“特定”,就是說各種品牌的UPS電源的設計思路不同,在操作上也各有各的考慮,并將其寫進了隨機的“操作手冊”。按照“手冊”程序操作,就可完全保證安全,否則就可能或必然出問題。然而,有的操作員以為電源很簡單,不看說明書就按照自己的理解任意操作,結果造成了損失。
②無意識操作。例如,在維修期間,拆卸某一連接很牢靠的器件時,不小心碰壞了臨近的脆弱器件而未被發現,修理完畢后加電時造成了二次故障。
③帶電檢查故障時,測了表筆探頭誤將電路或器件兩點碰短路,形成重復故障。
④連接外部電池時,誤將極性接錯,燒毀了逆變器;有的電池鏈接末端被擰緊或節耗電池后忘記了閉合電池開關,在市電一場時,UPS電源因電池不能放電而停機。
⑤輸入/輸出線鏈接不牢,會造成交流電斷電假象故障;供電局進行線路維修或該著時更改了原本的相序,因而導致UPS電源不能啟動或切換;UPS電源加電后忘了啟動逆變器,一直是旁路供電,市電出現故障時UPS電源也停止供電。
⑥值班人員在機房或機房附近的值班室亂放食物,找來老鼠啃咬電纜或鉆入機器內部導致故障。
⑦不合理的布線。例如,將無屏蔽的遠程信號線與交流功率線并行靠近走線。導致該部分控制信號紊亂,造成故障。
四、延誤故障
①機器已經告警,由于值班員的疏忽而未及時發現與處理,由此而導致后來的故障。換而言之,如果及時發現時處理就可以避免后來的故障。例如,在飛機雙機并聯UPS電源系統中,負載被均分到兩臺機器上,有的UPS電源有時會由于某種條件的巧合而導致一臺逆變器關機,系統就自動被地將故障UPS電源的負載轉到另一臺上,這是面板或監視器上會有顯示告警。值班員及時或市電故障時間較長,另一臺UPS電源就會轉旁路或提前斷電。
②電池在非理想的情況下運行時,尤其在長期沒有充放電的情況下,更要加強監視,一經發現容量有明顯降低,就立即更換。因為電池時效的速度有快有慢,有的是瞬間的,今天測量是好的,很可能明天就徹底壞了。
③車載或艦載UPS電源的保險絲和接插件在不停地震動中容易松動,從而造成故障。保險絲長期在通電的情況下運行,會發熱軟化過程的同時受震動彎曲下垂,如不及時更換,隨時都可能斷裂,造成故障。
五、維護不當或不及時導致的故障
①對UPS電源的定期維護是必要的,還應有一套嚴格的管理程序。不按規定要求進行定期或不定期保養是導致機器故障的重要原因。例如,UPS電源因長期不維護而導致機器工作不穩定、停機、不能啟動和燒毀元器件等。代開機殼才發現,夾雜著導電離子的灰塵充滿全機、覆蓋了電路板、填滿了絕緣的空氣隙,混合著潮濕的空氣破壞了電路的正常工作。用吹風機將這些異物清理掉就可一切歸于正常。
②UPS電源維護完畢,工程師將市電輸入開關閉合,而恰恰忘了啟動逆變器,一旦市電停電,逆變器不工作而使電池無法放電,導致UPS電源的輸出同時掉電。
③電池運行期限已到,一部分電池明顯失敗,按規定應全部更換,而用戶為了節約,就將“將就能用”的電池保留,只更換那些再也無法繼續使用的電池。新電池的作用不但得不到充分發揮,反而導致機器連續出故障。
六、經驗故障
經驗故障是不可缺少的,是不可多得的財富。但經驗有其相對性,即在一種UPS電源上得到的經驗不一定完全適合另一種,否則就會導致故障。
①以為具有單擊操作經驗的人員去啟動一并聯系統的UPS電源,按照他以往的經驗啟動逆變器后再去搬動輸出開關,結果將逆變器燒毀。他不知道在這集中機器上并機時是先閉合輸出開關而后再去啟動逆變器。
②有的維修人員在維修一種UPS電源時,有幾次輸入保險絲斷了,當場更換后就正常了。而恰恰在一次更換中引起了嚴重的連續故障。實際上導致保險絲熔斷的原因很多,保險絲本身的質量不好會提前損壞,發熱的保險絲在不停地震動中會斷裂,輸入整流器和濾波電容的穿通,逆變器一壁兩個功率管的同時導通與幾串等都會導致輸入保險絲熔斷。
③有的人對某品牌UPS電源特別熟悉,當改UPS電源不能啟動時,就用改錐捅了一下直流繼電器即可。而當另以品牌UPS電源上采用同樣方法時,則燒毀了逆變器。
七、交接故障
交接故障主要是管理人員的前后配合不好造成的。
①實際管理機器而未被培訓的人員和到廠家培訓的人員不是同一批人。
②前面值機人員對機器進行的工作沒有向后來者交代。例如,前面值機人員移動機器位置時而將UPS電源的外接電池組斷開,時候又未向后來者交代,結果造成了市電和UPS電源同時停電的故障。
八、環境故障
環境故障是用戶不重視機器的運行環境或沒有能力優化環境造成的。
①有的用戶將UPS電源放在了既無空調又無通風的環境中,夏季的室溫高達40℃,又潮又濕,導致電池提前失效。
②有的地方供電條件很差,不但電壓波動大而且還經常停電。工作在這種環境下的UPS電源電池經常放電,用戶未向供貨商提出快充電的要求,使電池長期處于虧點狀態,也會導致電池早期失效。
③在雷電多發地或工業電干擾嚴重的地方,用戶在輸入配電盤內未配置一定級別的防雷器或浪涌控制器,致使UPS電源被損壞的現象時有發生。
九、選型故障
造型故障主要是用點者的一些糊涂概念造成的。例如,把UPS電源的效率當成了功率因數,把輸入功率因數當成了負載功率因數和把視在功率當成了有功功率等;認為UPS電源負載功率因數越大越好,不懂得計算機之類的負載在目前不但需要有功功率更需要無功功率等。結果購回的UPS電源容量不是太大了就是太小了,選小了的UPS電源就會因頻繁的過載而跳閘。
十、商務故障
商務故障主要是用戶對供應商在價格和其他條件上的過分苛刻而造成的。
①UPS電源和其他機器一樣,看起來有著同樣的外殼、同樣的內部電路環節等,但外殼的材料和元器件在質量上有著天壤之別,因此在造價上也相差很遠。二者在一些功能和可靠性上不可同日而語。有些使用者不了解這些區別,而一味地要求不同檔次的機器具有同等價格。供應商為了生意,不得不降低元器件的質量,結果使可靠性降低,故障率增加。甚至有的UPS電源壓價太狠,容量合同簽的是100kVA而拿到的確實60kVA的機器,原因是某廠家對二者采用的是同一機殼。
②有的使用者要求供貨商對壽命為3~5年的抵擋電池做3年的免費擔保,這本來是一個不太合適的要求,因從某種意義上講,相當于在不清楚用戶使用環境的情況下的終身免費擔保。為了生意,供貨商當然應允,日后也照樣履行合同。但由于不斷的故障、不斷地更換電池,使UPS電源頻頻停機,給用戶造成損失。