摘要:我們都知道衡量數據中心的價值有三個性能指標:可用性、適應性、TCO。其中的可用性指標是首要的,而供電系統的可用性,包含了系統中設備的可靠性、可管理性和可維護性。我們在考慮數據中心供電系統的可用性的時候都需要注意哪些問題呢?
安全和可靠是數據中心供電系統的主要問題。供電系統指的是從市電變壓器、發電機組之后,包括ATS自動切換開關、配電系統、UPS、供電電纜等環節,他們之間的配置決定了整個供電系統的可靠性。我們都知道衡量數據中心的價值有三個性能指標:可用性、適應性、TCO。其中的可用性指標是首要的,而供電系統的可用性,包含了系統中設備的可靠性、可管理性和可維護性。我們在考慮數據中心供電系統的可用性的時候都需要注意哪些問題呢?
1、斷路器數量增加以及斷路器指標的離散性問題
每個斷路器都是一個單路徑故障點。另外,相同指標而不同廠商的斷路器,其運行過程的實際動作穩定值也存在著很大差異,在這很大程度上影響了數據中心路保護機制。情況最糟糕時,下游斷路器可能不會動作,而最終導致上游斷路器動作,結果發生大面積負載掉電的情況。
2、操作人員人為操作失誤的問題
超過54%的宕機故障都是人為因素造成的。其中,大部分是由于目前數據中心復雜性極高而又缺乏處理這類復雜系統的專業技術人員等原因造成的。除此之外,針對如此復雜的系統,對人員進行的培訓也遠遠沒有達到所需的水平。再加上這些行業內的人員的高流動率,我們就很容易理解"人為因素"是宕機或可用性降低的首要原因了。
3、如何把UPS與IT設備負載之間的故障點減少至最少
許多負載宕機的故障發生在UPS與IT設備負載之間。過去,用戶通常在UPS以及發電機之間引入冗余設備,但是他們往往容易忽略終端配電一級的單路徑故障點,例如他們在UPS和IT設備負載之間設置多個斷路器,而且UPS和IT負載之間的距離很長。所以希望冗余設施距離負載能夠更近一些,減少UPS和IT設備之間的斷路器數量。
4、減少大面積斷電的故障點
集中式供電優點很多,但它的致命缺陷是一旦UPS系統發生故障,所有設備設備均會停電而宕機;分布式供電雖然解決了大面積業務中斷的問題,但是其不易管理。用戶們當然是希望消除并控制自己的電源系統的故障。
5、UPS對供電系統的諧波干擾問題
UPS在整個系統內部就相當于一個諧波干擾器。無功和諧波電流對供電系統的影響是多方面的,因此是我們不得不的問題之一。
6、用戶內部以及用戶與廠商之間的信息共享問題
由于各種設備安裝的復雜性,故障發生時對故障根源的分析變得非常困難。客戶們普遍希望能夠通過全球統一標準的系統收集數據和比較結果,并且規范校正和處理的措施。因此他們希望同一機構內不同場地的機房能夠使用同樣的設備,不同部門的管理人員能夠相互分享管理經驗及故障處理經驗,也希望設備供應商能夠提供這些技術知識。
數據中心對供電系統的要求越來越高,供電系統的可用性問題也是保障數據中心安全可靠所必須解決的問題之一。我們應當減少故障與失誤,能為數據中實現其可用性的價值。