如果不是為測量心率,血壓,心電圖,你可能想不起來每年做回體檢。正如心臟是身體最重要的組成部分一樣,電力系統基礎設施對于數據中心而言,也是重要的組成部分。最保守的估計是電力系統中所有設備總值占整個數據中心資產價值的50-70%,(其中包含變壓器,母線、斷路器、線纜,UPS,配電柜,發電機等。) 對于數據中心運營商而言,但凡運營中由于電力相關問題導致的業務意外中斷的突發情況,無疑是他們心中最大噩夢。 無論從總體擁有成本還是運營支出角度看,數據中心的“心臟”無疑都是其電力系統。
(備注:EKG與ECG通用,到表示心電圖或體表心電圖。)
表1:數據中心資產分配
表2:數據中心運行成本
如果只關注IT服務器管理工具,就像在體檢時只檢查血糖水平,卻不檢查心臟一樣,忽略了數據中心內最重要的組件。那些放在封閉的房間,看起來陳舊的、顏色的陳舊的、灰色的柜體,默默的在那里運行著,保持數據中心持續運行,發出嗡嗡聲響,銷售在外面跟客戶吹噓著自己的IDC運轉速度都快趕上TLC!這就是為什么需要專門能源電力管理系統(EPMS)成為數據中心重要的組成部分。正如建筑物管理系統(BMS)為冷卻和設備機械系統創建的可視化平臺,可以更為直觀的看到系統運行情況,及時發現狀況,同時系統能分析出有價值的電器資產。即使是數據中心基礎設施管理(DCIM)也不完全具備EPMS所具備的功能,在設計上存在一些盲點。
(備注:TLC是閃存一種類型,全稱為Triple-Level CellTLC芯片技術是MLC和TLC技術的延伸,最早期NAND Flash技術架構是SLC(Single-Level Cell),原理是在1個存儲器儲存單元(cell)中存放1位元(bit)的資料,直到MLC(Multi-Level Cell)技術接棒后,架構演進為1個存儲器儲存單元存放2位元。
EPMS :電力能源管理系統軟件借助了計算機、通信設備、計量保護裝置等,為系統的實時數據采集、開關狀態檢測及遠程控制提供了基礎平臺。該電力監控系統可以為企業提供“監控一體化”的整體解決方案,主要包括實時歷史數據庫AcrSpace、工業自動化組態軟件AcrControl、電力自動化軟件AcrNetPower、“軟”控制策略軟件AcrStrategy、通信網關服務器AcrFieldComm、OPC產品、Web門戶工具等,可以廣泛地應用于企業信息化、DCS系統、PLC系統、SCADA系統。
BMS:建筑設備管理系統,是建筑設備自動化系統BAS、火災啟動報警系統FAS、安防自動化系統SAS的集成。它主要具有各子系統之間的協調、全局信息的管理以及全局事件的應急處理能力)
看看EPMS都在哪些方面對數據中心有益:
1、電氣數據可視化
電氣數據一般需要7*24小時在線監測。 看看下面具體例子。
a) 粒數據:來自電能表的數據有助于回答諸如“電路承載多少負載”等操作問題。 如果添加更多的服務器負載,會有風險? 變壓器是否超載?“及時訪問這些數據可以優化負載,從而使資產得到保護,避免帶來的損害。
(備注:粒數據( grain data):基于時效性要求,能完整證明并真實記錄某一事件發生或存在的數據顆粒的最小集合,該集合的數據顆粒可以是多源的;該電子數據一旦產生即不可被修改。粒數據的核心是證明某一事件的發生與存在,所以構成它的數據顆粒都需要具有該事件的屬性,我稱其為粒標簽(grain lebal),粒標簽是在數據生成時確立的,由數據產生各方依據規范在各自系統中自動生成,也可通過某種技術(如區塊鏈)將各自產生的粒標簽統一存儲。依據標簽實現相同標簽的數據關聯(包括橫向與縱向),實現多源數據完整性整合與應用。)
表3 實時電氣運行屏幕
A.操作員屏幕:快速瀏覽設備狀態信息以查看關鍵電源設備,如變壓器,UPS和斷路器等,幫助運營商識別可能會影響正常運營的故障。
B.及時的電氣報警:通過設置適當的報警閾值來識別電路過載;意外的斷路器跳閘;從而幫助數據中心操作人員在輕微問題升級到危機之前進行有效干預。 EPMS帶來更快的報警性能和準確的時間節點,這兩者都有助于確定響應報警條件的有效性。
C. 與維護相關的電氣數據:分析電路負載歷史能夠制定確切的運營維護計劃。 例如,中斷負荷分析以及后續運行分析表明,斷路器的維護周期要比既定周期要短。相反,推遲定期維護也可能同樣是有必要的,因為有時候現有電氣設備負載較輕或者低于預期。這種有針對性的維護計劃可以在大型數據中心推廣,從而節省一定的運營成本。
2. 改善電氣安全流程
在對數據中心運行、維護關鍵電源設備時需要注意安全。 在設備操作現場訪問設備數據時,操作人員操作時需符合NFPA 70E標準要求的電弧閃光安全標準等規范和標準。 通過屏幕顯示的設備運行狀態,可以降低由于人為疏忽導致的問題帶來的災難性的傷害。畢竟,人為錯誤仍然是數據中心業務中斷的主要原因(見圖5)。
電氣斷路器和開關柜通過軟件提供的“虛擬”標簽,可以幫助運營人員及時發現設備哪里出現問題。此外,軟件的安全功能確保只有與電氣設備相關的運維人員才可以訪問軟件。
3.根本原因分析和事件取證
由于全球氣候升溫,電網受到前所未有的壓力,所以停電并不常見。當面對如此系統如此復雜的數據中心時,難免會出錯。要明確發生什么,更重要的是,要確認級聯事件的序列,以此確保事件不再發生。還有就是額外功率電力管理系統功能十分便捷,特別是處理事后危機。 以下是EPMS捕獲事件數據的三方面經驗是非常寶貴:
A.電氣報警:跟蹤電壓波動,例如:電壓下降或升高;斷路器跳閘,這種故障都是由于誤操作導致。無論是改善內部業務還是與市政部門協商電力質量合同,都須先確認是否真有必要去做此事。
B.準確度高的事件順序報告:在電氣高速運轉的世界,接近秒或分鐘是遠遠不夠的, 精確到1到10毫秒分辨率是有必要的,以防止業務意外中斷:繼電器接錯,斷路器故障等。
C.電能質量波形分析:目前電氣系統的不足之處在于,能效的可靠性主要是通過UPS,轉換開關作為保障,這要做的后果是實際上會降低電源質量。 隨著停電的成本持續上漲,采用EPMS可以通過波形分析工具來幫助分析電氣故障,諧波以及其他電氣干擾等。 通過干擾方向檢測工具可以快速隔離干擾,為事故發生后處理節省寶貴時間。
表4 電力波形分析表
4.能源會計和成本分配
對于數據中心運營商而言,保障數據中心的可靠性、正常運營是可以理解的,不過,隨著業務發展,他們也許管理數據中心的能效。數據中心也引入精確度高 的工具對能耗進行測量,從而更有效的為托管客戶提供更為精確的數據。EPMS可通過準確分配凈能源成本(包括峰值需求和功率因子費用的輔助費用)來促進托管計費。 在許多情況下,數據中心通過更準確地計費工具,可向客戶收取占收取費用很大比例的能耗成本。
除了從外計費的IT客戶,許多數據中心的成本核算流程現在都需要在部門或成本中心層面進行內部計費。 EPMS軟件通過大量計算,從而輸出應用所需的數據。
表5意外中斷分析
5.可持續發展和運營指標
管理人員現在希望數據中心人員能夠掌握這些操作指標。 以下是EPMS可以提高可用指標的數量和質量的四個方面:
A.容量管理:通過分析電氣基礎設施中不同來源的電路負載,運營商評估它們是否可以安全地添加在特定區域的IT負載,而不會影響冗余。
B.操作性能:根據適用標準(如Green Grid recommendations)自動計算PUE,可使操作員更為輕松制作各類表格。
運行面板
C.能源報告:能源消費報告在粒度級別的需要驗證的保護措施和采用節能性能符合的標準,如ISO50001。
(備注:ISO 50001能源管理體系全球標準ISO 50001已于2011年6月15日發布。將幫助各種規模的企業了解各個工作流程的基準能源使用量,該標準制定旨在實施降低能耗的行動計劃、實現目標和能源績效指標,并識別、優先處理、和記錄各種能源績效改善機會,從而實現節約。
各種全球性威脅,比如能源短缺、成本上升,以及遏制溫室氣體排放立法的增加,在我國,如“十二五”期間,我國確立了單位GDP能耗下降16%以及單位GDP碳排放強度下將17%的目標,以及《節約能源法》、《可再生能源法》、《循環經濟法》、《清潔生產促進法》、《森林法》、《草原法》等有利于減緩氣候變化的能源立法與環境立法的相繼頒布和實施,都推動了該標準的制定。通過實施該標準,各種規模的企業不僅有潛力實現大幅財務節約,還可以通過聲明其提升可持續發展的承諾,提高他們的聲譽。)
D.可持續發展報告:可持續性不再是董事會上可有可無的想法。 將二氧化碳排放作為數據中心的業務目標和任務,需要一個穩固的計量系統作為依據。
通過EPMS來關注數據中心的電力基礎設施,在這方面做出投資是值得的。單從投資回報率來看,這種投資可以比作“保險責任范圍”內,投資一部分資本換來的是高額的回報。
是的,建筑管理系統當然可以在一定程度上整合電力設備,但BMS并不是完全針對電力系統開發的軟件,BMS在管理機械系統方面的應用無疑是不錯的,但是完全應用在電力方面將會低估數據中心的價值。
不要擔心,與其他關鍵設施系統集成已不再恐怖。 DCIM能越來越多將各種組件集成在一起,建筑管理,數據中心操作和電源管理都在同一個操場上發揮得很好。
確保數據中心的電力系統得到良好的監控和調整 - 您的數據中心需要它的“心臟”在合適的位置。