當前,數據中心業界進行能耗的分配、估計和測量有很多種方式。而在本文中,我們就將與廣大讀者朋友們共同探討進行數據中心功耗測量的原因、功耗的測量情況、數據收集后應當如何處理、并還將為大家介紹當前一些可用的新興技術。
為什么要測量數據中心的功耗?
假設您作為貴公司數據中心經理接到CIO的電話詢問您說:“我們在數據中心的功耗方面做了哪些工作?”您會怎么回答?通常情況下,數據中心經理們并不擔心功耗的問題。畢竟,下午7點以后,企業的其他領域可能在沒有空調的情況下是可以運轉的,但數據中心卻是絕對不行的。如果企業需要額外的基于IT的服務,則需要購買并安裝必要的硬件。這種方法正在迅速改變,因為1)額外的電力資源通常不可用,2)電力成本正在成為運營數據中心的重要成本, 3)當下,越來越多的企業對于綠色環保舉措的采用高度重視,以便被社會認可為優秀的企業,肩負起社會責任,并為遵守各項環保法律法規做好準備。
很顯然,您企業無法對沒有測量的東西實施有效的管理。對于能耗來說尤其如此。因為在這種情況下,單憑經驗法則所進行的估計結果很可能是錯誤的,從而會導致不必要的,有時甚至是相當可觀的成本損耗。被認為只會消耗很少能量的設備所消耗的能量往往可能會很多,即使這些設備只是出于閑置狀態,并沒有執行任何實質的工作任務。
第一步是為企業數據中心當前的功耗定下基準。在理想情況下,這將通過提供有用的歷史統計數據來進行比較。早期的測量和估計可能很粗糙,但隨著時間的推移,數據中心內部和外部的功率部署逐步得到了更好地理解,并且使得測量質量逐步得到改善,因此得以隨著時間的推移而改進。
管理數據中心功耗的方法有很多種,但如果缺乏一些基準測量,就很難知道從哪里開始著手或采取哪些措施能夠產生最大的影響。另外,如果沒有基線測量,則不可能顯示企業數據中心過去對于能源消費水平的管理以及您企業數據中心能耗的改進情況。
效率指標
當下,數據中心業界最受關注的能源效率度量指標顯然是電源使用效率(PUE)。這是數據中心(包括IT設備在內)所消耗的所有能源量與IT設備所消耗的能耗量之比。總能耗量包括照明、冷卻和氣流管理設備以及數據中心內部電力分配單元的能耗量。IT設備部分是執行計算任務的設備。
PUE = 數據中心總設備能耗/IT設備能耗
僅向IT設備供電的數據中心將達到PUE = 1.0,因為分子和分母均為IT設備功率。這顯然不符合現實數據中心的運營情況。即使在數據中心的照明系統全部關閉的情況下,也會消耗相應的電力資源以便提供冷卻和空氣流管理的所需,并且會導致配電效率低下。
而企業平均數據中心效率(CADE)這一指標則考慮到了數據中心設施的能源效率、使用率和服務器利用率。
CADE =(設施效率)x(IT資產效率)
設施效率=向IT設備所提供的能源量/從公共供電公司所獲取的能源量
IT資產效率=所有服務器中央處理器(CPU)的平均利用率(其通常是一個很小的百分比,例如5%),直到實施了虛擬化等效率工作。
在哪里以及如何測量
在數據中心,有多處位置可以測量功率。從最粗略的測量逐步晉級發展到最詳細的測量,首先是在電源進入數據中心的位置進行測量。如果數據中心是一處獨立的結構,并且只是單純的依靠公共電力公司的供電。那么,這一測量值將是PUE計算公式中的總功率數。
但在很多時候,這并不容易。企業數據中心可能僅僅只占某建筑物中的幾層樓層。在這種情況下,應該為數據中心所在樓層或房間單獨安裝電表。如果數據中心不共享電力或建筑物內的相關設施(如冷卻設備)的話,則該電表將記錄總功率數量。如果設施和電力是共享的(在城市數據中心尤其如此),那么數據中心管理人員至少需要估計數據中心的總功耗,其可能來自幾個不同的來源(例如,由電表所測量的進入數據中心的總供電量,加上建筑物冷卻設備所使用的功率的一定百分比)。
經常進行功率測量的下一處位置是不間斷電源(UPS)。如果其只是為IT設備供電,那么可以將此數據用于PUE計算的分母。但是,UPS也可能為機架式制冷設備供電。
測量功率的第三處位置是機架本身,其本身就帶有計量機架配電單元(PDU)的功能。這些測量數據通常被認為代表了整合到機架的IT設備,除非有風扇或機架側制冷單元。
測量功率的第四處位置是機架PDU的各個插座。這些智能PDU通常也會提供融合的機架的功耗測量數據。監測插座層面的功率可確保IT設備功耗可以在PUE計算中識別。通過在各個設備級別提供電源信息,可以采取特定措施來提高效率。
測量功率的第五處位置是在CPU上。這給出了實際執行計算工作所消耗的功率的測量。實際上,這在今天尚未廣泛使用。在采取實際的節能行動措施方面,CPU級別的測量并不是很有用。因為在大多數情況下,數據中心員工可以對整個設備、刀片服務器或其他IT設備的數據進行更改或削減,而不是CPU。測量數據中心功耗的最典型方法是計量機架式PDU和智能機架式PDU,用于監測單個輸出。
如何處理收集的數據
根據企業數據中心所選擇的測量位置和測量方法的不同,可以采取各種不同的提高能效的舉措。如果能夠提供有用的可操作信息的話,我們建議企業數據中心的管理人員們可以對IT設備使用單獨的插座級測量方法。
通過監測機架上的功耗,數據中心管理人員們可以確定其原始功率分配是否合理。通常,在銘牌額定值的基礎上為IT設備分配功率,但這些銘牌額定值通常都很保守。即使使用銘牌功率的一定百分比,例如70%,功率通常也是過度分配的。這意味著IT設備機架的耗電量將超過實際消耗的功率。這種“閑置的功率”可以被部署到其他地方,但是在負載高峰的情況下,如何知道您數據中心的機架不會很容易遭遇電力資源耗盡的情況呢?
定期監測每款設備,并且這一時間間隔越短越好,以確保沒有忽略高峰期。通過單個設備的功耗數據,可以設置機架,使設備功耗模式相互補充,從而可以用相同的功率來支持更多的IT設備。如果機架即將消耗盡分配給它的所有電力資源,并因此有妨礙斷路器的風險,擁有單獨的IT設備功耗數據可讓IT管理人員以合理的方式移除設備,從而將斷路器跳閘的風險降至最低,同時保持合適的裝載量。
例如,通過在其自己的數據中心進行測試,美國Raritan公司確定了簡單的經驗法則的銘牌評級百分比并不起作用。在59臺服務器中,15臺平均功耗為20%或更低,29臺為21%至40%,9臺為41%至60%,4臺為61%至80%,2臺為81%或更多。即使在功耗峰值時,49臺服務器的銘牌評級也低于60%。許多數據中心規劃人員使用銘牌的70%,這意味著許多數據中心有很多閑置的電源。
另一方面,在峰值功耗方面,59臺服務器中有5臺占了銘牌的81%或更多,因此有可能被關閉的風險。就功耗而言,了解單臺設備正在發生什么是很重要的,而不是僅僅掌握一些可能掩蓋高端和低端問題的總體平均值。
環境傳感器及其對功率和冷卻??效率的影響
環境傳感器對提高數據中心的電源效率起著非常重要的作用。冷卻消耗達到30%或更多數據中心的總功率并不罕見。供應商提供入口溫度規格。只要入口溫度在規格范圍內,服務器就能正常工作。這些規格通常遠高于數據中心冷通道中所通常提供的規格。因此,通常可以調高數據中心操作環境的溫度,以降低冷卻設備的功耗。
溫度傳感器應安置在冷氣入口側的機架底部,中部和上部三分之一處。將IT設備冷卻到低于要求的溫度會消耗大量電力資源,而并不會帶來任何有利的影響。由于缺少機架式儀器,數據中心管理人員經常過度冷卻,以確信IT設備不會失效。
可用的新技術介紹
僅僅在一個時間點拍攝單個功耗快照是不夠的。IT設備在凌晨2點可能比上午8點耗能少得多,并且可能在周四下午4點達到峰值功耗。耗電量也可能隨著一年中的季節的變化而變化,例如在12月在線銷售旺季達到高峰。
有些硬件設備可以按用戶定義的時間間隔每隔幾秒鐘執行一次功耗快照拍攝。軟件程序可用于將這些數據點轉換為用電量的計算,其中度量單位為千瓦小時(kWh)。更為先進的工具可以根據能源使用情況計算碳足跡。憑借實際的單個設備的信息,數據中心的工作人員可以了解生成碳排放量最大的單位,因此得以進行按圖索驥的管理。
相關考慮要素
準確性:由于碳排放量的上限規定,信用機制和交易機制被采納,準確性變得重要。假設完美的正弦波(現實世界中很少出現),正負5%偏差的準確度可能是可以接受的,以確定機架在斷路器跳閘之前是否以大約25%的邊際運行。在處理法規和碳信用額以便在交易中進行驗證和交易時,這是不可接受的。對于計費或chargeback退款還不夠準確。
開放和互操作性:許多數據中心都部署了IT管理系統。為了將這樣的系統與功率測量聯系起來,需要尋找與現有設備集成和互操作的開放標準。易用性是一個重要考慮因素,因此電源管理對于已經很忙的IT人員來說不會成為一個耗時的項目。
安全性:電力資源是數據中心的生命線。確保對電源管理系統的訪問是安全的,這一點很重要。查找具有高級別加密功能的系統,如256位高級加密標準(AES)以及設置身份驗證,授權和權限的功能。
結論
我們希望,下一次如果貴公司的CIO打電話給您,并問道:“我們在數據中心的功耗方面做了些什么工作?”時,您能夠參考本文所介紹的內容,并概述一套可行的計劃,通過收集相關數據信息以建立一定的基線。現在,收集數據,并采取諸如PUE計算等數據中心指標的方法,將會幫助您企業數據中心更有效地管理電力和電力成本。進而更有信心的接聽CIO的電話。
關于作者
本文作者Herman Chan是Raritan公司的電力解決方案業務部門的總監,該公司位于美國新澤西州薩默塞特。該業務部門致力于構建數據中心基礎架構管理解決方案,以解決與提高正常運行時間,容量規劃和效率相關的問題Herman在銷售和營銷管理,以及網絡和數據中心基礎設施解決方案的產品管理方面擁有超過15年的經驗。他曾在Fountain Technologies和Panasonic擔任過相關管理職位。赫爾曼擁有羅格斯大學經濟學學位,并獲得ITIL認證。
Greg More是Raritan公司電力解決方案業務部門的高級產品營銷經理。 Greg在技術營銷和產品管理方面擁有超過15年的經驗。他曾在摩托羅拉和Integrated Network Corporation擔任過職務。Greg擁有西北大學凱洛格管理學院的工商管理碩士學位和西北大學工業工程學士學位。