您企業的數據中心應該有一套成功的基礎設施容量能力方案,以便能夠支持所有的日常運營。
在本文中,相關的業界專家將為我們廣大讀者諸君分析導致您企業數據中心高密度的原因,以及如何就您企業數據中心的重要工作負載所需要的空間、電力和冷卻等進行有效的溝通。此外,文章還將為您推薦關于基礎設施容量能力分析問題的四條指南,以幫助開發一套切實的、能夠滿足您企業未來需求的數據中心戰略。
如何定義數據中心的規模大小、密度?
有大量的指標來衡量數據中心的占地面積、電力和冷卻需求。而數據中心管理者協會AFCOM則認為現在是時候削減這些方面的需求了。
“您會不停的聽到有業內相關從業人員抱怨表示說’我們的數據中心非常密集’或'我們的數據中心規模太小',但這其實并不真正意味著什么,或者他們的抱怨會涉及到任何具體的數據。”AFCOM的總裁湯姆·羅伯茨說。
該協會的數據中心研究所智囊團與數據中心的設計師、運營商和供應商們合作,對數據中心的規模大小和密度等相關術語條款進行了資格認證,提出了相應的數據中心標準。如下,是對其數據中心標準介紹文章的相關摘錄。
AFCOM通過空間計算來描述數據中心的規模大小,并通過測量峰值千瓦(kW)負載來描述數據中心的密度。
達到極致
AFCOM將數據中心密度細分為四類:低密度(達到每機架4千瓦)、中密度(5千瓦到8千瓦)、高密度(8千瓦到15千瓦)和極端密度(平均每臺機架超過16千瓦)。
對于數據中心密度的關注是非常及時的。較之五年前,今天的托管合同會更多的涉及到電力的問題,而彼時的合同談判內容還大多聚焦在數據中心占地空間方面,美國的一家托管空間提供商Infomart Data Centers的總裁 John Sheputis表示說。
服務器整合——隨著虛擬化和處理器的不斷發展演化,數據中心每平方英尺的密度也在不斷增加。所需管理的機柜和電源供應設備越來越少,保持日常運維的各種線纜也在減少——從一個IT運營的角度來看,所有這一切都是相當美好的。但這些趨勢卻改變了對于高密度和低密度的理解,Sheputis表示說。
Cosentry公司是一家總部設在內布拉斯加州奧馬哈的一家托管服務提供商,該公司通過跟蹤其基礎設施每臺機柜的平均功耗來為服務器空間的設計設置基準。 “十年前,每臺機柜的平均功耗大概是700 800瓦。”Cosentry公司數據中心服務副總裁Jason Black表示說。“五年前,平均功耗大概是1.5千瓦。而現在則達到了3千瓦。按照目前的趨勢發展下去,我們預計在未來五年內,將看到平均功耗達到5或6千瓦。”
當Infomart數據中心將其達拉斯的操作運營與俄勒岡州希爾斯伯勒和圣何塞的Fortune數據中心合并,并收購Ashburn獲得了前美國在線公司位于維吉尼亞州Ashburn的數據中心時,親身經歷了這種體驗。
“較之新的數據中心,舊數據中心的能量密度要低兩到三倍。”Sheputis表示,并補充說在很短的時間內,能量密度的標準變化很大。
對比舊的Ashburn設施與達拉斯州的先進設施,這種密度的差異是相當明顯的。在其于2015年再次投產運營前,Ashburn數據中心重新進行了改造,不僅僅只是針對數據中心運營操作空間的改造,同時還包括高密度的操作。
AFCOM計劃匯總類似的跟蹤基線,并通過規范化數據中心規模和密度的術語進行大量的數據比較。
關于數據中心密度的細節問題
雖然AFCOM對于數據中心的總密度進行了類別分類,但在空間規劃過程中仍然存在一些細節問題。
以前,同樣平方英尺的空間占地面積僅僅只承載2千瓦的混合機柜,現在則承載著一排8千瓦的服務器、每臺消耗4千瓦的一組存儲陣列、以及低功率網絡和外設機柜。在數據中心中的一個部分處理大數據的超級計算島(supercomputing island)每臺機架為15千瓦,而其他的每臺機架僅使用3千瓦或每4千瓦。設施規劃不僅僅只是匯總電源和冷卻需求,同時,對于空間占地面積的討論仍然是相當有用的,Black表示說。但最重要的則是:在一處既定的占地空間,到底有多少可用的機架占地空間。因此,AFCOM對數據中心的規模大小進行了分類,從迷您型(可容納多達10臺機架)到兆級(空間超過9000臺機架),結合了密度測量,以生成數據中心功率需求信息。 “每平方英尺的瓦數對于當今的工作負載是一項重要的標準。”Cosentry公司的Black說。
由此,近年來所發展出的:機柜定位單元(Rack location unit)這一概念術語,便是為了幫助估計在一個給定的占地面積的利用率,或估算容量能力。前考慮到了機柜的占地面積和冷熱通道。但并不是每一家IT企業組織均可以通過這個指標來討論他們的數據中心的需求。
“在許多情況下,數據中心物理空間的管理已經拋給了具備專業知識的其他領域的IT人員,如存儲和網絡專業人士。”Black說。“大多數人都只是在數據中心進行部分的優化,并不知道整體性的最佳實踐做法。”
在一處企業內部部署的數據中心,圍繞功率和密度獲得清晰的掌握也許沒有什么大問題。畢竟,每月電費賬單由設施的預算產生,只要持續對數據中心操作運營空間里最熱的機柜實施冷卻,您具體使用何種術語并不重要。但到了今天,企業內部部署的數據中心的設施大都面臨著使用壽命的結束或需要進行重大的更新升級,電力使用效率來自于政府行政部門的審查,故而使得許多企業組織計劃遷移到一處托管設施。突然間,企業組織的IT領導者們需要掌握如何就重要工作負載所需要的數據中心的占地空間、電力和冷卻進行有效的溝通。
AFCOM的意圖是能夠讓數據中心的經理們能夠測量計算空間、設計密度和電流的功率,并清楚其數據中心的運行情況。例如,一處設計為低密度的小型數據中心,目前以52%機架產量在中等密度運行。
借助基礎設施容量規劃避免增長過程中的煩惱
預測未來的數據中心空間,電源和冷卻要求是一個不可能完成的任務,但卻必須做到。這從來都不容易,而隨著云計算的出現,使得基礎設施的容量規劃變得更為困難。
建設、整治、更新、升級或擴大數據中心不僅成本昂貴,而且是具有破壞性和潛在的危險的。
數據中心占地空間始終是很難獲得的,所以您企業肯定不會想要超出您所能證明真實需求的占地空間。這也同樣適用于電源和冷卻:相關的機電設備需要占地空間——有時甚至與計算領域一樣多或更多——并且,對這一部分實施擴展的成本最昂貴。聲稱您需要比您以往任何時候所使用的瓦特數量都多可能是沒有考慮到一個數據中心項目的價格因素,并或將導致失敗的節約措施。而不準確的容量估計最壞的結果可能充其量是相關人員職業生涯的結束,而最好的結果也會對IT基礎設施的性能帶來負擔。
沒有人能100%精確地做到這一點,但借助基礎設施容量能力問題分析指南,來開發切合實際的,可應對未來需求的預測方針。如果您企業采用一種合理的方法來規劃產能的增長,就可以證明這些要求。
圖1、一處數據中心的機柜占據了更多的地面空間,而不僅僅只是其本身的占地面積
IT人員往往傾向于只考慮機柜數量方面的問題,但他們其實更應該考慮數據中心的地板空間建筑面積。一臺機柜到底占據了多少空間?有一些方法能夠回答這個問題,所以企業選擇一種切實有意義的方法,并持續使用該方法。
實際的機柜所占用的具體的數據中心空間面積都有一個特定的寬度和深度,但即使這種情況也正在改變。機柜正變得越來越大,以便能夠適應更高的設備密度,更深的服務器形式因素和多電纜連接。30英尺寬×48英尺深(760毫米×1200毫米)外形尺寸的機柜不再是不尋常的了。
由ASHRAE TC 9.9定義的實際的機柜空間占地面積還包括了機柜周邊的過道空間(參見圖1)。涉及機柜的結構樓面荷載和熱密度及其周圍的區域。如果一款設計要求4英尺(1.2米)的過道兩側安置30英尺×48英尺的機柜,那么,此時的機柜占地面積的測量就應該是2.5英尺×8英尺或20平方英尺(1.83平方米)。您可以單獨計算機柜柜和過道區域,但這種方法可以更容易。
空白空間
總的IT工作領域的空間占地面積應該是機柜的數量乘以機柜的占地面積。為了包含現代配電設備,每行增加另一個大型機柜。
然后考慮配套的冷卻設備和行過道盡頭所需的移動設備,提供服務并符合消防安全規范。主通道加上冷卻設備可以很容易地從機柜占地面積空間增加75%至100%到計算出的地板空間。真正高效的設計需要更少的空間。 相反,糟糕的形狀或充滿柱子的房間會占用更多的空間面積。而借助這些數據,您就不會出現嚴重低估或過度估計的錯誤。對于更高的精度的估計,為新的空間需求提前選擇一種電源和冷卻的方法。然而,若是以估算為目的,選擇不同的方法所帶來的差異并不特別顯著:行內冷卻器就像額外的機柜,但要排除大部分的周邊計算機房空調(CRAC)空間;后門熱交換器增加約6英尺(150毫米)到機柜的深度,從而增加了機柜的占地面積,但消除了最標準的CRAC。
容量能力外包
若要試圖預測有多少機柜的IT容量能力將選擇去托管或租用的站點,或者將被云實例所取代。不妨從貴公司對于外部服務的傾向的一個現實的評估開始。讓貴公司的管理層——包括財務管理——參與到制定估計的過程中來,以便讓企業共享業務方向,并確保對最終產品的支持。
提出如下指導方針問題,以實現一個切實的容量估計:
· 您企業的客戶流失率如何,以及所使用的系統是什么?頻繁改變的設備不太可能部署到異地站點。托管站點會為基礎設施要求的改變收取大量的費用,因此對穩定的運行采取外包更為經濟有效。取決于正在發生變化,云服務可能是更適合選擇,而不是選擇內部硬件。列出您企業的系統,并注意每款系統離開數據中心的可能性。
· 您企業操作運營的風險承受能力如何?操作運營需要是高度安全的且需要規避風險的,故而不太可能考慮云服務的選項。托管網站的備用電源、冷卻和連接可能不如貴公司現有的數據中心可靠。單獨列出您企業的系統列表以便進行風險水平分析。
· 在運營處理大的存儲需求時,無論是存檔或鏡像操作,備份存儲是異地位置的一個很好的備選方案嘛?
本文中,我們使用了實際的能量消耗來描述機柜的密度。實際的功耗要比總的銘牌額定值的要少得多。銘牌額定值可能會誤導數據中心設計人員配置比在現實消耗高40%至60%的電源可用性。請按照以下步驟配置合適的UPS系統。
電源、冷卻和密度
IT基礎設施的空間不包括設備的空間:不間斷電源(UPS)、冷水機組、水泵、主電源中心、發電機等主要設備。作為一個經驗法則,為您的數據中心的不間斷的二級的設施至少多估計50%的總占地面積,為三級操作至少多估計75%,而至少為四級多估計100%。
壓縮——數據中心設備將更多的功能打包進入了更小的外形尺寸——增加了每臺機柜所需要的電力和冷卻量。但其在實際空間需求方面所帶來的差別并不大,因為雖然設備繼續變得更小且更強大,我們總是希望獲得更多。
密度并不是不斷蔓延的。盡管預測的機柜將達到25千瓦到40千瓦,但只有一小部分的數據中心機架超過了8千瓦至10千瓦,大多數仍然是在5千瓦至8千瓦的范圍內。因此,除非您企業是一家高性能計算的研究實體,否則裝滿整整一個機房的35千瓦的機柜是不現實的。而進行電力需求規劃是切實的。如果您企業的機柜配備了計量配電盤,特別是如果您使用的是數據中心基礎設施管理軟件。來記錄每臺機柜隨著時間的推移的功率情況,您就能準確地判斷實際負荷。
表1:使用此圖表來估計數據中心的功率消耗情況。
如果您不確定當前的功率消耗,有幾種方法來進行估計:
1. 閱讀您企業的UPS監控顯示面板。用總的負荷除以機柜的數量來獲得每臺機柜的平均瓦數。如果您企業運行的是2N UPS配置,每臺UPS承載一半的實際負載,所以讀取兩個系統,把它們相加,再除以機柜的總數。同時也需要考慮異常機柜,比如,高利用率的刀片服務器每臺機柜可以運行12千瓦。
2. 看看分支電路板的斷路器評級。斷路器應加載到只有80%的評級一個連續的基礎上。使用圖表1以確定機柜電路的最大容量。如果您企業的機柜是雙線路,具有功率來自兩個不同的面板和斷路器,最大負載只能基于其中之一。
3. 安排一名電工用鉗式儀表來測量每個支路上的實際負荷。這些都是瞬時的測量,而沒有考慮到一天內的波動,但其也有助于估計真實的機柜負載。對于雙線路機柜,從斷路器到每個機柜添加載荷。
4. 整合最高密度機柜以進行空間預測。不必為這個級別而進行整個數據中心的設計,將其劃分為高密度和正常密度的要求,以降低成本和占地面積。為真正的高密度機柜添加25%至地板面積(15千瓦或以上),以考慮額外的功率和冷卻要求。如果您企業利用完全冗余的2N 冷卻系統,另加25%。
設計變革
良好的設計使您企業數據中心能夠添加容量單元到基礎設施,而不會對操作運營帶來影響。這降低了初始資金預算,允許隨著業務的發展而線性的增加容量,并提高了能源效率。
堅持為模塊化、階段化的設計進行成本估算。沒有理由安裝最大預測的UPS和冷卻能力,以支持某一天的操作。這樣會吞噬掉您的預算。
在新的空間開始運行之前,有些東西必須完全安裝。管道和主接線必須到位,否則,當利用率增長時,您在數據中心內部的運行會有相當繁重的工作。在電氣/機械支持區域擴建后的工作可能包括需要一次IT關閉,其會很快毀掉您企業在基礎設施容量能力計劃的任何成功。