遵循如下指南來擴展數據中心可用性,可以避免空間浪費,甚至還可以避免容量吃緊的問題。
這幾乎是個不可能完成的任務,但依舊需要有人去做:預測未來的數據中心空間、電力和冷卻需求。這個任務十分艱巨,而云計算的出現讓基礎設施規劃變得更加困難。
數據中心的建造十分昂貴,而整治、升級或擴展都是破壞性的,存有潛在危險。
空間始終是非常難得的資源,所以不要索取比實際使用還多的空間。這同樣適用于供電和冷卻:相關電力設施也需要空間——有時候會比計算面積還要更多——而且也是擴張中最昂貴的部分。如果預估需要的能源比實際所能用的還要多得多,可能會導致數據中心項目失敗或者成本節約措施問題。對能力的錯誤評估最壞可能導致職業生涯結束,并成為IT基礎設施性能的負擔。
沒人可以做到100%準確,但也有一些指南可用于分析基礎設施能力問題,以及未來可能的發展趨勢,可以對數據中心能力有相對可靠的估計。如果采用合理的方法來提高產能,就可以證明這些要求。
IT 地面空間
圖1 數據中心機柜需要的地面空間大于其本身占用的空間
IT工程師傾向于通過機柜數量來估算占用空間,但實際上需要考慮每個機柜實際占用的空間。一個機柜真正會需要占用多少面積?有很多方法來回答這個問題,所以選擇其中一種方式來使用,并統一采用該規則。
機柜的實際占用建筑面積是機柜的實際長度乘以深度,但目前這種情況也在改變。機柜正變得越來越大以適應更高的設備密度,更深的服務器外形和更多的電纜連接。寬30",深48"(760*1,200mm)的機柜尺寸已十分普遍。
實際的機柜占用空間,根據ASHRAE TC 9.9定義,同樣還包括了機柜周邊的過道空間(見圖1)。結構樓層負荷以及機柜內部與周圍的熱密度。如果設計安置一個30"x 48"的機柜,需要4'(1.2米)的過道,機柜占用的空間尺寸為2.5' x 8'或20平房英尺(1.83平方米)。你也可以單獨計算機柜和過道區域的面積,但這種方法會更容易些。
機房場地
IT總工作面積等于機柜總數乘以機柜占地面積。如果要引入現代化的配電設備,還需要在每行額外增加一個大柜子。
計算用于配套的冷卻設備,預留在行底的用于移動設備的額外空間,提供符合消防安全規范要求的服務。主要通道冷卻可以輕松在機柜占用的場地空間基礎上又額外增加75%至100%的空間。真正有效率的設計可能會需要更少的空間。相反,不良的形狀和柱狀填充房間會占用更多平方英尺的面積。盡管如此,有了這些主要數據,你應該不會嚴重低估或者高估需要的場地面積。
若要提高精度,需要提前為機房選擇更先進的電力與冷卻方案。即使是出于預估目的,不同選項的差異也并不顯著:行冷卻器就如附加機柜,應該排除最外圍機房空調機的空間(CRAC);后門熱交換器大約會增加6"(150毫米)的機柜深度,增加了機柜足跡,但幾乎可以減少大部分的CRAC。
容量外包
想要預測IT能力需要多少機柜,可以聯系主機托管或者代理運維的站點,或考慮用云實例取代。可從評估外包服務可行性開始,分析公司的服務外包規劃。擁有管理,財務管理,參與制定共享業務方向并確保最終產品支持。
在評估時詢問這些指導方針問題:
在不同系統的用戶流失率分別是怎樣的?經常變更的設備是基本不能中斷的。托管站點需要收取大量金錢來支付基礎設施費用,所以穩定的運營會比外包更經濟。根據正在發生的變化,云服務器可能會比自己運維硬件更容易。列出你的系統,并分別注明各個系統離開數據中心的可能性。
你的運營風險承受能力怎樣?具有高度安全與規避風險的需求不太可能考慮云計算選項。托管站點可能比你現有數據中心還不可靠,可能存在備用電源、冷卻與連通性問題。分析系統的風險等級,對系統進行分級。
在需要大規模存儲的運維,無論歸檔或是鏡像操作,備份存儲是否是個好的場外候選方案?
能源問題
本文采用實際的能量消耗來描述機柜密度。實際功耗遠比銘牌額定值總量少得多。額定數值會導致數據中心設計時預留高出實際40%至60%的電力情況。請參考一下步驟選擇適合企業規模的UPS系統。
能耗、冷卻與密度
IT基礎設施空間并沒有包括設施的基礎設施:不間斷電源(UPS),水冷機組、水泵、主配電中心,發電機等中央設備。根據經驗法則,需要額外準備至少50%總體數據中心的面積,根據Uptime Institute Tier II facility要求,而Tier III要求為75%,Tier IV要求至少100%。
壓縮——數據中心設備越來越將更多能量裝入更小尺寸的設備中——增加了每個機柜所需的電力和散熱量。但這對實際的空間要求并沒有太大影響,雖然設備變得更小也更強勁,我們需要的仍會越來越多。
根據實際情況規劃能源。如果機柜都配置了計量配電盤,若還有使用數據中心基礎設施管理軟件來統計每個機柜的實際能耗,就可以準確判斷出實際功耗負載。
密度并不是大問題。雖然預測為每機柜25-40kw,但數據中心內實際上只有小部分機柜超過8-10kw,而大部分任然在5-8kw范圍。所以除非你正在運行高性能計算研究實例,整個機房跑滿35kw滿負荷的機柜是幾乎不可能發生的。
圖2.使用本圖表來估算數據中心的電力消耗。
如果你無法確定當前的功率消耗,有三種方法來評估:
閱讀UPS顯示器面板。將總負載瓦特數除以機柜總數,可以獲得每機柜平均瓦特數。如果你運行著2N UPS配置,每個UPS實際只承擔了一半的負載,所以需要讀取兩個系統,把它們相加之后再除以機柜數。同樣還需要計算非正常機柜的功耗,比如高利用率的刀片式服務器可能以每機柜12千瓦的功率運作。
查看分支電路板的斷路器額定值。斷路器應該在連續的基礎上,只加載到總量的80%。使用圖1來判斷機柜電路的最大容量。如果機柜是雙電路,能源來自兩個不同的面板和斷路器,最大負載只基于其中一個。
使用鉗式儀表來測量每個分支電路上的實際負載。這些都是瞬時測量,不會影響當天的波動,但有主意估計真正的機柜負載。對于雙路機柜,需要將每個斷路器的負載求和。
捆版高密度機柜群組來整體預測空間。與其從整個數據中心水平上來設計,不如將其分割為高密度和正常密度需求,以此減少成本和空間。增加25%的面積用于真正的高密度機柜(15千瓦以上),考慮附加的功率和冷卻需求。如果你想使用全冗余2N冷卻系統,可以再增加額外25%面積。
變更設計
好的設計可以讓擴充容量單元但不影響基礎設施的運轉。這樣可以降低初期資金的投入,而且能在業務增加時靈活添加,最終實現高利用率。
堅持模塊化的成本估算戰略。沒有理由在業務上線的第一天,就安裝預測的最大規模UPS與冷卻系統。否則會浪費大量的支出。
一些事情必須在新空間開始建造前完全安裝好。管道和主配線必須有,否則當數據中心不斷增長時,就會需要處理繁重的數據中心內部工作。后期在電器/機械支撐方面的擴展工作可能要求IT關機,這樣就直接否定了你在基礎設施規劃上的所有功績。