隨著數(shù)據(jù)中心的深入發(fā)展,數(shù)據(jù)中心的服務(wù)器耗能問(wèn)題也成為企業(yè)關(guān)注的焦點(diǎn),數(shù)據(jù)中心中的某些服務(wù)器機(jī)架每年能耗可達(dá)800千瓦/機(jī)架,而且還會(huì)不斷增加。未來(lái)會(huì)怎樣發(fā)展?
數(shù)據(jù)中心密度在過(guò)去曾是世紀(jì)末日一般的話題,這也許可以解釋為什么許多IT組織仍然徘徊于4~6千瓦/機(jī)架的能耗密度。但電源與散熱管理已經(jīng)準(zhǔn)備向著大于10千瓦的服務(wù)器機(jī)架進(jìn)行設(shè)計(jì)。
暴漲的處理器核心數(shù)與機(jī)架級(jí)刀片服務(wù)器設(shè)計(jì)讓機(jī)房空調(diào)(CRAC)和電力成本增加似乎是無(wú)法避免的。但高密度并不會(huì)像設(shè)計(jì)師擔(dān)心的那樣殺死服務(wù)器。虛擬化、高效節(jié)能硬件,主動(dòng)冷卻抑制與更高的可接受運(yùn)營(yíng)溫度協(xié)同配合,將延緩并減少熱能消耗。
發(fā)熱是多大的問(wèn)題?
與為每個(gè)工作負(fù)載配置一臺(tái)服務(wù)器不同,一臺(tái)中等配置的服務(wù)器,配合虛擬化管理程序可以支持10、20甚至更多工作負(fù)載。設(shè)施的機(jī)架空間可能因各種負(fù)載被虛擬化后而空閑出來(lái)。
同時(shí),芯片由更高密度的晶體管級(jí)制造工藝以及更低時(shí)鐘速打造而成,因此設(shè)備更新時(shí),處理器核心數(shù)的螺旋上升幾乎不會(huì)影響機(jī)架的能量消耗。
縮小規(guī)模,數(shù)據(jù)中心內(nèi)已經(jīng)有了更多能充分利用的服務(wù)器,因此需要的機(jī)架也減少了,這已經(jīng)改變了我們?nèi)绾螒?yīng)用冷卻的方式。與冷卻整個(gè)數(shù)據(jù)中心不同,利用宏觀的空氣處理策略,如熱/冷空氣通道實(shí)現(xiàn)空間中空氣對(duì)流,運(yùn)營(yíng)商實(shí)施抑制戰(zhàn)略,將經(jīng)營(yíng)面積縮小在幾個(gè)更小的空間,甚至一些機(jī)架中。利用行內(nèi)或機(jī)架內(nèi)部冷卻系統(tǒng)來(lái)處理這些發(fā)熱,甚至可以關(guān)掉機(jī)房空調(diào)(CRAC)。
此外,美國(guó)采暖、制冷與空調(diào)工程師學(xué)會(huì)(ASHRAE)組織亦建議提升有效服務(wù)器進(jìn)風(fēng)口溫度到80甚至90華氏度。
隨著這些能源管理的發(fā)展,不大可能出現(xiàn)熱點(diǎn)與冷卻不足的情況,通常來(lái)說(shuō)都是設(shè)計(jì)不當(dāng)或不良的設(shè)施改造造成的。
熱點(diǎn)與其他冷卻問(wèn)題
即使使用最好的抑制策略與高效率冷卻系統(tǒng),機(jī)架中的服務(wù)器熱點(diǎn)任然會(huì)因?yàn)橛?jì)算設(shè)備次優(yōu)選擇或放置而產(chǎn)生。
意外的障礙物或空氣流路偶然變化可能產(chǎn)生熱量。舉例來(lái)說(shuō),拆下服務(wù)器機(jī)架的護(hù)板,讓空氣流入機(jī)架計(jì)劃外的位置,會(huì)削弱流動(dòng)到其他服務(wù)器的空氣,增加出口溫度。
大幅度增加服務(wù)器能耗,同樣會(huì)引起散熱問(wèn)題。例如,用高級(jí)刀片服務(wù)器系統(tǒng)替換幾臺(tái)1U服務(wù)器,會(huì)極大提高機(jī)架的能源開(kāi)銷(xiāo),并且空氣流量不足會(huì)直接影響到刀片機(jī)的所有模塊組件。如果冷卻系統(tǒng)不是為這樣的服務(wù)器而設(shè)計(jì),很可能經(jīng)常出現(xiàn)熱點(diǎn)。
在增加服務(wù)區(qū)機(jī)架密度時(shí),運(yùn)營(yíng)組織需要考慮投資數(shù)據(jù)中心基礎(chǔ)設(shè)施管理和其他系統(tǒng)管理工具,收集來(lái)自機(jī)架內(nèi)熱傳感器所提供的數(shù)據(jù)并生成報(bào)告。它們可以發(fā)現(xiàn)超過(guò)發(fā)熱限制的情況并采取必要措施,如通知技術(shù)人員,自動(dòng)調(diào)用工作負(fù)載遷移或關(guān)閉系統(tǒng),以防止設(shè)施過(guò)早失效。
當(dāng)服務(wù)器機(jī)架規(guī)劃產(chǎn)生熱點(diǎn)時(shí),IT團(tuán)隊(duì)可以重新分配硬件。與填充單個(gè)機(jī)架不同,若空間允許,移動(dòng)一半或一、二架設(shè)備到其他機(jī)架上,或關(guān)閉過(guò)熱的系統(tǒng)。
如果空間不足以進(jìn)行重新設(shè)計(jì),加入一些可移動(dòng)、自帶空調(diào)并可在數(shù)據(jù)中心內(nèi)使用的冷卻設(shè)備。如果機(jī)架使用緊湊型行內(nèi)或機(jī)架內(nèi)冷卻單元,設(shè)置溫度點(diǎn)可以比打開(kāi)密閉單元,增加冷卻設(shè)備更有效的實(shí)現(xiàn)冷卻效果。
長(zhǎng)期緩解策略
從長(zhǎng)遠(yuǎn)來(lái)看,突破性的技術(shù)能夠幫助熱量管理。
水冷式機(jī)架可以通機(jī)柜門(mén)或其他路徑傳輸冷卻水。水冷式機(jī)架能能夠解決大部分發(fā)熱問(wèn)題——尤其當(dāng)只靠低溫空氣和高溫空氣對(duì)流散熱不起作用時(shí)。
中浸沒(méi)式冷卻技術(shù)可以將服務(wù)器浸入充滿像礦物油,卻非導(dǎo)電、非腐蝕性冷卻物質(zhì)的浴缸中。這種技術(shù)有望實(shí)現(xiàn)高效率、幾乎沒(méi)有噪聲以及接近零損耗的熱傳輸。
D1Net評(píng)論:
綜上所述,這些熱門(mén)技術(shù)選項(xiàng)更適合于新數(shù)據(jù)中心架構(gòu),而不是普通的技術(shù)周期更新。對(duì)于企業(yè)而言,如何讓密集服務(wù)器機(jī)架冷卻下來(lái),需要選擇合適的技術(shù),采用長(zhǎng)期緩解策略只能治標(biāo)不治本,需要找到根治之法。