云計(jì)算、大數(shù)據(jù)的興起,對(duì)數(shù)據(jù)中心網(wǎng)絡(luò)提出了更高的要求,尤其是AI應(yīng)用的興起,使得越來(lái)越多的GPU加速計(jì)算服務(wù)器在數(shù)據(jù)中心的部署。在這一趨勢(shì)下,數(shù)據(jù)中心的耗能問(wèn)題日益凸顯。為了適應(yīng)網(wǎng)絡(luò)變革的需要,數(shù)據(jù)中心的制冷方式也在發(fā)生革新,液冷正在興起。
能耗挑戰(zhàn)日益嚴(yán)峻
由于數(shù)據(jù)中心能耗的居高不下,特別是我國(guó)數(shù)據(jù)中心行業(yè)發(fā)展比較晚,建設(shè)標(biāo)準(zhǔn)相對(duì)滯后,平均PUE在2.2~3.0之間。高能耗不僅給企業(yè)帶來(lái)沉重負(fù)擔(dān),也給社會(huì)能源造成巨大浪費(fèi)。
隨著各種云計(jì)算大數(shù)據(jù)業(yè)務(wù)的蓬勃發(fā)展,對(duì)底層基礎(chǔ)設(shè)施的性能要求越來(lái)越高。性能的提高直接導(dǎo)致服務(wù)器功耗的不斷增加。特別是作為服務(wù)器關(guān)鍵部件的CPU,隨著性能的提升,功耗增加非常顯著。例如英特爾上一代的Sandy Bridge功耗為135W,最新一代的Skylake功耗達(dá)到了240W。在單機(jī)柜服務(wù)器數(shù)量不變的情況下,整柜的功耗幾乎翻番。可見,這會(huì)對(duì)機(jī)房的散熱帶來(lái)極大的挑戰(zhàn)。
為了節(jié)能,國(guó)外做了很多比較激進(jìn)的嘗試,例如微軟在海底建設(shè)了自給型數(shù)據(jù)中心,F(xiàn)acebook在靠近北極圈的地方建設(shè)數(shù)據(jù)中心等等,希望通過(guò)外部自然條件帶來(lái)數(shù)據(jù)中心PUE的收益。2013年工業(yè)和信息化部發(fā)布《關(guān)于數(shù)據(jù)中心建設(shè)布局的指導(dǎo)意見》,國(guó)內(nèi)的大型數(shù)據(jù)中心也開始在氣候適宜、能源充足的地區(qū)建設(shè),例如內(nèi)蒙古、山西北部等,對(duì)數(shù)據(jù)中心的節(jié)能帶來(lái)了一定的收益,但是無(wú)法從根本上滿足服務(wù)器大功耗高密度部署帶來(lái)的散熱需求。
液冷成為“新寵”
為了解決數(shù)據(jù)中心的高效散熱問(wèn)題,產(chǎn)業(yè)界對(duì)此做了大量的嘗試。利用自然冷源進(jìn)行Free Cooling是促使PUE降低的一種好方法。此外,產(chǎn)業(yè)界在液冷方面也開始進(jìn)行嘗試,目前來(lái)看液冷主要有冷板、浸沒和噴淋三種技術(shù)路線。
冷板液冷是將冷卻水從特制的注水口流入,經(jīng)過(guò)密閉的散熱管流進(jìn)主機(jī),帶走CPU、內(nèi)存和硬盤等部件的熱量后再流出。這種散熱方式同風(fēng)冷相比,密度更高、更節(jié)能、防噪音效果更好。由于液冷技術(shù)不需要昂貴的水冷機(jī)組,所以采用這種技術(shù)后,在減少總體擁有成本的同時(shí),顯著提升了數(shù)據(jù)中心的能源利用效率。
浸沒液冷是最近幾年備受業(yè)界關(guān)注的新型散熱技術(shù),尤其自SC14起連續(xù)多年的全球超級(jí)計(jì)算大會(huì)上,來(lái)自國(guó)內(nèi)外的多家服務(wù)器企業(yè)均展示了在浸沒液冷散熱上的產(chǎn)品,大幅提高了業(yè)界對(duì)液冷的關(guān)注度。但遺憾的是,受限于技術(shù)實(shí)現(xiàn)的難度,目前參與浸沒液冷服務(wù)器設(shè)計(jì)的企業(yè),對(duì)浸沒液冷的應(yīng)用也僅局限于單機(jī)測(cè)試、單機(jī)展示階段,從公開的信息看,并無(wú)服務(wù)器集群部署先例。浸沒相對(duì)于冷板來(lái)看,由于是更加直接的熱交換,散熱效率更高,但也會(huì)帶來(lái)很多的技術(shù)挑戰(zhàn)。
此外,噴淋式液冷是指對(duì)IT設(shè)備進(jìn)行改造,部署相應(yīng)的噴淋器件,在設(shè)備運(yùn)行時(shí),有針對(duì)性地對(duì)發(fā)熱過(guò)高器件進(jìn)行冷卻的一種液冷實(shí)現(xiàn)方式。這種方式的特點(diǎn)是不需要對(duì)機(jī)房基礎(chǔ)設(shè)施做太大的改動(dòng),只需對(duì)服務(wù)器進(jìn)行少量的改造就能實(shí)現(xiàn)較好的冷卻性能。噴淋式液冷屬于接觸式液冷,其穩(wěn)定可靠性還有待進(jìn)一步的驗(yàn)證。
還需邁過(guò)幾道坎
由于尚處于發(fā)展初期,液冷技術(shù)還面臨一些問(wèn)題和挑戰(zhàn)。
首先是原有機(jī)房適配的問(wèn)題。傳統(tǒng)機(jī)房的承重、管路等設(shè)計(jì)均采用傳統(tǒng)機(jī)柜的規(guī)格。而在液冷方式下,由于制冷方式的轉(zhuǎn)變,對(duì)于部署環(huán)境將會(huì)有很大的不同。這會(huì)帶來(lái)部署成本、部署難度等方面的問(wèn)題。
其次,對(duì)于浸沒式和噴淋式等接觸式液冷,液體和IT部件之間的兼容性是我們需要考慮的一個(gè)問(wèn)題。IT部件長(zhǎng)期浸泡在相關(guān)液體中,是否會(huì)對(duì)其功能和性能帶來(lái)影響是我們需要關(guān)注和驗(yàn)證的一個(gè)重要方面。
再次,液冷的行業(yè)標(biāo)準(zhǔn)缺失將會(huì)阻礙技術(shù)的發(fā)展。目前各企業(yè)關(guān)于液冷的研發(fā)處于各自為政野蠻生長(zhǎng)的狀態(tài),亟須相關(guān)的行業(yè)標(biāo)準(zhǔn)組織對(duì)液冷的標(biāo)準(zhǔn)化進(jìn)行管理。對(duì)液體、供配電、管控、安防和運(yùn)維等各個(gè)方面制訂明確的技術(shù)要求,促進(jìn)液冷技術(shù)的良性發(fā)展。
最后,我國(guó)各大服務(wù)器廠商基本都在進(jìn)行液冷服務(wù)器的研發(fā),如果國(guó)家能有相關(guān)專項(xiàng)進(jìn)行更多的支持,將會(huì)更好地推動(dòng)液冷國(guó)產(chǎn)化的發(fā)展,拉近我國(guó)與國(guó)際先進(jìn)水平的距離,最終實(shí)現(xiàn)液冷由“中國(guó)制造”向“中國(guó)智造”轉(zhuǎn)變。
結(jié)語(yǔ)
放眼未來(lái),浸沒液冷服務(wù)器在高主頻計(jì)算領(lǐng)域?qū)l(fā)揮重要價(jià)值,極大地節(jié)約能源,最終實(shí)現(xiàn)綠色計(jì)算。液冷技術(shù)的興起和普及,將引發(fā)數(shù)據(jù)中心和服務(wù)器的整個(gè)產(chǎn)業(yè)鏈的重構(gòu)。