摘要:在數(shù)據(jù)中心能效評(píng)估領(lǐng)域,PUE(Power Usage Effectiveness)一直是數(shù)據(jù)中心的效率和綠色節(jié)能減排的重要衡量指標(biāo)。在文中,通過研究和最佳實(shí)踐來探索更準(zhǔn)確衡量數(shù)據(jù)中心的方法和標(biāo)準(zhǔn),并希望通過這樣的探索,讓整個(gè)數(shù)據(jù)中心行業(yè)能夠?qū)π视懈逦鼫?zhǔn)確的認(rèn)識(shí),進(jìn)而推動(dòng)整個(gè)數(shù)據(jù)中心行業(yè)效率的提升。
一、關(guān)于PUE
在數(shù)據(jù)中心能效評(píng)估領(lǐng)域,PUE(Power Usage Effectiveness)一直是數(shù)據(jù)中心的效率和綠色節(jié)能減排的重要衡量指標(biāo)。在文中,通過研究和最佳實(shí)踐來探索更準(zhǔn)確衡量數(shù)據(jù)中心的方法和標(biāo)準(zhǔn),并希望通過這樣的探索,讓整個(gè)數(shù)據(jù)中心行業(yè)能夠?qū)π视懈逦鼫?zhǔn)確的認(rèn)識(shí),進(jìn)而推動(dòng)整個(gè)數(shù)據(jù)中心行業(yè)效率的提升。
二、PUE的歷史,發(fā)展和存在的問題
PUE是由Christian Belady最早提出來的,客觀上來看,在PUE這個(gè)名詞誕生之前,在整個(gè)數(shù)據(jù)中心行業(yè),并沒有一個(gè)標(biāo)準(zhǔn),無論這個(gè)標(biāo)準(zhǔn)或者衡量尺度是否精確,PUE給數(shù)據(jù)中心行業(yè)帶來了一股清涼的綠色之風(fēng),讓整個(gè)數(shù)據(jù)中心行業(yè)都關(guān)注節(jié)能,PUE所帶來的影響和深遠(yuǎn)意義是毫無質(zhì)疑的。然而,關(guān)于PUE,在實(shí)際工作中,也發(fā)現(xiàn)存在了一些問題和容易混淆的地方。
首先,從定義開始,PUE = Total Facility Power / IT EquipmentPower .什么是total facility power?首先,舉個(gè)案例:大概3年前,在對(duì)行業(yè)中的數(shù)據(jù)中心PUE指標(biāo)做調(diào)查的時(shí)候,在和一個(gè)上海的數(shù)據(jù)中心用戶交流中,該數(shù)據(jù)中心用戶自己計(jì)算的PUE是1.8,這個(gè)數(shù)字是在客戶的新數(shù)據(jù)中心運(yùn)行了一年多以后,負(fù)載率已經(jīng)超過了80%,雖然沒有完全滿載負(fù)荷。其實(shí),這樣的數(shù)據(jù)中心的數(shù)據(jù)已經(jīng)很難得了,因?yàn)橹袊臄?shù)據(jù)中心最缺乏的就是基準(zhǔn)點(diǎn)和參照點(diǎn)(benchmark),在2-3年之前,沒有太多的數(shù)據(jù)可以追蹤,記錄和保存,也很難以進(jìn)行計(jì)算和比對(duì)。而根據(jù)客戶提供的電費(fèi)賬單和RPP(電源列頭柜)統(tǒng)計(jì)的機(jī)柜服務(wù)器消耗的電力數(shù)據(jù),在進(jìn)行比對(duì)后,發(fā)現(xiàn)計(jì)算出來的結(jié)果和這個(gè)PUE=1.8存在偏差,計(jì)算結(jié)果是PUE=2.0.這是為什么?后來發(fā)現(xiàn)二者的計(jì)算方法的主要分歧在于對(duì)于市電引入的衡量點(diǎn)不一樣,該數(shù)據(jù)中心用戶用的是380V低壓側(cè)作為總電源輸入測量點(diǎn),而PUE=2.0的測量點(diǎn)在10KV中壓側(cè)。這樣的案例很多,因?yàn)椋缙诮ㄔO(shè)的數(shù)據(jù)中心,相對(duì)于現(xiàn)在規(guī)劃,設(shè)計(jì)和建設(shè)的數(shù)據(jù)中心而言,電力容量都比較小,基本在380V,而最近幾年建設(shè)的數(shù)據(jù)中心,通常容量增大,相當(dāng)一部分客戶是10KV引入,并且10KV的引入完全是為數(shù)據(jù)中心服務(wù)的,不和商業(yè)建筑混用。這二者之間的最大差距在于電力傳輸中的損耗,即從10KV降壓到380V之間的損耗。基于380V引入的數(shù)據(jù)中心的衡量點(diǎn)是在380V低壓,而現(xiàn)在的大部分案例是基于10KV側(cè)的。但是對(duì)于該公式而言,并沒有定義該從哪個(gè)點(diǎn)進(jìn)行測量。同時(shí),也一些新的技術(shù)的采用,如三聯(lián)供技術(shù),LNG冷源的應(yīng)用,而這些并不能用total facility power來準(zhǔn)確衡量。
集裝箱數(shù)據(jù)中心的PUE值:不難從集裝箱式數(shù)據(jù)中心生產(chǎn)廠家中拿到PUE的指標(biāo),該指標(biāo)通常很吸引人,但是如果仔細(xì)的思索一下,去探討一下該值的衡量點(diǎn),也會(huì)發(fā)現(xiàn)類似于第一個(gè)案例中所發(fā)現(xiàn)的問題,因?yàn)榧b箱數(shù)據(jù)中心的電力引入是380V,而不是10KV,有的案例中,你還會(huì)發(fā)現(xiàn),關(guān)于集裝箱數(shù)據(jù)中心空調(diào)制冷被排除在公式之外,或者被包含在IT equipment power中,用經(jīng)常說的一句話來說“看上去很美”(備注:本文并不是針對(duì)集裝箱數(shù)據(jù)中心的PUE進(jìn)行質(zhì)疑,關(guān)于集裝箱數(shù)據(jù)中心的未來在中國,可以從另外的一篇文章中有所論述,這里只是用來說明對(duì)PUE的公式的理解和存在的偏差)
服務(wù)器層面的損耗:在現(xiàn)在的公式中,服務(wù)器本身的功耗,如散熱風(fēng)扇和電源轉(zhuǎn)換中的電力損失(通常是指從交流220V到直流12V)被計(jì)算到IT equipment power中,但是隨著服務(wù)器廠商和芯片廠商對(duì)于服務(wù)器節(jié)能的最新設(shè)計(jì),已經(jīng)有了一些全新的設(shè)計(jì),諸如針對(duì)高壓直流的定制服務(wù)器,如在一個(gè)機(jī)柜內(nèi),將原本安裝在單臺(tái)服務(wù)器的風(fēng)扇從服務(wù)器中分離出來(風(fēng)扇是12V直流供應(yīng)),而在整個(gè)機(jī)柜的背部,采用交流機(jī)柜大風(fēng)扇替代。還可以看到,有些案例,將機(jī)柜內(nèi)的多個(gè)單臺(tái)服務(wù)器的電源用集中的、基于機(jī)柜作為單位的電源進(jìn)行替代。在這些案例中發(fā)現(xiàn),如果依然采用該計(jì)算方法的時(shí)候,雖然這些技術(shù)的改進(jìn)和創(chuàng)新,都是針對(duì)節(jié)能設(shè)計(jì)的,并且的確達(dá)到了節(jié)能的效果,但是當(dāng)計(jì)算PUE的時(shí)候,會(huì)發(fā)現(xiàn)PUE不但沒有降低,而且升高了,因?yàn)榘扬L(fēng)扇,電源等從IT equipment power中剝離出來,就像UPS的損耗一樣來看待。當(dāng)人們興致勃勃的看到創(chuàng)新的節(jié)能設(shè)計(jì)被采用,而PUE值不但不降低,而且升高的時(shí)候,大家都迷惑了,意識(shí)到單純用PUE來作為衡量指標(biāo)的時(shí)候,是存在一些不足和缺陷的。
以上提出的問題只是部分內(nèi)容,事實(shí)上,還存在一些其他問題,篇幅所限,不能完全展開。
三、國內(nèi)外行業(yè)專家和用戶的部分觀點(diǎn)
針對(duì)PUE存在的問題,美國亞馬遜的Amazon WebService的VP James Hamilton提出tPUe來作為衡量數(shù)據(jù)中心效率的觀點(diǎn)。
tPUE =Total Facility Power / Productive IT Equipment Power
關(guān)于Total facility power:
數(shù)據(jù)中心最常用的是10KV,即電氣行業(yè)中所說的中壓,在中國,雖然從電網(wǎng)的結(jié)構(gòu)上來看,可以從35KV直接降壓到380V,但根據(jù)數(shù)據(jù)中心常用的架構(gòu)和最佳實(shí)踐,這不是一個(gè)最佳的技術(shù)方案,而在全國范圍內(nèi)而言,除個(gè)別新的地區(qū)采用20KV的技術(shù)外,10KV到用戶是最常用的一種技術(shù)解決方案,并且,中壓柴油發(fā)電機(jī)和中壓UPS技術(shù)的引入都是基于10KV這個(gè)等級(jí)的,因此,這里total facility power可以理解為10KV,而通常即使涉及到10KV是否專供數(shù)據(jù)中心還是混用,在今天數(shù)據(jù)中心的電氣設(shè)計(jì)中,在碰到這種情況下,也是按照變壓器進(jìn)行分離和隔離的,因此,10KV來衡量total facility power是可實(shí)現(xiàn)的,也是完全可以計(jì)算清楚和準(zhǔn)確的,不存在異議和混淆。而從國家電網(wǎng)(或南方電網(wǎng))的計(jì)費(fèi)方式來看,對(duì)于工業(yè)或者商業(yè)而言,對(duì)于10KV都有一個(gè)專用的計(jì)費(fèi)標(biāo)準(zhǔn),對(duì)于衡量其他指標(biāo)等,也是比較清楚的。
關(guān)于Productive ITEquipment Power:
這里指的是,服務(wù)器中真正用于計(jì)算部分的電力消耗,服務(wù)器本身的散熱風(fēng)扇,電源損耗被剝離,該部分也借鑒了ServerPUE的一個(gè)概念和說法,即基于服務(wù)器真正用于計(jì)算的那部分功耗。
在實(shí)際工作中不難發(fā)現(xiàn),即使對(duì)于同樣架構(gòu),同樣配置,同樣CPU利用率和負(fù)載情況下,不同生產(chǎn)廠家的服務(wù)器的耗電指標(biāo)也不盡相同,甚至差距很大,而在傳統(tǒng)的PUE算法和公式中,并沒有體現(xiàn)出諸如高溫服務(wù)器,高效服務(wù)器電源和服務(wù)器本身的節(jié)能技術(shù)帶來的影響,通過剝離該部分,讓用戶能更清楚準(zhǔn)確的看到不僅僅要關(guān)注諸如UPS,空調(diào),照明等系統(tǒng)的節(jié)能,也要關(guān)注服務(wù)器設(shè)計(jì)上的節(jié)能,進(jìn)而推動(dòng)整個(gè)芯片設(shè)計(jì),服務(wù)器設(shè)計(jì)和制造行業(yè)的節(jié)能技術(shù)的推廣和應(yīng)用,進(jìn)而真正全面達(dá)到用戶和消費(fèi)者的關(guān)注和期望。
四、PUE的創(chuàng)始人對(duì)PUE的反思和新的思考
對(duì)于PUE,可以看到Christian Belady也正在試圖對(duì)PUE進(jìn)行修訂,即DCP = Useful Work / Total FacilityPower,其目的是希望能看到真正有用的工作或者計(jì)算被衡量。同時(shí),綠色網(wǎng)格組織也陸續(xù)出了其他衡量指標(biāo),諸如WUE等。
五、本文的觀點(diǎn),探索和最佳實(shí)踐
固然useful work的出發(fā)點(diǎn)是好的,但是幾乎很難衡量和測量,這可能也是制約該公式?jīng)]有被行業(yè)中大量采用的重要原因之一,同時(shí),無論是出于各種原因,useful work的定義也存在一些偏差,容易引起歧義。
實(shí)際工作中,發(fā)現(xiàn)存在這樣的金字塔模型。雖然里面的數(shù)據(jù)在不同情況下,存在著偏差,不能完全放之四海而皆準(zhǔn),但其邏輯關(guān)系是正確的,只是數(shù)據(jù)和數(shù)字在不同場景下是不同的,甚至差距很大。
同時(shí),服務(wù)器的發(fā)展,路線圖和技術(shù)細(xì)節(jié),包括服務(wù)器的能耗等,發(fā)現(xiàn)了類似下圖的邏輯關(guān)系。
備注:上圖僅僅是一個(gè)參考模型,實(shí)際情況,由于配置不同,應(yīng)用不同等各種因素的影響,存在著偏差。
通過研究和行業(yè)專家的研討,和原廠商的技術(shù)交流和聯(lián)合實(shí)驗(yàn)室等活動(dòng)中,希望能夠更精確的找到衡量數(shù)據(jù)中心的效率,尤其是適應(yīng)云計(jì)算的云計(jì)算數(shù)據(jù)中心。并且這些研究對(duì)于高溫服務(wù)器,定制化服務(wù)器,共用服務(wù)器散熱設(shè)計(jì)的基于機(jī)柜為計(jì)算單元的服務(wù)器,高壓直流服務(wù)器提供更準(zhǔn)確的衡量,更有利于行業(yè)的技術(shù)發(fā)展,為企業(yè)創(chuàng)造更大的價(jià)值。
本文所推薦的衡量標(biāo)準(zhǔn)是DCP,即Data Center Productivity,其具體公式如下:Data CenterProductivity =Total Facility Energy / Productive IT Equipment Power
六、DCP的精確定義和理解
Data Center Productivity =TotalFacility Energy / Productive IT Equipment Power
Total Facility Energy的解釋:在中國,除了標(biāo)準(zhǔn)的市電引入外,也看到一些數(shù)據(jù)中心也在嘗試新能源的應(yīng)用,如風(fēng)力發(fā)電,太陽能源,三聯(lián)供技術(shù)等分布式能源技術(shù),還有LNG的一些嘗試,國家在倡導(dǎo)節(jié)能減排,國家電網(wǎng)(或南方電網(wǎng))也有關(guān)于對(duì)于電網(wǎng)傳輸和客戶端的一些新技術(shù)和創(chuàng)新。因此單純用Power來衡量,并不能夠完全涵蓋這些領(lǐng)域,因此,用能源(Energy)作為數(shù)據(jù)中心的總輸入衡量,會(huì)更加準(zhǔn)確。
Productive IT Equipment的解釋:服務(wù)器即使在空閑的時(shí)間,即并沒有真正提供有價(jià)值的計(jì)算的時(shí)候,其本身也是在耗電的,雖然,相對(duì)而言比較低,但是在這個(gè)時(shí)間段,服務(wù)器的耗能其實(shí)并沒有創(chuàng)造生產(chǎn)力,換句話說,是沒有真正價(jià)值的。所以,本文希望來衡量真正創(chuàng)造價(jià)值,創(chuàng)造生產(chǎn)力的服務(wù)器能耗。即關(guān)注的是真正在進(jìn)行計(jì)算,真正在創(chuàng)造價(jià)值的這部分IT設(shè)備所產(chǎn)生的能耗。
七、如何衡量分布式能源數(shù)據(jù)中心的能效?
在去年的時(shí)候,對(duì)于分布式能源和數(shù)據(jù)中心結(jié)合的案例在中國并不多,而真正投入使用,并有足夠的運(yùn)行數(shù)據(jù)和模型支撐的又是寥寥無幾。但是今年,有幾個(gè)分布式能源在數(shù)據(jù)中心開始投入使用。如果數(shù)據(jù)中心采用分布式能源和電網(wǎng)相結(jié)合的方式,能效指標(biāo)又該如何衡量呢?
這的確是個(gè)困境,對(duì)于分布式能源,常用一次能源(Energy)利用率或者年均綜合能效作為衡量指標(biāo),而目前數(shù)據(jù)中心基本都是用電(Power)作為衡量指標(biāo)。電(Power)是二次能源,是通過一次能源轉(zhuǎn)換過來的高級(jí)能源。
鑒于中國到目前為止,并沒有出臺(tái)國家級(jí)別的關(guān)于分布式能源的數(shù)據(jù)中心單位能耗監(jiān)測標(biāo)準(zhǔn)或者能效指標(biāo),目前,只能借鑒國外行業(yè)和地方標(biāo)準(zhǔn)的衡量和測試方法。但相信,不久的未來,伴隨著分布式能源和數(shù)據(jù)中心的結(jié)合案例越來越多,必然會(huì)出臺(tái)相關(guān)的標(biāo)準(zhǔn)和衡量指標(biāo)。