綠色節(jié)能對于數(shù)據(jù)中心而言已經(jīng)不是一個錦上添花的議題,而是一個必須做好的課題,因為能源成本的占比正在不斷攀升。根據(jù)美國環(huán)境保護署EPA的報告,在數(shù)據(jù)中心的運維成本之中,場地基礎(chǔ)設(shè)施的運維成本于2004年開始超越服務(wù)器的購買和運維成本,能源成本則于2008年開始超越服務(wù)器的購買和運維成本。對于企業(yè)自用的數(shù)據(jù)中心而言,綠色節(jié)能意味著大量成本的節(jié)省(視規(guī)模的不同,大型數(shù)據(jù)中心的整體PUE值每下降0.1意味著每年電費可以降低數(shù)十萬元到上千萬元人民幣);而對向外出租運營的數(shù)據(jù)中心而言,綠色節(jié)能則直接關(guān)系到自己的市場競爭力和盈利水平。
數(shù)據(jù)中心的綠色節(jié)能從何入手呢?答案是越早越節(jié)能!越早期做出的策略性規(guī)劃越能夠更大幅度地節(jié)能。下面我們就來重點討論前三個階段——IT策略(ITStrategy)、數(shù)據(jù)中心策略(Data CenterStrategy)、數(shù)據(jù)中心設(shè)備和系統(tǒng)設(shè)計(IT Equipment, Power,Cooling)——中的各種策略規(guī)劃和節(jié)能技術(shù)在綠色數(shù)據(jù)中心上的應(yīng)用。
IT策略(ITStrategy)
IT策略對能耗的影響是一個很大的話題,這里我們重點關(guān)注IT治理模式、應(yīng)用部署、數(shù)據(jù)中心整合和應(yīng)用軟件的優(yōu)化:
IT治理模式
統(tǒng)一的IT治理模式更加節(jié)能。一個企業(yè)總有其從小到大的發(fā)展歷程,在規(guī)模較小的時候,分散的IT治理模式是最天然的選擇,也最能夠快速有效地響應(yīng)業(yè)務(wù)的需求。等到企業(yè)發(fā)展到一定的規(guī)模之后就會發(fā)現(xiàn)其諸多弊端,其中與能耗相關(guān)的是數(shù)量眾多、運維水平低下的小型數(shù)據(jù)中心,這些數(shù)據(jù)中心因為規(guī)模小,適用的設(shè)計技術(shù)受到限制(如采用高能耗的風(fēng)冷而不是更節(jié)能的水冷、處于辦公環(huán)境只能與辦公大樓共用空調(diào)系統(tǒng)等),管理水平也難以有效提升,導(dǎo)致數(shù)據(jù)中心整體能耗高居不下。另外,分散的IT治理模式還會導(dǎo)致IT部署和采購模式的不一致,體現(xiàn)在數(shù)據(jù)中心里規(guī)格型號多樣的IT設(shè)備,這些設(shè)備有著不同的功率密度,會導(dǎo)致這些設(shè)備在數(shù)據(jù)中心中的部署密度偏低,其總體擁有成本(TCO)會高于高密度的部署。目前中國互聯(lián)網(wǎng)行業(yè)的幾大巨頭都采用統(tǒng)一的IT設(shè)備采購模式,IT設(shè)備標準化工作做得很好,因而他們的數(shù)據(jù)中心能夠采用更高的部署密度(一般在7KW/機柜或更高),節(jié)能效果也走在了其他行業(yè)之前。
應(yīng)用部署
整合應(yīng)用,并采用虛擬化和云計算的方式進行部署更加節(jié)能。業(yè)界研究表明,在業(yè)務(wù)處理量一定的前提下,采用少量的高性能設(shè)備(高負載)進行業(yè)務(wù)處理,會比采用數(shù)量眾多的低性能設(shè)備(低負載)大幅度節(jié)能。目前業(yè)界已經(jīng)有諸多實踐的虛擬化和云計算的部署方式就能夠享受到節(jié)能的好處,節(jié)能的幅度因場景而不同,常見的節(jié)能幅度一般會超過20%。并非所有的應(yīng)用都能夠有效地運行在一臺物理機器上,對某些應(yīng)用需要事先進行改造才能夠做應(yīng)用整合。
數(shù)據(jù)中心整合
整合的數(shù)據(jù)中心部署更加節(jié)能。前面提到,分散的IT治理模式會導(dǎo)致數(shù)量眾多的高能耗小型數(shù)據(jù)中心,在進行有效地IT架構(gòu)變革之后,業(yè)界的實踐一般采用數(shù)據(jù)中心整合的方式,將多個小數(shù)據(jù)中心集中起來,常見的數(shù)據(jù)中心整體部署模式有兩地三中心、兩地兩中心等。集中后的數(shù)據(jù)中心有規(guī)模效應(yīng),能夠采用更節(jié)能的技術(shù)進行設(shè)計,能夠組建成規(guī)模的、更專業(yè)的運維團隊,進而大幅度降低數(shù)據(jù)中心整體能耗,更能降低IT的總體擁有成本(TCO)。
應(yīng)用軟件的優(yōu)化
劣質(zhì)應(yīng)用軟件對能源的消耗異常驚人。中國惠普公司在成立后的近30年中,經(jīng)歷過諸多行業(yè)的大集中項目及其配套的應(yīng)用升級、改造、優(yōu)化工作,在最顯著的一個案例之中,優(yōu)化前后應(yīng)用軟件的性能竟然相差百倍,大家可以想象優(yōu)化前后系統(tǒng)能耗上的差異。
優(yōu)化應(yīng)用軟件性能是建設(shè)數(shù)據(jù)中心綠色的源頭,它能帶來的好處包括更小規(guī)模的硬件數(shù)量和更短的系統(tǒng)峰值時間,進而帶來更低的能耗。
HP公司自己的IT變革案例很好地體現(xiàn)了上述關(guān)注點,HP將遍布全球的85個數(shù)據(jù)中心整合為6個全球性數(shù)據(jù)中心,大幅度降低了IT的總體擁有成本,HP全球數(shù)據(jù)中心整合后獲得的收益數(shù)據(jù)如下。
數(shù)據(jù)中心策略(Data Center Strategy)
在數(shù)據(jù)中心策略層面,下列因素與數(shù)據(jù)中心能耗密切相關(guān):
首先,選址。只要有可能,盡量將數(shù)據(jù)中心選擇在低溫干燥的地理區(qū)域,這樣會讓數(shù)據(jù)中心的設(shè)計人員有更大的節(jié)能設(shè)計余地。
其次,數(shù)據(jù)中心等級建設(shè)。HP數(shù)據(jù)中心服務(wù)部做過評估,對于一個IT運維能力和場地設(shè)施運維能力都很強的成熟客戶,在特定應(yīng)用場景下,建設(shè)兩個Tier2等級的數(shù)據(jù)中心比建設(shè)一個Tier4的數(shù)據(jù)中有著更高的綜合可靠性和相似甚至略低的建設(shè)成本。隨著更多軟件冗余技術(shù)(如云計算、虛擬化)的成熟和應(yīng)用,人們開始重新評估場地設(shè)施的級別,低級別的數(shù)據(jù)中心因系統(tǒng)冗余少,有著更高的系統(tǒng)利用率,也意味著更低的能耗。實際的案例包括,原來主流數(shù)據(jù)中心采用T3/T4級別的eBay和Yahoo,已經(jīng)把大部分應(yīng)用部署在Tier1甚至更低等級的數(shù)據(jù)中心,只有核心數(shù)據(jù)庫和核心網(wǎng)絡(luò)繼續(xù)留在高級別數(shù)據(jù)中心里。
第三,分期規(guī)劃。數(shù)據(jù)中心的建筑屬于不動產(chǎn)之列,一旦建成難于擴展,因此現(xiàn)代的數(shù)據(jù)中心需要做好規(guī)模規(guī)劃,一般企業(yè)數(shù)據(jù)中心會預(yù)留10年以上的發(fā)展規(guī)模。這意味著機電系統(tǒng)需要進行分期建設(shè),找到一個合適的容量進行機電設(shè)備的實施,使得IT設(shè)備在合理的時間內(nèi)達到較高的負載進而提升機電系統(tǒng)的利用率,達到節(jié)能的目的。需要注意的是,數(shù)據(jù)中心機電系統(tǒng)的實施也屬于“動土”范疇,分期建設(shè)的規(guī)劃還是需要考慮適當?shù)姆€(wěn)定運行期,不要“不間斷地動土”,需要為分期規(guī)模找到平衡點。
第四,機柜部署密度。前面提到,在業(yè)務(wù)處理能力一定的情況下,高密度機柜部署會更節(jié)能,TCO也更低。高密度部署的前提是IT設(shè)備標準化。
在數(shù)據(jù)中心設(shè)備和系統(tǒng)設(shè)計層面,下列因素與數(shù)據(jù)中心能耗密切相關(guān)。一個是氣流組織。氣流組織的好壞會大幅度影響能耗,應(yīng)當進行機柜的冷熱通道隔離,必要時作封閉處理。優(yōu)良的氣流組織設(shè)計目前已經(jīng)落實到大部分新建的數(shù)據(jù)中心,但一些老舊機房這方面的問題依然嚴重。另外一個是,高壓直流。相比于交流系統(tǒng),高壓直流系統(tǒng)具有能源效率高、能耗低、系統(tǒng)簡單、穩(wěn)定可靠等特點。目前在數(shù)據(jù)中心行業(yè)的實踐當中,高壓直流的應(yīng)用主要在于電氣系統(tǒng)的末端(接入服務(wù)器一端)。高壓直流系統(tǒng)目前處于大規(guī)模應(yīng)用的前期階段,其設(shè)備對比直流系統(tǒng)也暫時不具備成本優(yōu)勢。或許高壓直流系統(tǒng)最大的好處在于系統(tǒng)的簡單和穩(wěn)定,以往交流數(shù)據(jù)中心的設(shè)備故障之中UPS和電池的故障高居榜首,直流系統(tǒng)則可以讓你大幅度減少這些煩惱。至于高壓直流的具體節(jié)能數(shù)據(jù),不同的廠商尚有分歧。下圖是HP公司內(nèi)部的一個工作小組聯(lián)合業(yè)界部分電氣系統(tǒng)廠商做的一次評測結(jié)果,其數(shù)據(jù)不一定具有普遍適用性,僅供參考。注意其中僅在末端系統(tǒng)(Rack-level)采用高壓直流和整個場地全部電氣系統(tǒng)(Facility-level)都采用高壓直流的大幅能耗差異。
值得一提的是,HP公司已經(jīng)于2014年正式推出直流服務(wù)器,到2014年底,直流IT設(shè)備將覆蓋主要高低端的服務(wù)器、存儲和網(wǎng)絡(luò)設(shè)備。主流IT設(shè)備廠商也有類似的直流產(chǎn)品計劃。
還有空調(diào)系統(tǒng)技術(shù),采用先進的空調(diào)系統(tǒng)技術(shù)進行數(shù)據(jù)中心的設(shè)計是數(shù)據(jù)中心場地基礎(chǔ)設(shè)施節(jié)能的核心。在較高的服務(wù)器進風(fēng)溫度前提下(在ASHRAE建議的服務(wù)器進風(fēng)溫度上限27℃,現(xiàn)代服務(wù)器都能夠保持良好的運行狀態(tài)),對于新建的大中型數(shù)據(jù)中心,我們推薦前端采用高溫冷凍水系統(tǒng),使得冷凍水送回水溫度得以較傳統(tǒng)設(shè)計大幅度提高,達到17到23℃,這樣使得可使用自然冷卻的時間大為延長,也使得這一方案能夠適用于我國絕大多數(shù)地理區(qū)域。
對于末端系統(tǒng)而言,如下圖所示,越接近熱源的末端空調(diào)方式是越節(jié)能的方式。我們推薦末端系統(tǒng)采用接近機柜的水冷技術(shù)(審慎的行業(yè)和單位慎用),目前可落地的方案包括水冷背板方案(RDHX)和頂置式對流制冷方案(OCC),由于OCC方案具有更少的物理接頭(意味著更高的可靠性)、更低的造價、更好的冗余部署方式(N+1,2N等),我們認為OCC是更好的方案。
控制系統(tǒng)也很重要。數(shù)據(jù)中心的控制系統(tǒng)(Building ManagementSystem,BMS,也稱為“樓控系統(tǒng)”),是數(shù)據(jù)中心利用自然冷卻節(jié)能的重要部分,BMS是空調(diào)系統(tǒng)進行自動加機減機、平穩(wěn)地在各種空調(diào)運行模式間切換、實現(xiàn)故障組件的替代的重要系統(tǒng)。BMS系統(tǒng)缺失或手動的BMS系統(tǒng)會導(dǎo)致作為過渡季節(jié)的春秋季,空調(diào)系統(tǒng)進行部分自然冷卻期間,無法有效地加機減機、調(diào)整運行工況達到節(jié)能目的,其原因是運維人員手工操作太繁瑣,干脆讓空調(diào)系統(tǒng)全負荷運行(對運維人員而言這樣也更“安全”),這意味著成百上千小時的部分自然冷卻時間被浪費。
就新建數(shù)據(jù)中心而言,這可能目前國內(nèi)數(shù)據(jù)中心與國外相比差距最大的地方。目前國內(nèi)新建數(shù)據(jù)中心在控制系統(tǒng)上還是走傳統(tǒng)路線,采用樓控廠商的商用或辦公樓宇設(shè)計方案,存在不少單點故障,控制系統(tǒng)的可用性級別低于數(shù)據(jù)中心級別,其實這樣的數(shù)據(jù)中心無法獲得高級別等級認證。更要命的是,樓控廠商不了解數(shù)據(jù)中心的工作需求(業(yè)主方也不了解),系統(tǒng)都號稱可編程,但是因為沒有人說得清楚編程需求,于是“可編程”變成了“沒編程”,業(yè)主最終花了自動系統(tǒng)的錢,得到的是一個手動系統(tǒng),這樣的現(xiàn)象可以說遍地都是。HP公司在數(shù)據(jù)中心控制系統(tǒng)上有著超強的技術(shù)實力和超過30年的經(jīng)驗(來自美國EYP),愿為解決國內(nèi)數(shù)據(jù)中心市場上最后的一塊大的技術(shù)堡壘做出應(yīng)有的貢獻。
綜上所述,綜合采用了高壓直流系統(tǒng)、冷/熱通道封閉、高溫冷凍水前端、OCC末端、優(yōu)秀的控制系統(tǒng)之后,HP公司在炎熱的印度的一個實際數(shù)據(jù)中心案例中,全數(shù)據(jù)中心的綜合PUE達到了1.4以下。