隨著數(shù)據(jù)中心規(guī)模的不斷增長,能耗問題凸顯,能耗問題已經(jīng)成為制約數(shù)據(jù)中心發(fā)展的關(guān)鍵因素。能耗基本占用了數(shù)據(jù)中心一半的運(yùn)行成本,大大降低了數(shù)據(jù)中心的盈利能力。一方面,數(shù)據(jù)中心規(guī)模越來越大,設(shè)備數(shù)量不斷增多和處理能力的不斷增強(qiáng),帶來了更多的能量消耗;另一方面,設(shè)備數(shù)量越多,需要冷卻的設(shè)施開銷就越大,一般計(jì)算資源每消耗1瓦電能,就需要額外的0.5~1瓦電能進(jìn)行冷卻。數(shù)據(jù)中心已經(jīng)意識(shí)到了能耗問題,必須采取必要的節(jié)能手段。否則,數(shù)據(jù)中心再這樣建設(shè)下去,將入不敷出,數(shù)據(jù)中心建的規(guī)模越大虧損的越厲害。其實(shí),在數(shù)據(jù)中心節(jié)能上,已經(jīng)有很多文章可做,包括硬件、軟件、算法設(shè)計(jì)、機(jī)房環(huán)境設(shè)計(jì)等等,從不同角度出發(fā)都可以有一些值得借鑒的節(jié)能方法。那么若僅從軟件方面考慮,有哪些節(jié)能的行之有效方法呢?本文將針對軟件節(jié)能技術(shù)擴(kuò)展講來,介紹其中一二。
軟件節(jié)能的主要出發(fā)點(diǎn)是數(shù)據(jù)中心里有成千上萬臺(tái)的設(shè)備,在不同時(shí)刻不同業(yè)務(wù)情況下,每臺(tái)設(shè)備的工作繁忙程度都不同,如果能將這些資源有效利用起來,讓這些設(shè)備工作起來更有效率,從而起到節(jié)能的目的。比如數(shù)據(jù)中心里的服務(wù)器,所有服務(wù)器并不是一直都處于運(yùn)轉(zhuǎn)狀態(tài),尤其是在夜晚和凌晨用戶較少的時(shí)候,許多樹脂型的負(fù)載相當(dāng)?shù)停幱诳臻e狀態(tài)的服務(wù)器與工作狀態(tài)的服務(wù)器功耗幾乎沒有差別,大量的計(jì)算資源和能量被白白浪費(fèi)掉。還比如設(shè)備的風(fēng)扇,如果機(jī)房內(nèi)溫度較高,風(fēng)扇持續(xù)處于高速狀態(tài),這樣必然增加能耗,這也是很多數(shù)據(jù)中心保持內(nèi)部恒溫在24度左右的環(huán)境的原因,讓設(shè)備風(fēng)扇處于低轉(zhuǎn)狀態(tài),設(shè)備處于這樣的溫度環(huán)境中,硬件也不易出現(xiàn)老化。數(shù)據(jù)中心的功能主要由CPU、內(nèi)存、存儲(chǔ)、網(wǎng)絡(luò)等幾個(gè)部分組成,軟件節(jié)能技術(shù)也是從這些方面逐一入手。
部件節(jié)能算法
所有的設(shè)備都需要有CPU,而CPU也是一個(gè)消耗能量比較顯著的器件,通過對CPU的能耗進(jìn)行有效管理,從而達(dá)到降耗目的。比如對CPU進(jìn)行節(jié)能狀態(tài)的設(shè)計(jì),當(dāng)CPU處于空閑狀態(tài)時(shí),及時(shí)進(jìn)入休眠或者關(guān)閉狀態(tài),當(dāng)需要運(yùn)轉(zhuǎn)時(shí),自動(dòng)喚醒即可。當(dāng)CPU進(jìn)行休眠或者關(guān)閉狀態(tài)時(shí),自動(dòng)調(diào)整電壓和頻率,從而達(dá)到降耗目的。當(dāng)然,這個(gè)過程要靠復(fù)雜的算法來完成,通過算法來自動(dòng)控制,實(shí)現(xiàn)CPU的自動(dòng)調(diào)節(jié),達(dá)到節(jié)能目的。不僅是CPU,內(nèi)存、存儲(chǔ)部件等都可以實(shí)現(xiàn),通過動(dòng)態(tài)的能效管理,有效提升這些能耗部件的運(yùn)行效率,在空閑和繁忙之間自如切換,降低設(shè)備運(yùn)行時(shí)的能耗。其實(shí)很多設(shè)備在大部分時(shí)間里都有空閑狀態(tài),通過這些能效管理,真正能夠降低每臺(tái)設(shè)備的能耗。
資源優(yōu)化整合
數(shù)據(jù)中心業(yè)務(wù)運(yùn)轉(zhuǎn)依賴的主要資源就是計(jì)算、網(wǎng)絡(luò)和存儲(chǔ)三大資源,而這些寶貴資源在很多數(shù)據(jù)中心里都存在浪費(fèi)現(xiàn)象。隨便登陸幾臺(tái)設(shè)備查一查就知道,大部分的網(wǎng)絡(luò)設(shè)備端口帶寬都維持在50%以下,大部分的服務(wù)器CPU都低于30%,大量的資源被閑置。當(dāng)然,數(shù)據(jù)中心這樣做也有苦衷,每當(dāng)重大活動(dòng)、節(jié)日訪問數(shù)據(jù)中心的流量增加很多,如果不做些冗余,這些時(shí)候數(shù)據(jù)中心根本撐不住,所以將數(shù)據(jù)中心按照最高業(yè)務(wù)容量來設(shè)計(jì)也是必須的。這時(shí)對這些資源進(jìn)行優(yōu)化整合就非常有意義了,這里主要依靠的是虛擬化技術(shù),通過虛擬化將計(jì)算、網(wǎng)絡(luò)和存儲(chǔ)等資源集中起來,統(tǒng)一分配,避免硬件資源過渡部署和利用率不足。比如通過虛擬化技術(shù)可以把多個(gè)負(fù)載整合到同一個(gè)物理機(jī)上,關(guān)閉空閑的物理機(jī),達(dá)到節(jié)能目的。當(dāng)當(dāng)前的資源無法滿足時(shí),再將空閑的物理機(jī)重新利用起來,通過資源的優(yōu)化整合,提升資源的使用率,節(jié)約數(shù)據(jù)中心能耗,減少數(shù)據(jù)中心占用空間。
云平臺(tái)綜合管理
將數(shù)據(jù)中心能耗納入云平臺(tái)管理,對整個(gè)數(shù)據(jù)中心能耗狀態(tài)進(jìn)行動(dòng)態(tài)監(jiān)控和管理。所有設(shè)備運(yùn)轉(zhuǎn)都要消耗能量,同時(shí)所有設(shè)備運(yùn)轉(zhuǎn)也需要散熱,制冷又需要消耗能量,在這個(gè)過程中,在不影響業(yè)務(wù)運(yùn)轉(zhuǎn)的情況下,如何保持最低的能耗量,可以通過云平臺(tái)來有效管理。在云平臺(tái)上看到的就是各種資源的消耗情況,有計(jì)算、網(wǎng)絡(luò)和存儲(chǔ)資源,也有能耗資源。在業(yè)務(wù)量并沒有增加的情況下,各種資源消耗也沒有增長時(shí),如果能耗資源在不斷增加,就需要排查原因,通過調(diào)整恢復(fù)到正常狀態(tài)。當(dāng)有業(yè)務(wù)增加時(shí),能耗資源必然增加,但通過云平臺(tái)的自動(dòng)調(diào)節(jié),比如適當(dāng)提升室內(nèi)運(yùn)行溫度,提升服務(wù)器運(yùn)行CPU利用率,盡量保持當(dāng)前的能耗水平,這個(gè)過程完全可以通過提前設(shè)置好運(yùn)行參數(shù),交由云平臺(tái)自己完成?,F(xiàn)有一種叫DCIM(數(shù)據(jù)中心基礎(chǔ)設(shè)施管理軟件)的軟件,它甚至可以為數(shù)據(jù)中心實(shí)現(xiàn)高達(dá)30%的節(jié)能效果。這里還有很多種節(jié)能算法,在各種論文、報(bào)刊上都有提及。比如基于超圖的存儲(chǔ)優(yōu)化算法,網(wǎng)絡(luò)感知節(jié)能調(diào)度算法DENS,功率封頂技術(shù)等等,通過這些優(yōu)化算法,對數(shù)據(jù)中心各個(gè)環(huán)節(jié)都有節(jié)能優(yōu)化,同時(shí)也可以對數(shù)據(jù)中心整體的綜合能耗進(jìn)行整體管理和監(jiān)控,并可以自動(dòng)調(diào)節(jié),從而達(dá)到降低能耗的目的。
軟件在數(shù)據(jù)中心節(jié)能中逐漸扮演了一個(gè)非常重要的角色,數(shù)據(jù)中心中軟件主要是用來操控硬件,給硬件下達(dá)啟動(dòng)程序的指令,達(dá)到降耗目的。如果軟件可以使硬件以更少的能源消耗傳遞更出色的性能,那么在不增加任何成本的情況下,讓數(shù)據(jù)中心的能耗逐年降低,這是大家都希望看到的結(jié)果。
版權(quán)聲明:本文為企業(yè)網(wǎng)D1Net原創(chuàng)文章,轉(zhuǎn)載需注明出處為:企業(yè)網(wǎng)D1Net,如果不注明出處,企業(yè)網(wǎng)D1Net將保留追究其法律責(zé)任的權(quán)利。