摘要:
隨著數(shù)據(jù)中心近年來的飛速發(fā)展,業(yè)界人士也正在不遺余力的拓展新的發(fā)展領(lǐng)域,面對數(shù)據(jù)中心運行需要不斷地電力、更多的存儲設(shè)備、更多的計算能力,迫切的需要使用一種新的運行模式。
在沒有更多資金支持的情況下,依舊能讓各系統(tǒng)高效運作,就需要對數(shù)據(jù)中心各個領(lǐng)域進(jìn)行優(yōu)化,包括硬件、軟件的優(yōu)化,以及規(guī)定、流程的優(yōu)化。
數(shù)據(jù)中心現(xiàn)狀:
雖然云計算,虛擬化和托管數(shù)據(jù)中心是受歡迎的,但大多數(shù)組織至少在內(nèi)部至少具有部分計算能力。。根據(jù)451 Research對1200名IT專業(yè)人士進(jìn)行的調(diào)查結(jié)果顯示,有83%的北美企業(yè)擁有自己的數(shù)據(jù)中心。只有17%的企業(yè)將所有的IT運營遷移到云端,而49%的企業(yè)使用云或數(shù)據(jù)中心租賃集成到其自身數(shù)據(jù)中心業(yè)務(wù)的混合模式。
同樣的研究表明,大多數(shù)數(shù)據(jù)中心的預(yù)算還是保持穩(wěn)定,沒有太大變化。盡管受到嚴(yán)格監(jiān)管,醫(yī)療保健和金融部門在數(shù)據(jù)中心的運營,依舊增加投資費用。在不斷增長的企業(yè)中,大多數(shù)企業(yè)都在進(jìn)行升級或改造,以支持?jǐn)?shù)據(jù)中心優(yōu)化,并支持增加機(jī)架的密度。
與此同時,服務(wù)器密度也有所增加。自上世紀(jì)90年代中期,當(dāng)時IBM AS / 400微型計算機(jī)是很普遍的,而如許多數(shù)據(jù)中心都已經(jīng)是高密,服務(wù)器密度比從前增加84倍。電力需求在使用許多傳統(tǒng)計算機(jī)時大約是每平方英尺100瓦,目前使用刀片服務(wù)器時電力需求增加到大約每平方英尺600瓦。隨著服務(wù)器密度的增加和數(shù)據(jù)中心可用空間的減少,任何的收益都可能被額外的空氣處理和電力設(shè)備(包括不間斷電源和發(fā)電機(jī))所占用。事實上,據(jù)CIO雜志報道稱,預(yù)計到2020年數(shù)據(jù)中心的能源使用將增加81%。
合同和流程
為在這樣的環(huán)境中運營,就要從多種來源實現(xiàn)節(jié)約。例如,自然資源保護(hù)委員會(Natural Resources Defense Council)建議數(shù)據(jù)中心“審查其內(nèi)部組織結(jié)構(gòu)及外部合同安排,并確保激勵機(jī)制能夠為效率最佳實踐提供財務(wù)獎勵。”
數(shù)據(jù)中心優(yōu)化專家TeamQuest的負(fù)責(zé)人John Miecielica,建議管理人員在評估合同關(guān)系時要注意風(fēng)險和效率。外部協(xié)議涉及風(fēng)險,例如可以確保您有能力滿足服務(wù)等級協(xié)議。要對它們進(jìn)行定期檢查,以確保其保持高效運行。
例如,2011年Lady Gaga在亞馬遜網(wǎng)站上推廣她的單曲時,導(dǎo)致服務(wù)器崩潰;在亞馬遜增容之前,推廣不得不停止。而另一個例子是2013年,Healthcare.gov上線時,該系統(tǒng)持續(xù)癱瘓6個月。
合理精簡
事實上,優(yōu)化數(shù)據(jù)中心項目中:識別并停止未使用的服務(wù)器,這對運維人員而言是一項極大的挑戰(zhàn),與此同時,還需要對服務(wù)器進(jìn)行優(yōu)化配置。
虛擬化可以實現(xiàn)在需要的時候輕松地進(jìn)行資源的調(diào)配,但同時也使得跟蹤這些資源變得更加困難。其結(jié)果是因為不能確定服務(wù)器是否被使用,所以實際上并未使用的服務(wù)器可能還在運行。自然資源保護(hù)委員會的一項研究報告顯示,多達(dá)30%的未使用的服務(wù)器,依舊在運行。
同樣地,系統(tǒng)可能匹配四個CPU,但實際上只使用兩個CPU。這種情況就會占用其他機(jī)器可能需要的計算容量。使環(huán)境最優(yōu)化,無論是物理的還是虛擬的。“評估能力不足的風(fēng)險,規(guī)定滿足可能重新利用的風(fēng)險和資源以避免風(fēng)險。
除了適合配置合適的硬件外,Miecielica還提供咨詢,仔細(xì)檢查應(yīng)用程序,以確保它們的寫入效率。 例如,一家公司習(xí)慣升級其硬件,但發(fā)現(xiàn)可能會通過優(yōu)化應(yīng)用程序來延遲這些升級。
類似的原理也適用于存儲。雖然數(shù)據(jù)刪除技術(shù)(刪除重復(fù)的文件)被廣泛使用,但是對于中小型企業(yè)(SMEs)來說,過密的存儲仍然是個問題。刪除技術(shù)可以釋放急需的存儲空間。這是中小型企業(yè)面臨的兩大問題(另一個問題是安全性)之一。
全方位監(jiān)控
經(jīng)理們應(yīng)該考慮的另一個重要任務(wù)是,通過數(shù)據(jù)中心的優(yōu)化是為基礎(chǔ)設(shè)施和云計算建立強(qiáng)大的監(jiān)控系統(tǒng)。
例如,數(shù)據(jù)中心基礎(chǔ)架構(gòu)管理(DCIM)系統(tǒng)可以根據(jù)實際使用情況而不是制造商的規(guī)格進(jìn)行管理決策。
除了監(jiān)控之外,管理者還需要分析來準(zhǔn)確預(yù)測和解決問題。 Miecielica說:“DCIM和服務(wù)器監(jiān)控以及連接兩者的分析功能之后,監(jiān)控軟件功能會非常強(qiáng)大。” 分析數(shù)據(jù)能夠幫助運維經(jīng)理看到,是從X到Y(jié)的移動能夠提高效率,還是將X移動到Z更有效率。
Miecielica建議,不僅要把數(shù)據(jù)中心看作是一種優(yōu)化的單個系統(tǒng)的集合,還要全面地研究數(shù)據(jù)中心。“系統(tǒng)不是孤立運行的。它們是整體綜合計劃的一部分。”因此,可以確定可能產(chǎn)生額外的數(shù)據(jù)中心優(yōu)化機(jī)會的協(xié)同作用。
數(shù)據(jù)中心優(yōu)化顯然超越了硬件,成為全系統(tǒng)的活動。 提供更多的電力,更多的容量和更多的存儲,而不需要更多的錢是關(guān)鍵。