摘要:數據中心可以說是任何企業中最具活力和最為關鍵的操作之一。近年來,隨著數據中心的密度和容量呈現穩步增長,其復雜性和安全風險也在不斷增加,資源日趨緊張,進一步為其相關設備的性能帶來了不良的影響。
數據中心可以說是任何企業中最具活力和最為關鍵的操作之一。近年來,隨著數據中心的密度和容量呈現穩步增長,其復雜性和安全風險也在不斷增加,資源日趨緊張,進一步為其相關設備的性能帶來了不良的影響。根據一項針對數據中心行業的停機中斷研究結果顯示,數據中心的任何類型的停機中斷的平均成本為389,879歐元,而部分的停機中斷的平均成本為199,103歐元。完全停機中斷的成本超過524,464歐元。鑒于停機中斷的成本如此之高,使得IT容量的可用性通常是評估數據中心的最重要的指標。然而,在今天,數據中心還必須同時在能源和管理資源方面保持高效運行,需要保持足夠的靈活性,以快速、經濟高效地適應業務戰略和計算需求的變化。
效率問題最早是于2005年成為數據中心的一個管理問題的,從那時起,隨著數據中心服務器的泛濫導致數據中心能源消耗激增,而與此同時電力成本和人們的環保意識也在不斷上升。于是整個數據中心行業開始普遍的重點關注效率問題成為了該行業對于這些增加的成本和能源消耗對于環境的影響所做出的響應;然而,關于如何解決這個問題,數據中心業界尚未沒有達成一致性的共識。許多供應商提供了解決方案,但并沒有任何一家采用了整體性的方法。其他的某些解決方案則以犧牲數據中心和IT設備的可用性為代價實現了效率提升——而這方面的犧牲幾乎沒有任何一家企業能夠承受。
在傳統的數據中心,大約一半的能源消耗用于支持IT設備,而另一半則用于支持系統(如下圖1)。艾默生網絡能源公司對數據中心的能源使用情況和各種節能方法進行了系統分析,以確定哪些是最有效的。以下5項最佳實踐方案作為數據中心設計的基礎。這些最佳實踐方案為數據中心規劃者和運營商們提供了優化他們新的和現有設施的效率、可用性和容量的路線指導藍圖。
圖1、IT設備占傳統數據中心所消耗能源的50%以上,而電力和制冷則占了額外的48%。
企業數據中心設計的五項最佳實踐方案
以下最佳實踐方案代表了經過實踐驗證的冷卻、電源和管理技術方法,以提高整體數據中心的性能。
1、最佳實踐方案一:最大限度地提高冷卻單元的返回溫度,以提高容量和效率
在數據中心保持適當的條件要求對由供氣和回風組成的空調回路進行有效的管理。熱力學定律允許計算機房的空調系統通過提高進入冷卻盤管的回流空氣的溫度來實現更有效地操作。
這種最佳實踐方案基于下如圖2所示的熱通道/冷通道支架布置,其通過減少熱空氣和冷空氣的混合來改善冷卻單元的性能,從而實現了更高的回氣溫度。回流空氣溫度和顯熱冷卻容量能力之間的關系如下面的圖3所示,其描述了回流空氣溫度增加5.6℃,通常將導致冷卻單元容量能力增加30%至38%。
圖2、在熱通道/冷通道布置中,機架面對面放置,建議在它們之間留出1200 mm的通道。冷空氣分布在通道中,并由兩側的機架使用。熱空氣在每個機架的后部排入“熱通道”。
然而,當系統地使用沖裁擋板來封閉開口時,機架本身在兩個過道之間產生屏障。但即使具有沖裁板,熱空氣可能會從頂部和機架行的兩側泄漏,與冷通道中的空氣混合。隨著機架密度的增加,這就成為了一個更大的問題。
為了減少空氣在返回到冷卻單元時混合的可能性,周邊的冷卻單元可以安置在熱通道的端部,如圖2所示。如果冷卻單元不能定位在熱通道的末端,吊頂天花板可以用壓力室,以防止熱空氣和冷空氣的混合。另一種可能的解決方案是將冷卻單元安置在通道或機械室中。
除了管道和壓力通風系統之外,還可以通過在靠近熱源處施加密封和移動冷卻的方法來防止空氣混合。
圖3、冷卻機組在更高的容量下運行,及在更高的回流空氣溫度下的效率。
1.1 優化通道
密封遏制和基于行的冷卻
密封遏制包括蓋住通道的頂部或末端(或兩者)以隔離通道內的空氣(如下圖4)。
一般來說,冷通道密封優于熱通道密封,因為其更易于部署并且減少了在發生密封系統泄漏的情況下熱空氣泄漏到冷通道和服務器的風險。使用熱通道密封,打開的門或缺少的沖板允許熱空氣進入冷通道,危及IT設備的性能,如下圖5所示。在冷通道密封遏制中,如果冷空氣泄漏到熱通道中,返回的空氣溫度降低,并且能夠不影響IT可靠性的情況下效率略有降低。
圖5、熱通道/冷通道布置通過密封冷通道進一步增加了冷卻單元的容量。
基于機架行的冷卻單元在封閉環境中運行,以補充或替代周邊的冷卻。這使得溫度和濕度控制更接近熱源,允許實現更精確的控制并減少了空氣跨房間傳輸所需的能量消耗。通過將熱管理單元返回的空氣直接安置在熱通道內的進氣口,使得空氣在其最高溫度下被捕獲。雖然這產生了更大的占地面積,但是冷卻效率卻實現了最大化。基于機架行的冷卻可以與整個數據中心的更高密度“區域”中的傳統的基于周邊的冷卻方法結合使用。
圖5、在密封遏制系統破壞的情況下,基于更簡單的安裝和更高的可靠性,推薦使用冷通道密封。
2、最佳實踐方案二:使冷卻能力和空氣流量與IT負載相匹配
最高效的冷卻系統是匹配了對于實際需求滿足的系統。這已被證明是數據中心的一項挑戰,因為冷卻單元的容量大小是為了適應峰值期間的需求的,而這種峰值需求在大多數應用程序中很少發生。通過使用能夠基于數據中心內的條件來理解、預測和調整冷卻能力和空氣流量的智能冷卻控制來解決該挑戰。在某些情況下,這些控制與“最佳實踐方案3”中的技術相兼容,根據當前條件調整制冷單元的性能(如下圖6)。
智能控制使得能夠從基于回風溫度的冷卻控制轉換到基于服務器處的條件的冷卻控制,這對于優化效率是至關重要的。這通常允許冷通道中的溫度升高到接近ASHRAE所推薦的“安全”操作閾值(最高27℃)。根據艾默生網絡能源的研究,冷通道溫度增加5.6°C可使冷卻系統能耗降低20%。
控制系統還通過允許多個冷卻單元作為單個系統同時工作來幫助提高效率。控制系統可以將工作負荷轉移到以峰值效率水平操作的單元,同時防止不同位置的單元在交叉目的下工作。如若沒有這種類型的系統,數據中心的一個區域中的單元可以向房間增加濕度,而另一個單元則從房間中提取濕度。控制系統具備跨機房查看房間條件并智能化確定是否需要加濕、除濕、或無需對機房采取任何措施,以維持其達到目標水平并使空氣流與工作負載相匹配的能力。
圖6、諸如iCOMTM系統這樣的智能化控制可獨立管理氣流和冷卻能力。
3、最佳實踐方案三:利用冷卻設計降低能耗
優化制冷基礎設施的第三步是充分利用比上一代組件耗能更少的新技術的優勢。
3.1 提高風扇效率
移動空氣和對高架地板加壓的風扇是冷卻系統中消耗能量的重要組成部分。當考慮采用冷卻水冷卻單位時,風扇是最大的能源消耗部件。電子換向(EC)風扇為提高冷卻單元的效率提供了最佳選擇。EC插頭風扇本質上比傳統離心式風扇更高效,因為它們消除了皮帶損耗,總損耗約為消耗能量的5%。 EC風扇通常需要最小600 mm高的高架地板,以獲得最大的操作效率。當EC風扇的能耗與可變驅動風扇獨立測試時,安裝在冷卻單元內的EC風扇創造了18%的節省。然而,當EC風扇放置在高架地板下方時,節約增加了30%。這兩種備選方案均有助于節省能源,并能夠與最佳實踐方案2中所描述的智能控制配合使用,以使冷卻容量與IT負載相匹配。
3.2 增強熱傳遞
冷卻單元內的熱傳遞過程也會消耗能量。已經證明在冷凝器中使用的新的微通道線圈能夠比上一代線圈設計更有效地傳熱。這些線圈減少了傳熱所需的風扇功率,為整個系統帶來了5%到8%的效率提升。
3.3 混合并入節能器
節能器系統使用外部空氣為數據中心提供“免費的冷卻”循環。這可以減少或消除熱管理單元中的冷卻器或壓縮機操作,使節能器系統能夠為冷卻單元產生30%至50%的能量節約,具體節約水平取決于現場的平均溫度和濕度條件。流體側的節約器(通常稱為“水側”)與由蒸發冷卻塔或干冷器組成的排熱回路結合工作,以滿足冷卻要求。其使用外部空氣來幫助排熱,但不允許外部空氣進入數據中心。另一方面,空氣側節約器則使用傳感器,管道和阻尼器的系統來將外部空氣帶入受控環境中。
在評估節能選項時,應仔細考慮外部空氣對數據中心濕度的影響。數據中心環境推薦的相對濕度為40%至55%。在寒冷的冬季,通過空氣側節能器系統(如下圖7)引入外部空氣可以將濕度降低到不可接受的水平,導致靜電放電損壞設備。而采用加濕器可用于保持適當的濕度水平;然而,這又抵消了節能器所帶來的部分節能。
流體側節約器系統能夠通過使用冷的外部空氣來冷卻水/乙二醇環路來消除這個問題,水/乙二醇環路又反過來提供對于空調系統中的冷卻盤管的足夠冷的流體。這使得外部空氣保持在受控環境之外,并且不必進行調節。根據不同的氣候條件,流體側節能器可以更有效地用于數據中心環境(如下圖8)。
節能器在溫度較低的地方顯然可以帶來更多的節省。然而,當設計得當時,它們也可以在溫暖的氣候條件下實現顯著的節約。
圖7、LiebertPCW熱管理單元利用外部空氣在條件最優時提高冷卻效率。
圖8、空氣節約器是高效的,但在其在某些應用程序中受到限制,并且可能需要額外的設備來控制濕度和污染。
4、最佳實踐方案四:啟用數據中心監控,以提高容量、效率和可用性
有時,數據中心管理人員一直是盲目行動,缺乏對于系統性能、以及如何優化效率,容量和可用性的正確了解。歷史上,可用性監控和控制一直被領先的企業組織所采用;但管理IT和設施的整體運營卻相對滯后。隨著新的數據中心管理平臺的出現,IT、電源和冷卻系統的操作數據匯集在一起 ,為操作提供了無與倫比的實時可見性,上述這種盲目行動的情況正在發生變化。
數據中心基礎設施需要對實物資產實施監控和控制。冷卻和電力系統應該將儀表集成到其中,以便他們有一天可以補充額外的傳感器和控制,以實現對系統基礎設施的集中和全面的視圖。
在整個數據中心安裝溫度傳感器網絡可以是對由冷卻單元提供的供應和返回空氣溫度數據的有價值的補充。通過感測多個位置處的溫度,能夠更精確地控制空氣流量和冷卻能力,從而帶來更有效的操作。
泄漏檢測也應該被視為一套全面的數據中心監測計劃的一部分。使用戰略定位的傳感器,這些系統提供了潛在的災難性泄漏的早期預警,包括了數據中心的乙二醇管道、加濕管、冷凝泵和排水管、架空管道和單位、以及天花板滴水盤。
通過以太網連接和簡單網絡管理協議(SNMP)的接口提供與管理系統或其他設備的通信,并通過Modbus和BACnet與樓宇管理系統集成。當基礎架構數據合并到中央管理平臺時,跨數據中心的實時運行系統數據可以推動數據中心性能的提高:
提高可用性:對于故障接收或最終可能導致故障事件的即時通知的能力允許對系統問題更快,更有效作出響應。更進一步,來自監控系統的數據可用于分析設備操作的趨勢,并開發更有效的預防性維護程序。最后,通過監視提供的數據中心基礎設施的可見性和動態控制可以幫助防止源自操作條件改變的故障。服務器入口溫度的穩定升高可能在過熱關閉服務器之前決定需要額外的機架行冷卻單元。
提高效率:在設施、機架行、機架和設備級別實施功率監控,有助于提供更有效和動態的冷卻管理能力。提高基礎設施效率的可見性可以推動在效率和可用性之間的平衡的知情決策。此外,自動化的數據收集,整合和分析的能力使數據中心的工作人員們能夠專注于更具戰略性的IT問題。
管理能力:有效的需求預測和容量規劃已成為數據中心有效管理的關鍵。 數據中心基礎設施監控可以幫助識別和量化影響數據中心容量的模式。通過持續了解系統容量和性能,企業組織得以能夠更好地重新校準和優化基礎設施系統的利用(不會將其擴展到會使可靠性受到影響的程度),并釋放滯留容量。
5、最佳實踐方案五:利用本地設計和服務專業知識來延長設備的使用壽命,降低成本并解決您數據中心的獨特挑戰
雖然在優化可用性,效率和容量方面的最佳實踐方案已經出現,但是在如何根據特定的現場條件,預算和業務需求來運用這些實踐方案則存在顯著的差異。數據中心的專家們可以提供幫助,以最適合您企業業務的方式運用這些最佳實踐方案和技術,并就所有新建和主要的擴展/升級項目提供咨詢。
對于已建立的數據中心站點設施,預防性維護已被證明是提高系統的可靠性的有效方法,而數據中心評估則可以幫助確定在數據中心內的不斷變化所造成的漏洞和效率低下。
應通過定期的數據中心評估來補充預防性維護計劃。評估將有助于識別,評估和解決可能對運營操作產生不利影響的電源和散熱漏洞。
在關鍵點讀取溫度讀數是熱評估的第一步,這可以保證識別熱點和解決可能導致設備性能退化的問題。讀數將確定是否成功地從發熱設備(包括刀片服務器)中移除熱量。這些讀數由紅外檢查和空氣流量測量補充。還需要評估了冷卻單元的性能,以確保這些冷卻單元的正常工作。計算流體動力學(CFD)也用于分析數據中心內的空氣流量。
結論
在過去幾年中,數據中心的設施被預計將能夠提供更多的計算能力,同時提高效率,消除停機中斷,并適應業務的不斷變化。基礎設施技術在整個這一時期得到了發展,因為它們適應了更高密度的設備、以及對更高的效率和控制的需要。
快速的變化使許多數據中心管理人員對新技術和實踐方案采取了觀望的態度。在幾年前這可能尚屬一個明智的策略,但到了今天,改進數據中心性能的需求不能再被忽視了。正確部署本文中所討論的相關實踐方案將有助于數據中心改善TCO,從帶來資本效益和令人驚訝的能源效率的提高到易于適應計算需求。
在冷卻系統中,傳統的技術現在與較新的技術相結合來支持更高的能力和效率。提高回風溫度則可以提高容量和效率,而智能化控制和高效率的組件則允許空氣流量和冷卻能力與動態IT負載相匹配。