超過半數的電子故障由溫度造成,并且由于這些熱量源于不斷升高的晶體管密度和運行速度,我們可以得出一個合乎邏輯的結論:在其他條件均相同的情況下,電子故障率也將不斷攀升。
熱量是電子設備的敵人。根據 BCC, Inc. 的“Report GB-185R”,超過半數的電子故障由溫度造成,并且由于這些熱量源于不斷升高的晶體管密度和運行速度,我們可以得出一個合乎邏輯的結論:在其他條件均相同的情況下,電子故障率也將不斷攀升。
事實上,根據由 IBM、HP、Dell、Nortel、Cisco 等組成的“行業冷卻協會”發布的信息,我們目前正處于大多數計算與通信電子設備熱密度(瓦特/平方英尺)增長的最高峰(據 Uptime Institute(運行時間協會)的白皮書報告)。
溫度會以許多不同的方式影響 IT 硬件,并且看似無關緊要的變化經常會對性能和經濟性產生重大影響。Arrhenius 反應導致電容器使用壽命和半導體性能在高溫作用下下降。有一個很靈驗的經濟法則,即環境溫度每升高 10°C,IT 硬件的長期可靠性便會降低 50%.事實上,美國軍方標準和Telcordia標準均將 CPU 使用壽命與溫度相關聯。有趣的是,我們注意到大多數 CPU 的工作溫度范圍上限均在 95°C 上下,但是 MIL-HNBK-217 和Bellcore數據卻表明,在此溫度水平下持續運行將會使 CPU 壽命限制為一年或更短時間,而降低 5°C 竟然可以使設備的預期壽命延長三倍。
一些芯片制造商已經能夠制造明顯更快且更強大的微處理器,但是由于缺乏應對多余熱量的解決方案而無法將其投入實際應用。因此,無論是在芯片級、電路板級、殼體級或機架/機柜級,每一個為這些微處理器的冷卻做出貢獻的人員都會成為新一代計算能力的推動者。
了解高溫對于 CPU 的影響以及對 IT 硬件進行更大程度冷卻可以獲得更高性能和經濟利益的前景,我們見多識廣的機房經理需要經受住投入更多機房空調機組 (CRAC) 或僅僅調低恒溫器的誘惑。在有些情況下,這些舉措僅僅是浪費;而在另外一些情況下,較冷的空氣實際上可能會導致產生更嚴重的散熱問題。正確的空氣管理取決于強制空氣對流熱傳導率冷卻設備的原理至少有著基本的理解。大多數的機架安裝設備采用風扇冷卻。盡管有一些將空氣由一側移至另一側的獨立產品平臺,但是通常情況下,還另設有 10-30 臺 CFM 軸流式風扇以將空氣由前端抽出,然后排到后端。
管理空氣流動非常簡單,就是使空氣流動到需要的位置,而此過程的第一步是減少浪費的冷送風–從地下逃逸到沒有起到冷卻作用之處的空氣。Triton Technologies 曾針對一百多個機房和數據中心中的地板冷卻空氣繪圖,并且發現在絕大多數的場所中,輸送到室內的空氣有 50-80% 為浪費的冷送風。減少浪費的冷送風好處多多。
此外,將最冷的空氣直接輸送到最暖的設備排氣,源空氣與返程空氣溫差的降低問題整體將會變得更嚴重??梢圆捎萌魤|、全泡沫或特殊的面板隔斷里襯(配有毛刷)封閉電纜周圍。
僅僅增大靜態壓力還不能保證使冷卻空氣到最關鍵需求點的流動實現最佳化–在高架地板下方輸送的空氣必須具有方向性且必須予以正確的管理。高架地板空氣管理產品與服務營銷商 Triton Technology Systems 已積累廣泛的實驗法研究資料,其中指出不僅 CRAC 的氣流傾向于混合,但如果 CRAC 的位置彼此成直角,則會導致冷卻空氣輸出模式以地上機房中返程空氣模式無法預測的角度偏轉。在最好的情況下,此模式會導致運轉中的冷卻設備效率低下,從而導致成本的浪費;在最壞的情況下,會在機房中形成熱點,從而危害計算設備的性能和數據的完整性。
將空氣吹入機柜底部或從機柜頂部抽吸氣體的高功率風扇不符合本文所介紹的原理。例如,此類風扇通常會同時從機柜的正面和背面抽吸或吹送冷卻空氣,因此會冷卻廢氣(返程氣體),降低源空氣與返程氣體之間的溫差以及降低CRAC 的效率。
數據中心設備的冷卻方案不需要是神秘的技法,但是經常需要超乎常識以外的認知,尤其因為高架地板磚的下面發生許多我們看不到的活動。切記以下要點:僅將冷空氣用在設備確實需要之處;避免將“用過的”返程空氣與源冷卻空氣相混合;以同一方向,彼此平行的方式布設空氣與地板下的電纜,使環境顯得簡單且可以預測;最本質的東西是輸送有效的冷卻量,而不僅僅是排掉熱空氣。
最終,當地板下靜態壓力實現最大化從而確保最佳的冷卻空氣 CFM 輸送,且數據中心中的 CRAC 和設備機柜的布置最理想時,站點管理員必須避免這一常見的傾向:將最熱的設備放置在最靠近 CRAC 的位置。CRAC 直接流出的空氣速度經常可能會更高,而無法向上偏轉,從而通過太靠近 CRAC 的網孔地板磚。事實上,根據文丘里效應的物理學原理,流經附近網孔地板磚的冷卻空氣速度可能很大,足以將室內空氣和/或受熱的返程氣體抽到地板下空間中。因此,不僅靠近放置不能將冷卻量傳輸到最熱的設備,而且還可能會導致傳輸到整個房間內的冷卻空氣溫度上升。本文建議避免將網孔磚布置在太靠近 CRAC 的位置,并且盡可能將無源的連接設備布置最靠近在 CRAC 的位置,以使空間利用率最大化。