本文作者Dave King是Future Facilities公司的產品經理。
據說,計算流體動力學(CFD,Computational Fluid Dynamics)提供了關于數據中心氣流的歷史視圖信息,但到了報告生成時,這些視圖信息可能已經過時了。這種將CFD視圖作為過去的快照的方法錯失了技術(預測的)的真正力量;而這一糟糕的思維方式,似乎在行業內還頗有市場。我曾經與數據中心操作運營人員們在各種不同的會議上進行過無數次的溝通交流,而這些數據中心操作運營人員一直在抱怨說,“為什么我需要有人來進行CFD研究,然后告訴我數據中心基礎設施兩個星期前的狀況呢?我通過傳感器就可以及時掌握基礎設施當前的狀況了呀。”產生這種感覺并不是偶然的。
CFD開始進入數據中心領域
CFD最初進入數據中心領域大約是在10至15年前。彼時,數據中心的功率密度才剛剛開始上升。當IT設備由于過熱問題而發生故障運行失敗時,數據中心運營人員們發現很難理解其中的原因所在,因為他們缺乏相應的數據來分析這些問題。而這就是CFD的來源:操作運營人員聘請相關的工程顧問來模擬他們的基礎設施,告訴他們究竟出了什么問題。
大約三個星期后,這些聘請的工程顧問將返回一份報告,該報告顯示了基礎設施中的環境。不變的是,這些報告將包含溫度面板或顯示周圍環境的溫度視圖。
對于許多操作運營人員而言,這是他們第一次實現了對于其基礎設施環境的可視化。通常,這是第一次能夠看到相應的條件在數據中心操作空間內的變化,提供了巨大的價值。
此外,CFD模擬允許跟蹤問題的來源,深入了解基礎設施的運行情況。工程顧問們將與運營人員合作,以找到解決方案,然后在執行該方案之前在模型中進行模擬顯示,充分利用該技術的預測功能。
開發實時數據
隨著時間的推移,市場上開始出現了能夠讓操作運營人員們實時看到數據中心中所發生的情況的監控系統。這些系統的制造商們必須找到一種以簡單易懂的方式呈現來自許多(可能至少100個)單個傳感器的數據的方式。他們選擇使用一種稱為插值的過程來嘗試加入傳感器之間的點,并創建操作溫度視圖,這看起來非常像操作運營人員們曾經看到的CFD模型的輸出。
在這一點上,考慮一下當操作運營人員們在執行CFD分析時,所提出的主要問題真正意味著什么是值得的:我企業的數據中心到底發生了什么?他們可能已經獲得了關于為什么會發生這類情況的答案;以及如果數據中心執行了從CFD模型中所獲得的益處,會發生什么情況的答案,但這并不是思維過程的主要推動力。就市場而言,由已經使用的監測系統所提供的溫度視圖就可以回答這個問題,而不需要專門聘請一名昂貴的顧問。其還有一項額外的好處是,能夠顯示當前發生的事情,而不是三個星期前的。
我們當前的發展階段
使用CFD作為工具來獲取其基礎設施中所發生的情況的快照的數據中心操作運營人員得出了一套結論,即:他們可以通過現代監測技術實時獲得幾乎相同的信息,而無需花費額外的費用(然而,CFD分析將總是能夠給你比監控系統更多的信息)。因此,CFD將被刪除,因為其不再是必要的。
我對此表示贊同。
與監控系統相比,如果您用來為您的數據中心的操作環境條件進行快照,那么CFD是昂貴和麻煩的。但有一點需要注意的是:CFD真正的益處在于其能夠回答“為什么”及“如果”的假設場景的能力。
監控系統的引入允許數據中心的性能得到大幅改進,因為在運營過程中當發生超出限制的情況時,其能夠向運營人員們顯示出來。并非提供相同的數據,CFD建模能夠添加新的信息到操作人員的資源庫。使得未來的計劃可以進行壓力測試和優化,而這是任何其他技術所無法做到的。這樣做將允許進一 步推進數據中心的封裝,能夠利用更多的容量,并充分利用冷卻系統的效率,而不會給IT負載帶來風險。
案例研究:金融機構
為了說明借助其可以實現的目標,我想在接下來分享一個例證。該項目的目標是分離大約150臺舊的直接冷卻的前端為玻璃材質的機柜,并將這些機柜更換為更現代的熱通道/冷通道布置,以便能夠更好地利用可用的冷卻。這相當于該處數據中心設施中大約50%的服務器機柜。同時,額外的200kW的工作負載將被從其他站點的服務器機房遷移到大廳,使得負載總數將從900kW增加到1.1MW。工作將在20個周末進行,使得數據中心的其余能夠保持功能的完整和彈性。
首先,我們模擬了前20個階段的每一個的終點,以確保計劃是健全的。這項步驟突出了在地板上的許多電纜托盤需要被移除,因為它們將直接位于新的冷通道下方,會影響到氣流。
然而,真正有趣的部分是:一旦工作開始上馬后(而且情況往往總是如此),實際工作進程很快偏離了原來的計劃,因為應用程序必須在計劃移動時保持運行。我們與項目團隊現場合作,利用每個周末實際完成的工作和下周末的新計劃更新CFD模型。之后,我們運行了一個新的模擬,為遷移團隊提供每臺新的機柜的安全負載限制。這些每周的安全限值通常明顯小于每臺機柜的最終設計負載。
該項目在計劃預計的時間內完成,沒有發生一次單一的熱停機(thermal shutdown)。這是因為遷移團隊知道確切的限制在哪里,并且可以放心地接近該限制,因為以前已經模擬了每種情況。在不使用模擬的情況下,不會出現這種情況,并且將會超過限制(導致熱停機)或每周安裝的設備更少(延長項目執行的時長)。
互補而不競爭
CFD所提供的數據可以使數據中心性能實現增加監控系統在過去十年中所能夠實現的的相同飛躍。雖然市場有良好的理由將CFD和監控視為互相競爭的技術,但它們實際上是完全互補的。隨著數據中心操作運營人員們被要求以更少的成本做更多的事情,他們將需要這二者的協調努力來實現他們的業務目標。