在數據中心設計層面,一個重要的趨勢是提高功率密度。鑒于數據中心的空間限制,其需要更高效的運作,以應對電力需求和成本的上升,很明顯,將每臺機架投入更多的資源是一個非常實用的解決方案。但是,這一方案除了擁有其固有的好處之外,提高功率密度也為一些數據中心運營商帶來了一些必須解決的問題和挑戰。
功率密度的趨勢
低功率密度往往等同于效率低下。如此寶貴的空間資源僅僅由如此少的IT設備資源所消耗,同時其還需要消耗更多的設備維護成本。位于圣克拉拉的高密度托管提供商Colovore公司的CFO兼聯合創始人本·庫格林指出:“當前,典型數據中心的客戶部署的機架都是大約每臺機架8–12千瓦的系列,雖然某些數據中心的密度要求更高,但接近20+千瓦的現象在大多數進行大數據分析處理的密集型應用程序來說仍然是罕見的。但與此同時,美國仍然有某些沿海地區的典型的數據中心的機架為4–5千瓦(而這還是10年前修訂的標準)。”
在托管空間,只支持低功率密度的造價是非常昂貴的,因為全租用機架空間可能由于缺乏足夠的電源而無法使用。盡管機架上裝備了大量的設備,但托管空間的基礎設施配套能力不匹配。“客戶可以在他們現有的服務器基礎設施上輕松地完成每臺機架8-10千瓦的部署,但因為大多數數據中心設計建成的是僅支持4-5千瓦的,這樣他們就必須跨機架實施半機架裝備運行,否則就不能很好的實施冷卻。但客戶已經為全機架買單了,盡管其實只是用了半機架的負載資源。這無疑是一種浪費。”
對于功率密度最為明顯的約束之一便是配電基礎設施,公用電力公司提供的電源和數據中心的備用設施的水平都會影響到功率密度。對于公用電力公司所提供的每瓦的電力,數據中心必須有足夠的UPS和柴油發電機,以便在停電的情況下繼續保持其運營能力。當然,布線、配電單元(PDU)等提供電源給專用機架。庫格林指出,“大多數的數據中心并沒有太多的電力以供給給其設施,所以他們希望能夠從公共電力公司獲得更多的電力資源,并在數據中心的核心基礎設施(電氣和機械基礎設施、發電機,配電設備等)上面花了很多錢。因此,對數據中心而言,獲得更多的電力和成本問題是兩個重要的變量。”
但也許數據中心面臨的更為迫切的需要是冷卻:設備每消耗一瓦的電力,就會產生一瓦的余熱,必須除去,以保持數據中心所需的操作溫度。這也是數據中心最初不打算將設備安置為更高密度所希望規避的最大的挑戰。“當你數據中心機架層面的密度增加,服務器必然會生成更多的熱量,因此更多的冷卻也是必需的。”庫格林說。“冷卻基礎設施是非常昂貴的,但最大的挑戰可能來自于試圖改造舊的數據中心。大多數這些舊的數據中心建設初期屋頂設得都很低,在許多情況下,實在沒有簡單的方法來提高密度。除了拆毀之外幾乎沒有什么方法,但這對于數據中心而言是非常難的,特別是當其還托管著某些客戶的時候。”
不幸的是,對于傳統的數據中心企業而言,將其數據中心改造成具備更高密度的數據中心意味著除了等待半導體摩爾定律帶來的改進之外,其數據中心的設施沒有多大實際潛力能夠繼續擴大計算能力了。但是,這種方法需要購買新的IT設備,更好的工藝技術,以及摩爾定律的不斷進步,才能實現更高的效率,而這可能需要十年左右的時間。庫格林指出,在這種情況下,“主機托管提供商只能簡單地使用‘分散負載’,或迫使客戶來跨半機架來使用他們的基礎設施。但是,這顯然是不可持續的,他們最終將隨著客戶服務器的刷新,耗盡他們的空間、電力、冷卻資源。”
整合基礎設施驅動更大的功率密度
向更高的密度的推進可以歸納為長期的基礎設施整合:基本上,將更多計算機資源打包到更小體積,可以通過數據中心現有的趨勢來實現,如采用虛擬化技術、刀片服務器和微服務器。整合基礎設施“對于數據中心的運營效率有著非常積極的作用。”庫格林說,“因為IT部署的物理尺寸較小,IT經理管理的權限更有限,而當服務器的數量減少了30-50%時,帶給總功率的節約才會更有意義。”
這種方法旨在通過提升機架層面的電力,降低數據中心的總功率(其具有雙重的好處,因為其同時也降低了冷卻要求)。“其實,每一臺服務器的電力需求大大增加,但總體而言,總功率是可以下降的,因為所需要的服務器數量更少了。這便是高密度數據中心為何變得如此重要的原因了,他們是讓一切基礎設施得以整合的關鍵。今天的服務器可以輕松地實現每臺機架單元達到500瓦到1千瓦!”
高密度帶來的散熱問題
當然,通過高密度可以帶來更高的效率,每臺機架均安置了盡可能多的設備,從而幫助數據中心實現盡可能的節省成本、占地空間和解決管理難題。但好東西都是需要權衡的:在這種情況下,會造成冷卻問題。低密度部署通常是采用空氣冷卻,并且,在大部分地區,都是采用免費的室外空氣冷卻的方法。但隨著數據中心功率密度的上升,空氣冷卻變得令人望而卻步,而且會變得造價昂貴。
較之均勻分布的直接冷卻源,產熱的解決方案更類似于提供點源:產熱的究竟是由于機架、服務器、甚至處理器的級別。“服務器芯片級的處理能力似乎在持續增加,但在某些時候,他們將需要內部冷卻,立即在服務器附近實施冷卻,以防止產生的熱量增加太多。”因此僅僅對一個點采用空氣冷卻可能仍然不夠,需要采用水資源(或其它液體)提供更大的冷卻能力,但是,這需要犧牲掉一部分的基礎設施交付能力,提升執行上也存在一定的困難,如實現冷卻水與設備電子元件的嚴格隔離。
部署一個基于水的冷卻方案可能會導致某些問題,特別是對于老舊的數據中心而言尤其如此,必須改造現有的基礎設施。但對于那些能夠支持不斷增長的功率密度的新設施而言,水冷卻的方案能夠將冷卻能力輸送到任何需要的地方,而不是僅僅試圖讓整個房間保持足夠低的溫度,以確保服務器空間整體運行溫度。諸如熱通道/冷通道的方案可以讓冷卻空氣有一些回旋的余地,但這種方案也有其局限性。最后,隨著數據中心高密度要求的不斷提升,浸泡技術可能會成為必要的技術。現在已經有一些公司在提供這方面的產品,包括不導電的流體,以及將冷卻液體輸入服務器機箱。
高密度的回報
對于客戶,無論他們是托管服務的客戶,或者就是數據中心運營商,高密度在在總擁有成本(TCO)方面能夠為他們提供重要且豐厚的利潤回報。庫格林說,“當一家公司可以整合其IT基礎設施到虛擬化的刀片服務器,其可以立馬節省20%至30%以上的經營成本,以及每臺機架4-5千瓦的遺留部署。這在很大程度上是由于節省了每月機柜需要容納服務器所消耗的電力費用,以及降低了交叉連接和頂級機架交換機的成本。”對于托管服務客戶和數據中心運營商,這意味著進一步擴大了現有機架的可用空間,賣弄去了構建新的數據中心的麻煩和費用,其收益絕不僅僅是直接的成本節約。
對于那些想要繼續保持其舊有的數據中心建筑或走托管路線的企業而言,隨著能源價格上漲和IT服務需求的增長,他們需要提高效率和節省地面和機架空間。因此,數據中心實施高密度功率是一大趨勢,但同時也是一項挑戰:將更多的容量打包到機架需要建設相關的配電設備,備份基礎設施、冷卻能力也需要提供相關的部署支持,以保持管理操作溫度。雖然冷卻液的方法目前可能還不是一個較為普遍的趨勢,但隨著空氣冷卻方法在高密度環境開始逐漸變得不太實用和實惠,其會變得更加普遍。然而,無論從空氣冷卻過度到液體冷卻方法需要多久的時間,數據中心功率密度無疑將繼續攀升,因為企業都在試圖最大限度地利用自己的資源。