過去十年中,數據中心產業已成為一個非常積極并發展相當迅猛的行業。這種擴張旋風同時創造了一系列的設計改進和一系列的技術進步,使的今天的一家典型的數據中心無論是從規模上、密度和可靠性方面較之幾年前,都發生了戲劇性的進步。
然而,盡管在數據中心的設計和技術方面均已有了如此卓越的進步,這種進步仍然存在很大的局限性。人們仍在繼續追求實現最富有成效的數據中心輸出,以便平衡數據中心的可用性和能源效率的競爭約束。這方面的障礙因素往往既不是技術也不是金融問題,因為根本的技術已經存在,期望的投資回報往往超出了適當水平的承諾。相反,這些障礙需要克服來自中斷相關的信息收集和共享的組織界限,并平行斷開數據中心管理中團隊和用戶之間的業務流程。
什么是數據中心基礎設施管理(DCIM)?
在過去的幾年的時間里,數據中心基礎設施管理這一術語一直在數據中心產業被廣泛使用。這是用來描述一類管理軟件,軟件工具是面向物理數據中心基礎設施的管理。管理物理系統的電網、冷卻、網絡連接,甚至IT資產,如服務器和存儲設備。
但是,數據中心基礎設施管理所面臨的一個挑戰便是,其一直缺乏一個簡潔、并且能夠普遍被人們所接受的定義。值得慶幸的是,數據中心的分析師、媒體、軟件供應商以及系統的最終用戶已經就什么是數據中心基礎設施管理普遍比較了解了。
數據中心基礎設施管理的定義可以概括如下:
“數據中心基礎設施管理(DCIM)系統收集和管理數據,包括數據中心的資產、資源利用情況和整個數據中心的生命周期的運行狀態的數據。然后將這些信息以分布、集成、分析和應用的方式,幫助管理者滿足業務和面向服務的目標,優化數據中心的性能。”
這個定義強調對物理基礎設施的“資產”,以及常見的軟件功能,如數據收集和分析的考慮。此外,它突出了軟件和數據中心的業務流程和服務的聯系,如正常運行時間、效率,以及變化和容量管理等領域之間的連接。
數據中心基礎設施管理:收集、分析和采取行動
在這里要了解的最重要的是其核心,數據中心基礎設施管理是關于數據資料收集,然后根據完整的相關信息,對物理基礎設施采取相關措施。這些信息需要準確反映當前的相關狀態,即在任何時間點的數據中心(時間可以以年、月、日、小時、分鐘、秒或微秒來衡量),以便支持準確和明智的決策。在理論上,這應該是一件簡單的事情,所有記錄數據中心基礎設施技術的儀器和儀表早已經在收集這些相關數據了。
信息障礙
然而,在實踐中,許多數據中心基礎設施管理信息不通,很可能從基礎設施的任何智能設備收集數據,這樣工具給出的數據便是不可行的。無論是信息被保存在分立筒倉,以滿足特定的專家用戶群的需求,或聚合成一個單一的“主系統”,軟件本身缺乏必要的詳細的細節,任何專家用戶無法有效地執行他或她的工作。一個更有效的辦法是利用開放的通信協議和建筑師的溝通途徑,使數據可以很容易地聚集到任何專家系統的詳細信息,并可以在系統之間交換。下圖1便是一個簡化的通訊架構,比較這些不同的數據中心基礎設施管理方法。
圖1:數據中心基礎設施管理系統通信體系結構比較
整合的方法克服了其他方法過去和現在的信息壁壘,往往可以利用現有投資,購買儀器和系統。此方法大大提高了用戶之間的協作機會。此外,固有的模塊化系統之間的連接,允許未來介紹更新的新功能具有更多的靈活性。
克服信息的障礙:一種整合的方式
信息,在其本身,是平衡決策的基礎,這是DCIM文件軟件進場。從本質上講,對于大型零件來說,數據中心運營商捕捉數據中心基礎設施的性能相關信息的能力,在幾十年前就已經具備了。
對于大多數數據中心來說,目前的狀態是可以歸類為數據中心基礎設施管理的是一個獨立和“封閉”的監測,規劃和控制系統的一個集合。通常情況下,有至少有一個軟件工具為每個物理子系統服務:電器、制冷、機械、IT基礎設施、IT資產等。這是在一個相當浩大的基礎上建立的,斷開各種專家用戶和信息系統之間的連接可能導致明顯的嚴重缺乏連續性,經常變化的設想和實施可能有利于某一個地區,但可能會導致在其他領域的相應費用上升。
PUE
例如,數據中心運營商目前的重點便是要提高電源使用效率(PUE),同時需要結合減少能源的消耗和降低能源成本。在表面上,目標都是為了提高效率,這些目標應該是一致的,改善一個地區的效率應帶來其他效益,但這并非總是如此。在許多企業中,負責IT基礎設施和測量PUE數據的團隊與負責支付企業電費和以達到整體能源效率目標的團隊之間并沒有太多的聯系。兩個部門之間沒有適當的溝通,而且他們使用管理各自領域的專業知識和信息系統之間也相互獨立。這樣如果IT基礎設施團隊進行改革,改善了PUE,但卻會導致企業全面能量消耗和成本的增加。
例如,IT團隊正在尋求改善PUE,將PUE值從1.9降低到1.7,并決定采用最好的辦法提升電腦室空調(CRAC)出口溫度幾度。由于PUE是轉換效率指標,是比較由IT資產消耗的能量和配套設施傳遞的能量(PUE值為2僅僅意味著,每傳遞1千瓦時的IT負載需要消耗電力2kWh),而額外傳遞的能量則用于創建和提供的冷空氣使服務器保持適當的溫度,這樣就增加了機房空調溫度,減少配套設施,提高了能源轉化率。
這種戰略是成功的,并且也確實改善了PUE值,但有一個意想不到的后果。隨著暖空氣到達服務器,這些服務器的配套設備必須做更多的工作,以保持服務器冷卻。在這種情況下,服務器所消耗的額外的能源遠遠超過了通過降低機房空調溫度而節約的能源。基本上,IT團隊雖然達到了他們的度量指標,但整體數據中心的能源成本將會更高。
綜合方法
將用戶,部門和信息系統連接起來可以允許一個更加平衡和全面的方法來有效的進行數據中心基礎設施管理。
鑒于相同的PUE/能源效率方案,通過整合系統預期的變化可以模仿PUE和能源效率的潛在影響。IT團隊可以發起一個討論,與基礎設施小組討論以確定相關的方法,達到PUE的目標。但也認為,其間接影響能源消耗和成本。而機房空調溫度仍然可以增加,團隊集體確定從服務器到機房空調的管道的熱量,而不是允許混合的數據中心的空氣,創造一個更好的平衡,PUE仍然不斷減少,而整體能源使用和成本效益也得到了改善。
整合數據中心基礎設施管理帶來改善的洞察力和決策支持
上面介紹的PUE的例子僅僅是旨在說明模塊化和整合數據中心管理解決方案的潛在好處,作為一種積極和有效的數據中心管理手段。一套完整的數據中心基礎設施管理的實施可以成為跨所有數據中心的業務流程,包括資產管理、變更和容量規劃、危機管理、能源和資源的可持續性,以及始終存在的財務管理的挑戰,提高洞察力和決策支持的關鍵連接點。
較之孤立的獨立部分系統或通用的單片機系統,整合數據中心基礎設施管理的方法利用模塊化和開放的數據和信息的連接。為每個專家用戶提供了正確的信息,并提供了實現這些用戶連接和協作,實現平衡的機會。