DCIM系統可以基礎也可以很龐大。無論哪種方式,當今的數據中心都不能沒有它。
即使在組織選擇了一款數據中心基礎設施管理(DCIM)工具后,依然存在大量問題。事實上,問題會比選定并使用一款產品之前還要多。
判斷DCIM軟件是否能夠達成預期并不容易,或者它是否會提供你需要的信息,而不是大量你無法閱讀或使用的數據。這中間會存在問題、意外和復雜性。
羅馬不是一天建成的
DCIM術語在業內流行了多年,但更有趣的是它目前仍然不能被精確定義。沒有什么可靠的方法來定義什么是好的DCIM,沒有簡單方法來確定何種方式最適合你的運營,也沒有公式來計算需要多少資源來運作整套系統。
一般情況下,DCIM被視為IT與建筑設施功能的組織聚合。目標是提供管理員完整全面的數據中心性能檢查,確保能耗、設備和建筑面積的最佳使用效率。有些組織宣稱他們已經通過DCIM實現巨大的成功。有些則在某種程度上后悔入坑,發現他們在沒有足夠的認識之前就采取了大躍進的嘗試。
最全面的DCIM包允許你從相對小規模開始實施——比如說攻功率測量與電力使用率跟蹤——然后再模塊化添加功能,讓用戶更容易使用這些信息。需要時間與經驗的積累,才能知曉哪些功能是最有用的,所以一口氣購買全套功能的想法,不是一個好方案。
請記住DCIM不會回答所有問題,甚至有時候可能增加困難。例如,查看溫度與濕度這個基本功能。增加對冷卻設備的能力監控來預測潛在問題時十分有價值的,但卻是一個實現起來復雜的功能。
戰略上,安裝傳感器是比較容易的方案,尤其隨著無線技術的發展與應用。測量水流量、流體壓力、泵振動和其他機械參數要求關閉設備并對繁中工作進行整合。即使是通過IP連接空調,把大量數據傳輸到目標結點的任務也是十分艱巨的。
大部分數據是廠商用于性能跟蹤和故障分析使用,而且每個設備都以自己的格式傳輸信息。DCIM系統需要解析數據,并將其與其余的機械應用鏈集成,以提供有用的信息。最全面的軟件方案,應該提供預先編寫的軟件模塊,采集空調機房單元與機房空氣處理器數據,但這需要大量的自定義配置。不僅如此,擁有一個監控機械異常的系統,并且在故障發生前提醒你,是非常有價值的,尤其是沒有冗余設備支持運作的低級數據中心設施。
設備跟蹤在一個關注能源與冷卻管理的系統中似乎沒有意義,但這確是DCIM軟件功能中有用的一部分。設備的部署需要工作人員花時間實現,一旦它被安置,可以切實維護自己——尤其是當射頻識別標簽和其他自動檢測方法支持包含在其中時。
知曉自己擁有什么硬件,硬件使用年限、確切位置和是否被移動,能夠節約大量追蹤時間。集成現代服務器內部的監控數據,也是非常珍貴的。你可能會發現利用率下降的設備,并能夠調查原因來判斷是否重新使用該設備或應用。你還可以選擇將其關閉。
數據是關鍵。這十分必要,但數據也可能是海量的。難道我們真的需要這么多?
區分DCIM之間差異的最大因素是它如何處理海量數據,系統根據這些數據回傳了怎樣的信息,以及這些信息如何有效、易于訪問和連貫性。
好的測試方法是選擇一個普通人,沒有經過專業的IT培訓,也沒有經過系統的特殊培訓,能夠在無須協助的情況下識別報警并采取快速反應。如果不是,則說明圖形用戶界面的邏輯是值得懷疑的。訓練有素的專家很少會在問題出現時左右為難。次要告警——如果正確定義——會根據專家的預測出現故障或失效,但主要告警需要任何人都有資格采取行動,并且擺在數據中心首位。
在產品演示時,需要與銷售工程師模擬一個主要問題,然后撥打某個職員的電話來進一步診斷——在沒有任何援助的情況下。如果DCIM產品太過復雜或者功能與顯示都不夠直觀,那就繼續貨比三家。