如今,數(shù)據(jù)中心基礎設施管理(DCIM)在數(shù)據(jù)中心的應用并不是什么新生事物,但隨著其日益成熟,其采用也將日益廣泛。隨著數(shù)據(jù)中心運營管理者尋求提高效率和可用性的方法,同時降低運營成本,他們正在考慮利用DCIM軟件來實現(xiàn)。行業(yè)專家預測在未來三年,DCIM將以每年15%的速度增長,因為很多組織希望提高原有數(shù)據(jù)中心的效率,并降低運營成本。
如果組織還沒有實施DCIM,那么其數(shù)據(jù)中心的各種信息可能散布在多處。其信息分布在眾多電子表格和應用程序中,每個電子表格都有不同的所有者。此外,將所有這些信息保存在不同的地方是很困難的,如果發(fā)生沖突,幾乎不可能知道哪個文檔包含正確的信息。即使在更好的情況下,跟蹤其資產(chǎn)和環(huán)境信息通常總是提供不盡人意的結(jié)果。
在選擇DCIM產(chǎn)品之前,組織必須了解自己想要實現(xiàn)的目標。大多數(shù)DCIM產(chǎn)品可以提供資產(chǎn)生命周期管理、機房容量規(guī)劃、電力和溫度監(jiān)控、電力和網(wǎng)絡映射,以及圍繞內(nèi)容分析和趨勢分析等功能。但是,除非組織向DCIM提供必要的資源,否則可能只會實現(xiàn)一部分目標,甚至會讓人質(zhì)疑其真正價值。
要想實現(xiàn)DCIM可以提供的所有內(nèi)容,執(zhí)行所有的前期規(guī)劃和提供保持數(shù)據(jù)當前所需的資源至關重要。
很多組織開始使用DCIM,即使在組織選擇產(chǎn)品之前,也需要確切地定義了其希望從DCIM獲得的東西。首先這樣做,使得選擇最適合組織需求的解決方案的過程變得更容易。組織希望部署的DCIM能夠幫助跟蹤和管理數(shù)據(jù)中心的所有基礎架構(gòu)和IT資產(chǎn),并通過同步來更新組織的配置管理數(shù)據(jù)庫(CMDB)。
組織配置管理數(shù)據(jù)庫(CMDB)與其DCIM同步,通過消除保留兩個獨立記錄的需要來減少錯誤。組織還要求DCIM能夠監(jiān)控整個數(shù)據(jù)中心的溫度和濕度,實時識別熱點和冷點,并監(jiān)控數(shù)據(jù)中心設備以跟蹤利用率,并確保冷卻負載均勻分布。
為了充分跟蹤和平衡數(shù)據(jù)中心機架的電源負載,還要求機架內(nèi)IT設備能夠?qū)?shù)據(jù)傳輸?shù)紻CIM中,從而允許使用實際數(shù)據(jù)對計劃配置進行驗證。另一個要求是配電單元(PDU),機柜分配單元(CDU)和不間斷電源(UPS)向DCIM提供實時數(shù)據(jù),以幫助識別過度使用的配電系統(tǒng)的任何部分。
對所有電源連接和網(wǎng)絡連接實施映射以記錄上游和下游的依賴關系是至關重要的。這將幫助組織快速識別受計劃更改或意外中斷影響的系統(tǒng)。由于這是高度虛擬化的,所以DCIM能夠連接到VMware vSphere實例,將工作負載映射到數(shù)據(jù)中心的特定位置非常重要。組織還通過儀表板和報告能夠輕松解析正在收集的數(shù)據(jù),提供利用率報告,并計算電源使用效率(PUE)。
將所有這些數(shù)據(jù)存入DCIM,確保其準確性并不容易,并且也不會一蹴而就。如果組織想從DCIM中提取有意義的信息,那么把資源投入到實現(xiàn)和持續(xù)的操作中是非常重要的。
一些IT和數(shù)據(jù)中心工程師需要執(zhí)行操作任務,但隨著數(shù)據(jù)中心的DCIM項目的實施,組織發(fā)現(xiàn)采用專用資源來負責,并根據(jù)需要來分配額外的資源是非常重要的。因為IT部門負責人需要考慮數(shù)據(jù)中心所堆疊的技術。一般來說,IT工程師一般只關心他們的設備運行情況,而數(shù)據(jù)中心的工程師則專注于數(shù)據(jù)中心空間和機架,以及電源和散熱設備的運行情況。
而承擔數(shù)據(jù)中心管理責任的人員需要思考大局,并讓組織實施DCIM.這個管理人員還需要負責系統(tǒng)的所有收集和饋送的信息,其中包括新入資產(chǎn),不良資產(chǎn)審計,確保系統(tǒng)準確捕獲所有分配的測量結(jié)果,執(zhí)行DCIM系統(tǒng)的更新,并與DCIM供應商合作解決問題等。
當所有的工作都完成之后,組織所擁有的DCIM將成為一個強大的工具,并有效地節(jié)省成本。由于采用DCIM不僅可以顯示數(shù)據(jù)中心實時溫度,而且可以顯示所有機架IT設備的實時溫度,因此運營人員可以提高數(shù)據(jù)中心的環(huán)境溫度,減少為保持冷卻所需的電能。
人們發(fā)現(xiàn),如果冗余電源中斷,那么電力負載超過其容量的故障將會導致意外中斷。組織的基礎設施能力是根據(jù)部署DCIM提供的信息創(chuàng)建的,運營人員可以確切地知道有多少空間和機架容量,以及實時的電源和制冷量。此外,還需要顯著降低成本,因為現(xiàn)在擁有更好的資產(chǎn)庫存,并且可以通過清除未使用的設備來降低維護成本。
為了實現(xiàn)DCIM可以提供的所有內(nèi)容,組織做好所有前期規(guī)劃,并承諾保持數(shù)據(jù)流通所需的資源至關重要。如果沒有這個承諾,那么組織的DCIM將成為一個昂貴的工具,并且會包含陳舊和無用的信息。