隨著互聯網與云計算的快速發展,中國掀起了數據中心的建設高潮,大型甚至超大型數據中心正在陸續投入使用。根據工信部的統計數據,2011~2013年在建或規劃中的大型數據中心就有255個之多,其中超過10000標準機架的超大型數據中心就有23個之多。
目前的數據中心資產管理方法,主要依靠人工錄入信息、管理工具較為簡單、工作流不清晰,勉強可以應對中小型機房的管理需求;但是,隨著數據中心規模越來越大,需要管理的設備數量急劇增加,傳統的資產管理方式已經跟不上數據中心業務發展的腳步,成為數據中心運維的短木板之一。
傳統的數據中心資產管理方式存在以下問題:
1)海量的資產信息依靠人工采集與錄入資產信息,依靠Access、Excel等工具或小型資產管理軟件來管理,人力成本高、工作效率低下、差錯率高,往往導致資產數據不可用;例如:某ISP運營商下轄數十個數據中心,依靠半手工的方式來管理資產,花費大量人力在資產盤點、報表合并等工作上,費時又費力,還無法保證數據準確。
2)快速變化的IT業務需求導致資產變更成為常態,每個月都有數百甚至數千服務器上下架;而傳統的資產變更過程沒有實現標準化、流程化,難以保證網管中的資產信息能夠及時、準確地變更;隨著時間的推移,資產信息逐漸失真,最終導致如有新設備上架,還需要派人到現場去尋找可用的位置。
3)資產管理粗放,人員職責不清晰,資產數據沒有經過高效地分析與利用,易形成不明資產或閑置資產。因此,業界主流廠家紛紛推出智能、高效的數據中心資產管理解決方案,提供完整的流程控制、資產識別、數據分析等功能,實現對數據中心資產進行有效管控。
智能的資產識別技術可大幅提高資產管理的效率與準確度
數據中心資產管理系統的核心是一個實時刷新、準確無誤的資產信息庫;而資產信息的采集、錄入的準確性往往決定了一個資產管理系統的數據是否可用。隨著數據中心的設備數據增加,資產信息的準確性顯得更加重要。但是,傳統的資產信息采集方式是通過定期的人工資產盤點來獲取,人工差錯不可避免,費時費力。針對這種情況,業界內的眾多廠家也在嘗試各種新的自動化信息采集技術,減少人工參與環節,減少差錯率。目前,應用較廣、較為成熟的資產識別技術主要有:
1)資產條碼掃描技術。一套完整的條碼管理系統主要由標簽、掃描終端、網管等部分組成。首先,在設備進場之前,預先將帶有條形碼或二維碼信息的標簽粘貼在資產上;然后,在設備上線或發生變更時,使用移動式掃描終端對設備上的標簽進行掃描,快速的錄入資產信息;最后,借助無線傳輸技術將現場采集的數據實時上傳到網管中,自動更新系統中的數據。此外,也可以將系統中最新的數據下載到掃描終端中,通過圖形化界面顯示當前位置的資產信息,以便在現場進行資產信息比對、查錯。因此,通過條碼移動掃描技術,大大提高了資產盤點的工作效率,同時避免人工錄入環節,保證信息流和資產實物流的準確對應。
2)機柜級資產識別條技術。資產管理的一大難點就在于確定IT設備所在的機柜U位;針對這一難題,業內的部分廠家推出了智能化的資產識別條。資產識別條可以安裝在機柜的側面,通過內置的ID芯片進行近端通訊,可以識別IT機柜中的每個U位是否被占用,以及占用此空間的設備信息。這些資產位置信息通過資產識別條的通信接口集中上報給資產管理系統,從而完成信息的采集、錄入等工作。通過資產U位的識別,可以精確發現連續可用的U位空間,用于指導刀片等服務器的上下架工作。這種方案的優點在于數據準確性高,及時性好,可以在第一時間內發現資產變更信息,適合對資產精度要求較高的場合。
3)設備自動識別技術。與服務器、存儲等IT設備不同,大多數的UPS、空調等設備做不到被網管自動發現,還需要用戶手工添加到網管中并納入監控。如果這些設備增加電子標簽等信息,主動向網管推送設備信息,則設備就可以在網管上實現自識別、自注冊,自動刷新信息到資產管理系統,極大的簡化了相關工作。目前,業界一些設備廠家已經開始提供并推廣這一方案。
閉環的ITIL流程控制保證資產變更過程的可控、可管
在整個數據中心的生命周期內,不停地有新設備的添加、搬遷、上下電等資產變更事件。據不完全統計,騰訊數據中心的服務器每月啟停4000多臺,業務每月遷移2000多次,硬件每月變更500多次。頻繁的資產信息變更,如果沒有一個可閉環、可跟蹤的資產變更控制機制,則資產信息將逐浙失真,最終變成不可用。先進的資產管理系統應該提供符合ITIL流程要求的資產變更功能,保證資產信息的可控、可管。
變更流程管理:ITIL是國際通用的針對IT服務管理的一個客觀、嚴謹、可量化的標準和規范,其中與資產管理相關性最大的是變更管理模塊。變更管理通過明確地定義資產變更的范圍、優先級、職責與角色、流程與審核點、衡量標準等,在最短的中斷時間內完成變更過程,減少對業務的影響,并保證變更結果及時、準確地刷新到資產信息庫中,過程可回溯可審計。大量的成功實踐表明,符合ITIL標準要求的變更管理可以提高運維效率約25~30%。
數據智能核對:在實際運維中,難免因為各種人為原因而引入有差錯的資產信息數據;如果只依靠人工審核來發現這些潛在的問題,效率低下并且常常達不到預期效果。智能的資產管理系統可以借助大數據分析技術,通過與設備監控系統對接或借助資產識別技術,及時發現與生成設備的上下線記錄;然后,通過與變更管理中的歷史工單數據互相對比,智能識別兩者之間的數據差異,生成問題單。通過資產信息的智能核對技術,可以大幅減少數據的差錯率,提高數據中心的運維效率。
高效地利用資產信息,支撐數據中心的運營
準確的資產數據是數據中心日常運維的基礎之一,而有效利用資產信息,結合數據挖掘技術生成各種資產報表,可進一步滿足實際業務需求。例如,資產數據可以應用到數據中心的容量管理、租戶管理上,實現數據中心資源的最大化利用,支撐數據中心的運維。
容量管理:容量管理是DCIM系統的核心功能之一,目的是通過當前容量統計、分析與規劃,實現數據中心的關鍵資源的高效利用,提高資源利用率; 借助容量管理,數據中心運營方可以充分利用現有數據中心的容量資源,盡量延長數據中心的使用壽命,推遲下一個數據中心的建設計劃,保護企業投資。而容量分析所需的基礎數據,必然包括了準確、實時的資產信息。只有通過資產自發現、自識別技術,掌握各個IT設備的準確位置、運行狀態等信息,建立IT設備與機柜等的對應關系表,才能實時計算出某一個機架的當前可用容量(空間、供電、制冷等);而基于各個機架的容量數據,管理系統通過數據分析與預測技術,生成容量規劃與優化的建議策略。因此,資產數據是支撐容量管理的必備功能之一。
租戶管理:針對數據中心的機架出租業務,智能數據中心管理系統可以為業主提供租戶管理功能,為企業運營決策提供必備的數據報表。例如:管理系統可以通過統計不同租戶的已有資產,形成租戶的資產月度報表(包含用電量、空間占用、設備運維狀態等);業主可以根據這些基礎數據,分析維護每個租戶的成本支出,計算ROI識別高價值客戶,為企業營銷提供決策支撐。而實現租戶管理的一個關鍵環節就是整合資產管理的資產數據庫與CRM系統的客戶信息,形成統一、完整的IT資產與租戶之間的對應關系表。
因此,高效利用資產信息,通過大數據分析技術,可以有效地發現或解決數據中心的運營問題,提升整體的運營效率。
智能化的資產管理是數據中心運維的必然趨勢
近年來,客戶對智能化資產管理的重視度正在日益提升。智能化資產管理可實現高效、準確的資產采集、錄入、跟蹤、盤點、統計,大幅減少運維人力成本,提高了資產利用效率。業界的一些領導廠商也紛紛推出了完善的資產管理解決方案。例如:華為的數據中心基礎設施管理平臺NetEco集成了智能化資產管理功能,提供完整的ITIL流程控制、精確的資產自識別技術,能夠解決大型數據中心的資產管理難題。在筆者看來,隨著更多的資產智能化技術的推出,資產管理在數據中心的運維中將得到越來越多的應用。