以云計算服務為核心的數據中心運維管理,是一種新型的管理理念,數據中心運維管理是數據中心生命周期中最后一個也是歷時最長的一個階段,從前期應用架構設計、軟硬件資源配置評估、應用服務性能瓶頸評估到安全防護和系統優化等工作,都需運維人員全程參與。
云計算服務的運維管理集中體現在對云計算服務生命周期的管理。服務的生命周期在IT服務的標準ITlLv3中有明確定義,其核心架構是基于服務的生命周期。服務的生命周期以服務戰略為核心,以服務設計、服務轉換和服務運營為實施階段,以服務改進來提高和優化對服務的定位及相關的進程與項目。
IT運維領域迫切需要對以云計算為核心的下一代數據中心提供更好的運維支撐解決方案,將各種先進的運維管理技術進行有效的整合,對新增虛擬網絡、數據存儲、虛擬機、宿主機、集群對象采用全新管理方式,從日常監控、周期巡檢、服務受理、故障處理、平臺維護、配置管理、安全管理等方面著手,利用自動化運維工具,實現對物理資源、虛擬資源統一管理,提供資源管理、統計、監控、調度、服務管控等端到端的綜合管理能力,從而實現對云數據中心統一、便捷、高效、智能的一體化運維管理。
業務導向放首位
根據國家標準化管理委員會下發的文件,運行維護服務是供方依據需方提出的服務級別要求,采用相關的方法、手段、技術、制度、過程和文檔等,針對運行維護服務對象提供的綜合服務。為確保提供的運行維護服務符合與需方約定的質量要求,供方應具備實施運行維護服務的基本條件和能力。
云計算體系下的運維目標首先應該以業務為導向,如新業務的快速部署、系統容量的平滑擴容、隨需而變的資源分配等,保證服務達到要求的等級標準,根據業務目標形成IT服務的管理目標。其次通過自動化的運維工具完成系統預備、配置管理以及監控報警等功能,降低故障發生率,提升故障發生后的響應處理效率,實現業務的快速恢復。最后通過改進運行維護服務能力管理過程中的不足,持續提升運行維護服務能力。
打造智能化運維管理模式
數據中心需要建立集中高效、性能優質、快速響應的智能一體化運維生產管理模式,對數據中心的網絡、系統、設備、設施,實行集中監控、集中IT平臺支撐、垂直專業管理、統一運行調度。建立合理的運維服務管理制度,包括完善的管理組織結構、明確的崗位職責、人員素質能力要求、工作流程和管理制度。建設智能集中監控信息化平臺,包含集中動環監控系統、集中網絡監控系統、集中電子運維系統、集中IT運營支撐等系統,實現可用性、安全性和預警控制。建立降本增效、綠色節能的效益管理模式。
為保證故障響應、解決問題和交付結果可控,供方應在人員管理和崗位結構以及人員的知識、技能、經驗、安全意識等方面滿足所需水平,組建掌握網絡、動力、安全、消防、IT軟硬件等核心專業技術的運維支撐隊伍。
云計算技術將為運維體系帶來新的理念,通過一體化、自動化、智能化的IT系統,將傳統運維工作中的大量簡單、重復性的手工工作通過軟件實現,使運維人員有更多精力、條件,投入到整個服務生命周期當中。IT運維服務企業需要構建完善、成熟的IT運維服務體系,從制度、流程、人員、技術、資源等方面入手,不斷提高IT運維質量,實現高效運維。