數據中心監控為什么要自動化?在我們探討這個問題前,我不可避免的要提到ITL(信息技術基礎架構庫),ITL目前已經廣泛的應用在政府、企業等機構,它是用來幫助IT部門改善服務流程,提升效率的準則,如果能將它用在數據中心監控自動化上,我將不再擔心自動化管理無法衡量與量化。
誠如我剛才所言,接下來,我將為大家具體的介紹一下在數據中心實現自動化的幾種方式。
搜索設備與連接
首先,需要確保你的設備可以通過各種方式各種方式能連網。
接下來 進入子網
輸入IP地址或者域名
通過查找已經連接的設備,你就能在網絡上發現剛才輸入的設備名稱。
指定Active Directory(活動目錄服務)(AD)OU(組織單位),掃描該OU中的計算機設備。
它可以幫你找到不易找到的設備。這種功能也是采用剛才提到的輸入方式,跟剛才提到的子網、IP地址、活動目錄的輸入方式是一樣的。
搜索設備的時候,應盡可能用簡單的方法詢問(設備類型,硬件類型等),查詢設備基本信息,如設備名稱,供應商、型號等信息,詢問時,應詢問這個設備特有的信息特征,而不是單一的查詢一系列的數字信息。 同時,你會發現搜索不僅限于SNMP,對WMI和API同樣適用(Cisco UCS,VMWare和Microsoft Hyper-V等都適用)
最終,要確認設備是否被掃描到?是否已經建立連接?連接后的設備可以在網絡上看到它的所有信息,包括服務器都連到什么交換機,以及連到數據中心哪臺集群服務器或者其它地方的集群服務器 。
自動化探索
剛才那個程序只是通過地址掃描,能不能通過其它方式掃描呢?
接下來掃描整個文件,通過數據中心監控系統定期監控運行狀態
可以設定為以下時間進行加農
每隔幾個小時/每過幾天/每過幾周
每個星期的某一天
每個月的某一天
一天中的某個時間段
除此之外,當程序運行超過一天中某個時間或者運行超過一個固定的時間段后,你可以設定關閉程序。這樣,你就可以避免在掃面程序時濫用數據中心的監控系統,同時,你還可以將整個文件進行分區管理,建立安全、強健的搜索程序,提升搜索效率。
最后,除了按計劃運行之外,還應將掃描設定為由事件觸發。 比如,如果路由器上的接口已關閉超過30分鐘,則應將掃描設置為在接口所屬的子網上觸發,以檢查新接口是否已啟動,以及是否有任何新的遠端設備已上線。不管觸發事件如何,所需的功能是基于數據中心中的實時事件來設置受控發現的。
如何處理搜索到的設備
這給我們帶來了一個問題,當發現新硬件時如何處理? 我們許多人深受其害的是,并不是所有的數據中心硬件都需要監控,即使在高度嚴格的和受控制的環境中,也不是每個出現在子網中的設備都會存在。
因此,首先,希望您的監控系統中已列出通過審核的新設備名單。第二,列出設備特征。第三,獲得篩選某些設備類型的能力; 例如,沒人需要監視CD驅動器的磁盤容量。更重要的是,應該對過濾器中指定一些設備類型是不被監控的。
應用發現
發現硬件設備固然重要,可它對于監控系統而言是最簡單的。從那以后我開始進入IT領域,研究硬件搜索,識別硬件和列舉硬件都已經的標準化,并且可以預測。但應用程序繼續自己的運行規則。想弄清楚什么程序被安裝在服務器上,運行了什么程序以及這些運行的應用都在做什么?時至今日,這依然是一個挑戰,即使對業內人士,同樣是個棘手的問題。
勿需多言,對于大部分程序的供應商而言,它們在不遺余力的維護應用程序的正常運行,保護程序內的配置文件不被修改、提高安全性,保障程序內的個人信息不被泄露等,監控系統能為程序運行提供良好的保障。
那么,如何確保核心業務得到恰當地監控? 除了常規的軟件項目外,有一種形式的數據中心自動化的方式,可保障監控程序簡單操作:角色分配。為了理解這個概念,讓我澄清一些假設:
并不是所有的應用程序都是相等的,即使它們是一樣的。我的意思是,比如我們在DMZ中運行Exchange服務器, 在有防火墻的數據中心運行Exchange服務器,在云中Exchange運行Exchange服務器,雖然它們都是在運行Exchange,可他們在具體運行中的配置文件以及安全需求是完全不同的。在這些形式當中,單一的服務器將在使其使用期限中具有多種使用狀態,使用哪種狀態的同時對應的監控的級別也有所不同:建立與測試對應的生產與停用。
您(即組織中正在請求和配置這些服務器的技術團隊)已經知道使用情況和需求。
考慮到這些假設,希望很清楚,監控自動化需要同一模板或一組應用程序監視組件的多個變體。 但你怎么知道什么時候應用正確的?
答案是使用資產管理系統,配置請求或者您的命名約定中已經包含的信息。 通過使用以下屬性,您可以利用大多數魯棒監控工具的能力,根據角色,狀態,位置等自動分配或取消分配監控:
網絡位置:DMZ,數據中心,數據倉庫,遠程控制等。
配置:建立,階段,測試,試制,生產,關閉等
關鍵業務:1到5
主要用途:SQL(Structured Query Language結構化查詢語言),AD(Active Directory活動目錄),Tomcat服務器,文件服務器等
關聯應用程序:電子郵件,訂單登錄,XYZ_App等
正確應用這些屬性后,您可以繼續進行應用程序監視,而無需頻繁掃描,因為您應用的監視基于您對服務器的預期用途。
什么是云?
所有這些關于服務器和應用程序的討論都可能聽起來很難以金屬為中心,就像在“具有手動安裝的應用程序的舊式裸機服務器”。但實際上,所有這些監視自動化技術都適用于混合IT甚至純云環境 。
基于云系統,監控可以直接(應該)包含在程序的腳本中,以便服務器能夠受到監控系統的保護,從而保護云中的相關數據信息。
還少什么?
精明的讀者可能已經注意到,我剛才講的這些都是圍繞數據中心監控自動化關于搜索、報警的方法。 最好永遠都在后面。因此,你們也不應懈怠,應繼續尋找更多的自動化的實例,從而幫助你降低成本,提高效率,保障應用程序正常運行。