當數據中心運維人員在對基礎設施(從服務器到環境設備)進行監控的時候,似乎沒有結束的時候,因為設備總是在不斷的增加,要做到實時監控,著實不易。在下面,我會為大家講講如何改善您的數據中心監控系統,包括如何提高安全性和可擴展性。
說到基礎設施監控,運維人員似乎就會有大量工作要做。從服務器到設備的監控,有時候是主機的監控,這往往是一項很難兼顧,特別是如果您是在一個大型數據中心而言,監控是一項日常基本的工作。通過監控獲得您需要的數據,可以提高數據中心的安全性和可擴容性,高度自動化可以將資源與容量需求快速匹配。以下五個技巧可以幫您快速了解不同數據中心監控工具與策略。
制定主動監控的策略
數據中心管理員應該努力做到主動,在最終用戶甚至不會注意到之前預測問題,而不是等到問題出現再解決問題。 但是,如果沒有適當的數據中心監控工具和策略,這可能很難做到,根據專家Jim O'Reilly說,為了最大限度地減少數據中斷,通過收集和分析存儲,網絡和服務器操作的數據,找到升級系統的最佳時間。 當涉及到存儲升級,你需要在固態盤、SATA盤、組裝硬盤或網絡存儲中做出選擇,當你最終購買的時候,你會發現大部分數據中心都會買固態盤。這對實時監控網絡、查找延遲可擴容的余量,顯示重組后的工作負載很重要。
(solid-state drives:固態驅動器(SSD,也稱為固態盤)是使用集成電路組件作為存儲器永久存儲數據的固態存儲設備。 SSD技術主要使用與傳統塊輸入/輸出(I / O)硬盤驅動器(HDD)兼容的電子接口,允許在常見應用中進行簡單替換。 此外,新的I / O接口,如SATA Express和M.2,已經被設計為滿足SSD技術的特定要求。)
明知地選擇主機監控工具
由于主機產生大量的詳細數據,為監測帶來了別樣的挑戰。根據主機專家Robert Crawford的說法,三種類型的主機工具可以幫助克服這一挑戰。實時監控最大的優勢:實時監控主機系統。 然而,實時監控也會產生費用,如果使用方法不對,可能會降低性能。 運維人員可以在短期內用監視器來追溯故障排除問題,但監控系統并不能很好的解決恢復數據的問題。最后,后處理器(如MXG)可以跟蹤趨勢,匯總數據和容量規劃 – 想看到這部分數據不是立即可以看到的,它需要時間將所有數據進行分析、計算,需要提前一天提出看的請求。
遠程監控服務
隨著分支機構和邊緣數據中心的普及,遠程監控成為許多管理員的選擇。有一個數據中心的監控工具可以實現這種遠程功能。就是惠普公司(HPE)和戴爾等公司的服務器產品支持的智能平臺管理接口(IPMI),這是為遠程服務監控量身定制的,并且讓能讓運維人員了解系統的溫度,電源和其他指標,以及可更換單元的庫存數據;集成的Dell Remote Access Controller支持基本的IPMI功能,但還包括高級功能和集成選項,包括Dell服務器的系統清單,運行狀況監控和遠程存儲設備配置;Integrated Lights-Out基于IPMI技術,并結合了增強遠程服務器監控和管理功能的功能,如對惠普產品的API訪問以及高級健康檢查。
(智能平臺管理接口(IPMI)是一組自主計算機子系統的計算機接口規范,提供獨立于主機系統的CPU,固件(BIOS或UEFI)和操作系統的管理和監視功能。 IPMI定義了系統管理員用于計算機系統的帶外管理和監視其操作的一組接口。 例如,IPMI提供了一種管理計算機的方法,該計算機可以通過使用到硬件的網絡連接而不是操作系統或登錄外殼而被斷電或以其他方式不響應。)
使用每日事件記錄工具跟蹤服務器活動
Windows事件日志文件會包含一些有價值的信息,但如果同時有多個服務器,找尋著些信息就會變得很難。幸運的是,有監控這種大量日志文件的工具 ,專家Adam Fowler 坦言,IT團隊需仔細選擇一個來滿足他們的需求。免費選項包括Microsoft Windows事件查看器 - 一個基本工具,允許你從多個計算機收集和讀取日志文件 - 以及更復雜和具有更高級功能的syslog和ELK堆棧。 例如,ELK堆棧(包括Elasticsearch和Logstash等工具)允許管理員從SQL和其他來源收集應用程序特定的日志。如果您愿意支付費用,SolarWinds Log&Event Manager和Splunk在內部或作為服務提供 詳細信息和警報,但可能需要更大的IT團隊來管理。
(備注:ELK, ElasticSearch是一個開源分布式搜索引擎,它的特點有:分布式,零配置,自動發現,索引自動分片,索引副本機制,多數據源,自動搜索負載等。
Logstash是一個完全開源的工具,他可以對您的日志進行收集、過濾,并將其存儲供以后使用。
Kibana也是一個開源和免費的工具,它可以為Logstash和ElasticSearch提供日志分析的web界面,可以幫助您匯總和搜索重要數據日志。)
利用Linux工具的優勢
正確配置后,Linux數據中心監控工具可以幫助你順利操作數據中心。例如,Cacti是一個免費開源工具,允許用戶在任何時間間隔檢查服務,以可讀圖形格式顯示信息。 Nagios是另一個免費工具,非常適合需要監視數據(如網絡流量和溫度)的復雜環境中的數據中心管理員。 然而,根據專家Jack Wallen的說法,這兩種工具都不是插入式系統。 你需要投入數小時的工作來正確配置它們,但如果你付出努力,你會得到一個為你的特定需求定制的工具。