有些企業可能會發現,現在只需要基礎功能,但未來可能想要添加更多復雜的工具,其他企業可能覺得在開始最好就部署全功能的NPM,而大多數人介于這兩者之間。在這篇文章中,我們將探討為什么這些以性能為導向的網絡監控系統很重要以及哪些功能最重要。
停機時間正變得越來越不可接受
推動NPM發展的一個明顯趨勢是企業需要快速解決停機時間問題。雖然理想解決方案是創建一個冗余網絡,但在很多情況下,這并不可行。這主要是因為架構本身的限制,無法提供物理冗余或者因為預算有限。當企業無法實現自動故障轉移時,最好的方法是開發和部署高級網絡監控系統平臺,在停機發生時提醒工作人員,或發現可能發生的停機故障。發現問題越快,解決問題就越快。
在某些情況下,這意味著要部署工具來監控網絡設備和個別鏈接。而基于所收集日志消息的警報是另一種常見工具,在其他情況下,還需要一直監控到應用層?,F在,絕大多數網絡監控系統可只監控網絡功能,或者同時監控和警告網絡及應用問題。此外,深度數據包檢測應用可快速發現網絡關鍵點的性能問題。
應用對時間日益敏感
隨著實時協作應用(例如語音和視頻)的顯著增加,以及分布式應用架構的增加,通過網絡傳輸的數據對時間越來越敏感。這樣的話,企業必須發現、標記以及優先處理低延遲性應用的數據流。目前執行這些類型任務的主要工具是服務質量(QoS),2層和3層網絡設備(例如路由器和交換機)配置有QoS政策以及基于這些政策的隊列操作。
理想情況下,QoS會被正確地在網絡中進行配置。但通常情況下,QoS并沒有配置好,或者在數據路徑某處配置不當。這種錯誤可能給時間敏感性的通信造成重大影響,同時,手動發現這些問題通常需要登錄和驗證數據路徑的每個QoS配置。在另一方面,很多網絡監控系統都有QoS分析功能,它們使用NetFlow或sFlow來自動發現無效或不正確配置的QoS政策。
網絡架構復雜性不斷增加
數據中心虛擬化和網絡覆蓋通常會掩蓋潛在的網絡問題。突然之間,管理員會發現他們需要同時處理物理基礎以及對應的虛擬網絡來發現和解決性能問題,而很多IT部門只有工具來監控其中一個方面,即使他們可以監控這兩者,也可能是使用完全獨立的工具。
很多現代NPM可以同時監控物理和虛擬架構,并確定問題發生在哪個網絡層面,這為管理員提供了對網絡的完整可視性。隨著企業添加更多虛擬化和覆蓋技術,這逐漸成為日益重要的要求。
事件關聯和根本原因分析無效
我們都知道,查找和解決網絡及應用問題是一回事,確定問題的根本原因又是另一回事。在非常龐大和復雜的網絡中,企業很可能部署解決方法或變通方法來解決眼前的問題,但并沒有解決根本問題。很多時候,這可能最終會導致企業為解決一個問題而對網絡進行重大且低效的變更,而實際根本問題可能是因為上層問題。
很多網絡監控系統提供智能來收集和分析各種網絡及應用事件。通過這樣做,企業可創建報告關聯到最初問題的起點。如果正確配置和調試,這可幫助管理員關注問題并確定相關信息,極大地減少根本問題的調查工作。并且,由于現代NPM會收集應用層的數據,很多此前未被發現的根本問題現在可能被發現并得到妥善修復。
尋找單窗口監控和故障排除
SNMP監控器、日志服務器、NetFlow收集器和數據包嗅探器“單打獨斗”的日子已經一去不復返了,整合這么多有用的網絡和性能監控工具到統一的系統中將是非常有吸引力的。我們現在可整合所有這些有用的功能到單個NPM產品中,更重要的是,通過單窗口視圖,我們還可以創建單一的數據存儲庫,并通過強大的數據關聯方法來創建報告以及做出明智的決策。