不同的云遷移策略以不同的方式推動業務敏捷性,但投資于監控(特別是應用程序監控)是云遷移清單中列出的這些方案的首要任務:
•適用于將應用程序直接轉換為云計算基礎設施的提升和轉移策略。監視可以指示意外的性能問題。
•針對云中轉換,其中應用程序經過重新設計和優化以在云中運行。添加的監控可以提醒用戶注意新的事件類型和無法預料的容量問題。
•將應用程序部署到多個云平臺時。增加的監控功能可以報告延遲問題,并幫助確定跨多個微服務的復雜事務的根本原因。
監控云計算應用程序和服務可能需要新工具
不幸的是,添加新的監控功能可能并不容易。對于開始采用云計算的組織來說,需要考慮一整套新的監控工具和警報類型。已經投資和運營數據中心的組織可能會發現,用于虛擬化系統和私有云的內部部署工具可能無法用于公共云應用程序、服務以及無服務器計算。即使組織采用多云策略,他們也可能希望利用每個云計算供應商的內置監控功能。這實質上意味著任何云遷移都可能引入新的監控工具。
云遷移的另一個因素是,新用戶通常需要參與配置監控工具和響應警報。例如,新的云原生應用程序可能有開發人員、DevOps工程師和業務所有者的參與,他們是關于監控什么和發生事件時應該向誰發出警報的主題專家。新成員可能使用不同的工作流工具:新的云優先團隊可能使用JIRA和Slack,而數據中心團隊可能使用ServiceNow和Skype for Business。
最重要的是,即使有很好的理由將監控添加到云遷移清單中,也會增加復雜性。當集中監控策略作為云遷移或多云策略的一部分執行時,這可以實現最小化。
實施集中監控策略
通過查看過去如何部署和配置監控工具,企業可以更好地了解集中監控解決方案的需求和功能。
大多數IT運營團隊都從一些基本的監控工具(如Nagios和Perfmon)或平臺(如Solarwinds、Whatsup Gold和OpManager)開始報告網絡和基礎設施。這就是運營團隊應該在響應基礎設施問題方面更強大的原因,但在應對最終用戶、應用程序或數據庫性能問題時歷來表現不佳。
除基礎設施監控工具外,運營團隊更常見的是根據需要添加監控工具。在某些情況下,添加工具是為了響應一系列重復出現的問題,例如,監視不可靠的數據庫是否存在容量和性能問題。在其他情況下,監控與添加新的基礎設施(如新的數據中心位置、網絡、企業系統或存儲設備)緊密相連。添加云計算基礎設施屬于第二類。
在添加新的監控工具時,分配給工程師的工程師通常會配置該工具以設置報告和警報,以便直接發送給其團隊。這可能是快速配置報告和警報的最簡單方法,但從長遠來看,它創建了對信息的孤立訪問,以及多個團隊從不同工具接收警報的可能性。
更好的方法是集中監控。每個監控解決方案都會收集數據,并具有對診斷問題有用的專有報告。但這些相同的監視數據隨后被聚合到一個集中的監視程序中,該監視程序隨后可以在更廣泛的數據范圍內集中執行許多功能。這種集中化有幾個好處:
•可以從多個監控工具對邏輯事件進行邏輯分組。來自獨立監測工具的警報不再盲目地向獨立團隊發送。相反,警報在邏輯上整合為事件,使用更廣泛的數據集進行分析,并智能地路由到正確的團隊進行響應。
•中央系統可以分析可能指示容量、安全性或應用程序可用性問題的不斷變化的趨勢。
•通過集中監控工具可以更有效地實現與工作流工具的集成,而不是在點對點集成中進行連接。
首先通過集中數據和與工作流工具的集成來實現智能化。當組織實施自主操作,并利用開放式機器學習將警報智能分組為可管理的事件時,真正的好處成為現實。
云遷移是實施集中監控的最佳時機
創建集中式監控解決方案的理想時機是將應用程序和服務遷移到云端。企業仍然必須在基礎設施、應用程序和服務級別完成配置監控的過程。但是,企業沒有在這些解決方案中配置升級,而是采取步驟將監控數據和警報集成到中央系統中。這將使工作從在單個監控工具中實現升級轉移到了集中化的工具中。最后,IT運營團隊可以輕松獲得集中化帶來的所有好處。
但這也取決于實施集中監控所采取的方法,并且有幾種策略。實現專有的數據湖和報告工具可能提供最大的靈活性,但它確實需要在開發數據湖或數據倉庫、構建報告、配置警報以及與工作流工具集成方面進行投資。BigPanda等公司通過內置集成、機器學習、自主操作和統一分析提供集中監控。
集中監控功能非常強大,尤其是當機器學習正確地將多個警報關聯到單個事件時,可以更快、更輕松地識別根本原因。這就是在核對清單中包含云遷移中的集中監控的原因。它通過提供更豐富的監控措施來平衡添加基礎設施新功能的風險,而且它可以比在多個監控工具中配置警報更有效地實現。