在本文中,我們將與廣大讀者諸君共同探討業界正在蓬勃興起的對于統一的監控工具需求的宏觀趨勢。其確定了企業業務部門采用這類工具的一系列驅動因素,包括賺取投資回報的關鍵考慮因素。同時,本文還考察了CA Technologies公司的統一基礎設施管理(UIM)解決方案,作為一個監控架構支持敏捷的企業業務需求的一個例子。本文還特別著重考察了CA公司最近的UIM迭代,及其是如何推動體系架構的網絡監控功能和產品的整體可用性的。
企業組織的IT部門經常被組織成多個下屬技術專家小組團隊,以負責管理企業內的某個特定領域,如服務器、網絡、存儲、虛擬化、或應用程序。這種孤立的IT運營操作方法,是管理人員都配備了狹隘的管理工具的專業化的自然產物。只要這些管理人員還繼續這樣管理筒倉孤島,基礎設施運營對于變化的響應將會很慢,而運營工作流將緩慢且不穩定。這種現狀在十年前可能是可以接受的,但許多企業已經發現,他們再也不能忍受這種企業經營狀況了。企業需要簡化IT運營,以支持更靈活的方法來交付新的服務和促進企業營收的應用程序。而實現這一目標的必不可少的成分便是一款基礎架構管理工具集,其能夠打破孤島筒倉,統一監控和工作流程。統一的基礎架構監控工具的時代已經到來了。
統一的IT監控能夠帶來更好的服務質量和敏捷的運營操作
IT基礎設施包括了若干獨立的技術要素,包括網絡、服務器、存儲、虛擬化軟件和應用程序。這其中的每個領域都需要一組不同的專業技能來部署、維護和操作。當然,已經出現了孤立的IT管理員團隊來管理這些基礎架構元素,而每只團隊都在各自的技術領域采用了他們自己的監控和管理工具集。
孤立的管理工具通常會導致一個支離破碎的數據中心運營管理方式,而缺乏一個整體的、端到端的數據中心視圖。當某個關鍵的應用程序運行失敗時,每個小組團隊的管理人員都將依靠其獨立的管理工具來解決這個問題。如果其工具返回報告稱他們技術堆棧的一切都很好,那么,管理員們將把矛頭指向別處。這種方法的問題在于:造成應用程序的性能和可用性問題的根本原因往往隱藏在管理域之間。如果沒有一個終端到終端的管理視圖,運營團隊將需要采用相當耗時的臨時流程來搜尋這些問題的根源。分散的管理模式會導致數據中心的操作運營,缺乏敏捷性,且解決服務質量問題速度較慢。
統一的基礎設施管理和監控工具為這種分散的IT操作運營提供了一種替代方案。統一的基礎架構監控是管理所有IT基礎架構組件的核心架構,包括了物理和虛擬的元素。其特別側重于統一的系統和網絡監控,這兩個基礎設施領域的管理人員們往往在誰負責的領域應該為一個既定的服務中斷負責方面存在分歧。一款統一的基礎架構監控工具,不僅能夠提供關于IT基礎設施及其所交付的服務的狀態的全貌,同時還提供了一個共享視圖,一個讓數據中心所有的管理域可以在一起查看的共同的數據集。
這種統一的管理環境簡化了操作,使IT企業組織變得更加敏捷,能夠迅速響應業務變化。例如,對于擁有一個孤立的管理架構的企業而言,每當一款新的系統或應用程序被引入到基礎設施時,都必須配置和調整每款單獨的工具。而借助一個統一的監控架構, IT操作運營可以更快地適應這些變化。
敏捷的IT運營需要統一的可視化和架構
在當前這樣一個充斥著移動化、大數據和物聯網炒作的商業環境中,典型的企業組織都想要將其IT部門轉變為一項競爭優勢。企業組織所需要的是能夠迅速提供新的應用程序和服務,且具有卓越的服務質量的基礎設施。事實上,根據企業管理協會(Enterprise Management Associates,EMA)的研究發現,66%的IT企業組織已經開始強調整體服務質量作為衡量成功的一大關鍵指標,遠比終端用戶體驗、應用程序的性能,以及內部服務水平協議(SLA)來得重要。而為了做到這一點,許多企業將需要拋棄他們以前孤立的IT操作運營做法。
統一的基礎設施監控為數據中心的運營團隊提供了他們專注于服務質量和敏捷性所需要的集中管理視圖。當網絡團隊、服務器團隊、存儲團隊和應用程序團隊都在同一個管理控制臺中使用相同的終端到終端的數據集工作時,他們能夠更有效地協同合作和高效地工作。
許多企業組織都在努力實現統一的IT運營。據EMA的研究發現,57%的企業現在擁有跨職能的流程,以協調存儲、網絡和服務器資源的配置和管理。企業如何遷移到一個更統一的運營模式的例子是部署和采用軟件定義的數據中心(SDDC) ,即一個抽象的基礎設施架構,并能夠為開發人員和企業業務部門的人員提供可編程設置的資源。據EMA的研究顯示,49%的受訪企業認為從單一控制點進行集中管理是一款SDDC的最重要的一個方面。此外,34%的受訪企業表示缺少這樣集中化的控制是由一家IT組織內的筒倉孤島引發的關鍵痛點。
業務驅動的統一基礎設施監控
盡管一款統一的基礎設施監控架構對于許多企業的IT決策者們而言是具有邏輯意義的,但他們仍然需要該技術具備商業案例,因為這些工具的采用涉及到需要進行大量的資金投入和人員的調整。因此,重要的是要了解該技術所能夠為企業帶來的潛在的投資回報。而統一監控能夠帶來兩大首要的回報:首先,且可以幫助企業降低運營開銷。其次,其能夠使得IT部門更快地響應業務需求。
統一監控簡化了IT運營
統一監控以多種方式降低了企業數據中心的運營成本和復雜性。借助對于服務器、存儲、網絡和應用程序的廣泛的可見性,管理員可以在這些技術領域之間進行邏輯連接,并查看他們是如何進行相互作用的。由于不同的基礎設施資源一起工作,以共同提供服 務,管理人員們能看到這些不同的資源在何處失調錯位了。他們可能會將其識別為一款應用程序在聯網環境中編碼不正確;或者他們可能會發現,對于某一款應用程序的網絡策略與另一款相互沖突,從而導致了服務中斷。而借助一個共享的數據集,數據中心的操作運營可以花費更少的時間迅速找出原因,并縮短平均修復時間。
當操作運營團隊訪問該整體基礎架構堆棧的統一視圖時,其也能夠更迅速的檢測問題。數據中心可能會突然采取更加積極主動的監控,在用戶投訴之前發現問題。例如,一個網絡往往趨于自我修復,可以掩蓋一個問題。如果一個鏈路發生故障時,網絡通常會繞過故障線路。對于一只孤立的網絡團隊而言,該鏈路故障可能看起來相對比較良性:網絡仍然正常運行,也沒有人抱怨服務中斷。所以,網絡管理人員會把鏈路修復工作排在低優先級。但是,如果該鏈路故障影響到了財務應用程序,且該財務應用程序只是在每季度末時才會大量使用。那么,當季度末來臨,財務部門可能會經歷一次令人討厭的驚喜,因為屆時網絡將無法處理應用程序的流量。而統一的監控架構則將能夠更早的連接到該點,并預測到這樣的問題。
一款統一的基礎設施監控工具最終的操作運營優勢在于對監控平臺的整合。企業的行政管理團隊可能會守住他們的一些孤立的傳統工具。但是他們所需要的這類工具會越來越少。鑒于每款監控工具都需要進行維護、管理培訓和偶爾的升級,分散的工具集的成本是相當昂貴的。統一的可視性和架構,使IT更適應業務
除了改善操作運營,統一的監控還為一家IT企業組織帶來了額外的敏捷性方面的優勢。終端到終端的監控方法,使IT企業組織能夠更好的響應業務部門管理者的需求。在當今的商業環境中,企業已然認識到迅速走向市場的時間是推動一項新的服務獲得成功和盈利能力的一大關鍵因素。因此,一家IT企業組織必須能夠快速有效地支持新的服務。統一的基礎設施監測可以通過簡化新的應用程序和服務在基礎設施上部署和調試的過程來支持這些目標。在數據中心推出新的應用程序的過程可能需要幾個月的調試時間,通過調整基礎設施,以確保性能、可靠性、可擴展性和安全性。 一個只有分散的監測工具集的孤立的IT運營團隊支持新的服務方面將會很慢。然而,一個具備了一款終端到終端的統一的監控架構的數據中心運營團隊對于其基礎設施是如何支持新的應用程序的將有更好的可視化。其還將配備微調基礎設施,以快速成功的交付服務所需的可視化和專業知識。
DevOps團隊,包括了調整應用程序實踐的開發人員;以及通過IT運營操作以實現新的應用程序和服務的快速部署和迭代的人員。該團隊在企業組織內部的重要性已經變得越來越凸顯。企業正圍繞著支持新的應用程序和服務的快速部署的DevOps實踐,來重新調整他們的數據中心。根據EMA的研究顯示,70%的企業都制定了相應的計劃,方便其開發人員可以更好的充分利用數據中心基礎設施。IT企業組織將越來越多地推動數據中心基礎架構的可編程性,以支持敏捷的IT運營。確保編程成功,企業將需要統一基礎設施監控的全棧可視化。
IT部門還可以通過預測問題并在這些問題對服務造成破壞之前解決這些問題,來更快地響應業務需求。太多的IT運營團隊花費了大量的時間來響應服務中斷;而在新業務舉措方面花費的時間又太少了。統一的基礎設施監控架構可以讓這變得更加一目了然。如果企業有足夠的智能分析,他們就可以用其所收集的數據來預測問題,并就這些問題對IT運營人員發出警告,這樣IT運營人員就可以在這些問題擾亂業務之前,采取積極主動的措施來修復基礎設施問題。
CA公司的UIM方法
CA公司的統一基礎設施管理(CA UIM,即以前的CA Nimsoft監控器)是一款支持多領域、多家供應商的解決方案,能夠監控服務器、網絡、應用程序、數據庫、存儲系統、用戶體驗、公共云和私有云。 CA公司的UIM產品的戰略方針是特別注重易用性,用其跨所有管理域的直觀界面,簡化了用戶體驗。CA還強調了保持全面和統一的方法,以進行基礎設施的性能管理的重要性。最后,CA專注于提供全面的分析,以便將其UIM產品與其他監控產品進行區分。
一個可規模化和可擴展的架構
該款CA UIM架構具有一個單一的后端消息總線,允許新的監測功能進行簡單的集成。消息總線與應用編程接口(API)作為一個抽象層和一個發布/訂閱互換,其中在UIM內的監視組件可以彼此以及與核心系統交換信息。
許多供應商競爭對手將監控功能作為一款獨立的應用程序進行開發,使這些應用程序具有自己的數據庫、應用服務器和Web服務器。這些供應商都必須在他們的架構上為每款獨立的應用程序打造單獨的連接器,以提供一個統一的管理平臺。而CA UIM的單一總線架構則移除了對于單獨應用程序的需要。新的監控功能添加到產品本身。消息總線組件也保證了CA UIM跨不同監控功能的一致的外觀和感受。
CA UIM架構的第二個組成部分是其hub樞紐,將UIM的可視化架構組件連接到消息總線的軟件——包括儀表板、報告、報警服務器。在數據采集方面,CA UIM機器人組件在由UIM管理的特定設備上收集和共享信息。每個機器人都有多個關聯探針提供對于管理設備上的各個組件的可視化。
這種簡化的架構還支持一個可高度規模化的監控解決方案,覆蓋了范圍廣泛的供應商和設備。CA UIM可從100款設備擴展到超過10萬款設備。其開箱之后支持140多款設備和平臺,具備讓用戶根據需要,自助認證的新設備的功能。CA還特別注重這一UIM的網絡監控功能在覆蓋的廣度和深度方面的擴展。
圖1、CA UIM架構
CA UIM是專為跨功能的數據中心運營團隊的使用而設計的。其提供了基于角色的監控視圖,根據數據中心的各個管理專業領域對設備和軟件實施管理。其還提供了跨孤島筒倉的可視化,使操作運營團隊可以監控整體服務。通過讓每個人都能訪問相同的數據集,CA UIM劃分了企業組織的孤島筒倉。處理事件的傳統IT工作流程實踐方法和從一個管理域到另一個的票被刪除。在此處興起的是一個更有效的系統,其中網絡、服務器、存儲和應用程序的專家們在一起借助一款通用的管理工具作為一只綜合團隊工作。
CA UIM演變為支持敏捷的企業
CA公司一直專注于提升UIM的功能,以支持靈活的數據中心運營團隊,特別注重于推進對于架構、分析和增加了整體可用性的產品的網絡監控功能。
例如,在過去的一年,UIM的簡單網絡管理協議(SNMP)收集器便通過利用CA的功能強大的電子健康庫得到了增強。其現在支持成千上萬種類型的設備和數百家供應商。還提供了一個自助認證的功能,使得用戶現在可以授權給一款并非已經由UIM支持的設備。該功能為新設備提供了同一天的支持,用戶不再需要等待工程師為他們的設備提供認證授權。
CA UIM也在統一服務管理界面提供了一個新的簡化的SNMP可視化和網絡流數據。借助這個接口,改進的工作流程被啟用,使得運營人員們可以快速地通過一個單一的屏幕了解什么樣的主機和流量類型正在關鍵網絡接口和鏈路上消耗帶寬。
在分析和可用性方面,CA公司還為其報告和警報功能增加了動態閾值和預測分析。為了減少可能產生的警報數量,以盡量只生成最重要的警報,UIM現在可以在某個關鍵性能指標(KPI)超過一個固定閾值之前,只通知用戶剩余的時間,為客戶提供了一個會潛在的影響性能的問題的早期預警系統。另外一個指標讓用戶可以設置當一個KPI超過一個閾值多長時間,就應該生成警報的參數,允許IT只為持久性問題生成報警條件。最后,一 個新的“健康指數”指標通過從0到100的簡單的計分,為客戶帶來了一個快速識別不健康的IT基礎設施的簡單方法。隨著基礎設施的性能開始下降,無論是快是慢,該技術健康指數也將下降,從而使IT運營人員們能夠迅速集中于管理環境中的不健康的項目。這種替代方法凸顯了問題設備以及那些需要IT操作運營人員通過個別警報跟蹤而進行運行狀況手動干預的設備。
對于報告方面,新“Situations to Watch”報告的引入,能夠在發生狀況之前,揭示可能出現問題的領域,防患于未然。而“十大問題(Top Ten)”和“概覽(At a Glance)”報告則直接引導管理人員進入感興趣的基礎設施領域。
UIM也獲得了對于Hadoop和Cassandra的監控探頭的大數據業務的額外的監控可視化,而MongoDB也在考慮中。該產品還獲得了更新的公共云可視性,擁有增強的亞馬遜網絡服務(Amazon Web Services)監控功能。
EMA觀點
一直負責支持敏捷的企業業務的IT部門會發現,孤立的基礎設施管理是站不住腳的。這些企業希望能夠充分利用他們的基礎設施的投資,以提高他們自身在當前無情的商業環境下的競爭力。這迫使他們需要更快的交付應用程序和服務,因為產品和服務更快的上市時間日益成為一大具有競爭力的區別性優勢。企業的DevOps舉措——應用程序開發和基礎設施的運營團隊的整合,以便能夠通過基礎設施快速的交付服務已成為滿足這種需要的敏捷基礎設施。如果IT運營團隊將在這樣的環境中交付服務,他們需要更換或增加他們的孤立的管理技術,從而提供一套統一的基礎設施管理工具集。一個孤立的管理方法過于注重個人管理領域的良性健康運轉,但現如今則更應該注重整體性的服務保證。敏捷企業需要服務保證團隊,而不是多個管理單位互相指責別的領域。
業務作為一個統一的基礎設施管理方法的驅動力幾乎是不言而喻的。通過打破數據中心運營團隊內部的各個部門,這樣的工具可以為每個專家提供廣泛的,共享的可視化,消除相互指責,并帶領問題的快速解決。當這些工作團隊使用相同的監控工具一起工作時,他們可以更加積極的實施監控,并在相關問題影響到整體服務質量之前及時發現他們。這種單一平臺的方法還減少了需要維護的工具,從而減少了開銷。
這種方法為企業組織所帶來的柔和的投資回報形式是使得一家IT企業組織能夠更快地響應業務。隨著新的創收應用程序的引入,統一的監控工具能夠從一個服務質量的視角帶來這些應用程序的簡化的部署。企業的DevOps團隊將能夠調試應用程序,并更為迅速的調整基礎設施。
CA技術公司的統一基礎設施管理(UIM)是一款領先的解決方案,滿足了那些敏捷DevOps企業的需求。借助這一獨特的架構方法, CA技術公司提供了一款可擴展的和高度集成的統一管理平臺,強大的功能重點聚焦在現代數據中心的最重要的部分:網絡監控和服務器監控。IT企業組織已經充分認識到,如果他們需要支持敏捷的企業業務的話,就需要打破原來的孤島運作模式。為了實現這一點,他們需要真正的具備統一架構的終端到終端的基礎設施監控平臺。這樣的平臺需要易于使用,并能夠鼓勵跨功能團隊與IT的合作。CA技術公司最新的UIM繼續在打破企業組織孤島方面帶來了創新,幫助IT企業組織支持敏捷企業所需要一個創新的方法。
關于CA技術公司
CA技術公司創建的軟件為企業組織的轉型提供了動力,使他們能夠抓住應用程序經濟的機會。在現如今的每個行業中,軟件是每家企業的核心。從規劃、開發、到管理和安全,CA技術公司正在與世界各地的企業合作,以通過移動化、私有、公共云、分布式環境和大型機環境來改變我們的生活、交易和交流的方式。欲了解更多信息,請訪問www.ca.com。