所有IT部門都在處理一些基礎(chǔ)設(shè)施出現(xiàn)的問題,例如服務(wù)器、網(wǎng)絡(luò)和應(yīng)用程序出現(xiàn)的問題,他們必須盡快做出反應(yīng)。這些情況具有破壞性和迫切性,并可能導(dǎo)致停機(jī),從而影響整個(gè)組織的運(yùn)營和利潤。根據(jù)去年的報(bào)告,企業(yè)平均IT停機(jī)成本高達(dá)155萬美元。更麻煩的是,這將導(dǎo)致企業(yè)每名員工每年545小時(shí)的生產(chǎn)力損失。
出于這些原因,企業(yè)越來越多地投資于應(yīng)用程序性能監(jiān)視(APM)和服務(wù)器監(jiān)視軟件以及其他解決方案。由于企業(yè)需要采用基礎(chǔ)設(shè)施監(jiān)控解決方案,因此其問題是需要使用哪些工具。
Romexsoft SysOps公司的技術(shù)支持工程師列出了這些工具列表以供參考。
審查最佳IT基礎(chǔ)設(shè)施監(jiān)控工具
服務(wù)器和網(wǎng)絡(luò)監(jiān)控工具的目標(biāo)是確保全天候穩(wěn)定的IT性能,并在出現(xiàn)任何問題時(shí)提醒企業(yè)IT支持人員。這樣,就可以最大限度地延長正常運(yùn)行時(shí)間,并制定更好的災(zāi)難恢復(fù)計(jì)劃。
一般來說,所有工具都有共性,但都不相同。以下列出了人們認(rèn)為最具競爭力的工具。
1. Zabbix
Zabbix可以說是市場上最流行和最強(qiáng)大的實(shí)時(shí)監(jiān)控解決方案之一。它是開源的,具有一整套功能,并具有可靠的文檔,由活躍的用戶社區(qū)更新和支持。其他好處包括易用性。當(dāng)然,它提供了一個(gè)沒有任何供應(yīng)商鎖定的解決方案。
Zabbix的眾多亮點(diǎn)之一是它能夠預(yù)測流量趨勢,并根據(jù)收集的歷史數(shù)據(jù)提供系統(tǒng)行為預(yù)測。
主要特點(diǎn):
•主動(dòng)監(jiān)控
•容量規(guī)劃
•內(nèi)置Java應(yīng)用服務(wù)器監(jiān)控
•硬件監(jiān)控
•網(wǎng)頁服務(wù)
•虛擬機(jī)監(jiān)控
Zabbix可以配置為各種行業(yè)(從航空航天到金融和零售)提供監(jiān)控解決方案,同樣適用于中大型企業(yè)。RomexSoft公司團(tuán)隊(duì)依賴此工具向客戶提供全天候IT支持。
2. Prometheus
這是行業(yè)廠商最喜歡的另一個(gè)開放源碼監(jiān)控工具,它基于時(shí)間序列數(shù)據(jù)提供詳細(xì)的基礎(chǔ)設(shè)施洞察力。它是監(jiān)控高動(dòng)態(tài)環(huán)境(如AWS中的容器)的可靠選擇。
從本質(zhì)上講,Prometheus擦除指標(biāo),在本地存儲所有樣本,并在數(shù)據(jù)上運(yùn)行其“規(guī)則”以聚合或生成警報(bào)。
Prometheus的主要優(yōu)勢包括:
•它既適用于以機(jī)器為中心,也適用于面向服務(wù)的體系結(jié)構(gòu)監(jiān)控。
•在停電期間,它是一個(gè)完美的“首選”工具,允許用戶快速診斷問題。
•即使在故障情況下(每個(gè)Prometheus服務(wù)器都是獨(dú)立的),也始終可以查看用戶系統(tǒng)統(tǒng)計(jì)信息。
3. Grafana
Grafana是一款出色的免費(fèi)分析和監(jiān)控工具,可用于時(shí)間序列分析。它使企業(yè)能夠創(chuàng)建有吸引力的數(shù)據(jù)可視化,以便一目了然地了解全局。特別是,企業(yè)可以可視化系統(tǒng)CPU、內(nèi)存、磁盤和I/O利用率等指標(biāo)。該工具非常通用,企業(yè)可以創(chuàng)建自定義儀表板,其中包含來自不同數(shù)據(jù)源的數(shù)據(jù),并將它們設(shè)置為圖形、單一狀態(tài)、表格、熱圖或自由文本。
Grafana可以與Prometheus、Graphite、InfluxDB、MySQL、PostgreSQL和Elasticsearch輕松集成。可以使用插件連接其他數(shù)據(jù)源。雖然Grafana不是一個(gè)獨(dú)立的解決方案,但它是一個(gè)值得考慮的監(jiān)控系統(tǒng)的好插件。企業(yè)的團(tuán)隊(duì)利用與Grafana集成的Prometheus作為許多客戶的解決方案。
4. ManageEngine OpManager
ManageEngine OpManager是一款全面的性能監(jiān)控工具,可提供服務(wù)器監(jiān)控,并允許企業(yè)主動(dòng)管理網(wǎng)絡(luò)、執(zhí)行網(wǎng)絡(luò)配置和網(wǎng)絡(luò)流量分析。還有應(yīng)用程序性能管理插件軟件。但是,必須在現(xiàn)場安裝才能運(yùn)行。
為了滿足企業(yè)的需求,可以設(shè)置可自定義的儀表板,以監(jiān)控網(wǎng)絡(luò)和指標(biāo)的不同組件。企業(yè)還可以將其用于LAN/WAN監(jiān)控,并接收詳細(xì)的流量路徑可視化,查看帶寬流量測量,并運(yùn)行各種網(wǎng)絡(luò)系統(tǒng)性能指標(biāo)的基準(zhǔn)。
與以前的選項(xiàng)不同,ManageEngine是一種高級工具。企業(yè)將根據(jù)業(yè)務(wù)需求收到定制報(bào)價(jià)。
5. Amazon CloudWatch
通過Amazon CloudWatch,企業(yè)可以更好地了解應(yīng)用程序性能、資源利用率、整體云計(jì)算基礎(chǔ)設(shè)施運(yùn)行狀況,并幫助識別和糾正問題。
CloudWatch使企業(yè)能夠以日志、指標(biāo)和事件的形式收集運(yùn)營數(shù)據(jù)。該工具在AWS公共云和本地服務(wù)器上運(yùn)行,這意味著企業(yè)可以獲得所有資產(chǎn)的真正統(tǒng)一視圖。其儀表板是可配置的,允許管理員指示AWS根據(jù)預(yù)定義事件采取特定操作。
最近將其基礎(chǔ)設(shè)施遷移到AWS云的企業(yè)應(yīng)考慮至少使用此云計(jì)算基礎(chǔ)設(shè)施管理軟件。
6. WhatsUp Gold 2017
WhatsUp Gold 2017是網(wǎng)絡(luò)系統(tǒng)監(jiān)控工具市場上最容易和最可配置的工具之一,即使是現(xiàn)在。
其中一些亮點(diǎn)包括以下內(nèi)容:
•其最新的“升級”版本包括混合云監(jiān)控、實(shí)時(shí)性能、自動(dòng)和手動(dòng)故障切換,以及對分布式網(wǎng)絡(luò)的可見性。
•高度可定制的警報(bào)系統(tǒng),包括電子郵件、文本、延遲警報(bào)、IFTTT發(fā)布、服務(wù)重啟和Web警報(bào)。
•自動(dòng)發(fā)現(xiàn)和映射整個(gè)網(wǎng)絡(luò)。
•隨時(shí)隨地查看見解的移動(dòng)應(yīng)用程序。
Whatsup Gold配備了完全可定制且非常用戶友好的儀表盤,可為單個(gè)用戶生成。
缺點(diǎn)是僅限于Windows操作系統(tǒng)支持。
7. Icinga
作為最好的免費(fèi)監(jiān)控工具之一,Icinga是企業(yè)和初創(chuàng)公司的熱門選擇。它的優(yōu)勢在于其為各種規(guī)模的組織提供的靈活性,其重點(diǎn)是監(jiān)控基礎(chǔ)設(shè)施和服務(wù)。
此外,它提供了很好的閾值分析和清晰的報(bào)告和警報(bào)。它們顯示在用戶友好的儀表板上,可通過電子郵件、短信或其他移動(dòng)消息應(yīng)用程序進(jìn)行分發(fā)。此外,它還可以連接到許多流行的DevOps工具,以便為企業(yè)的業(yè)務(wù)需求創(chuàng)建更加個(gè)性化的監(jiān)控解決方案。這些包括Chef、Puppet、Graylog、Ansible等。
8. Datadog
Datadog被設(shè)計(jì)為混合云生態(tài)系統(tǒng)的監(jiān)控服務(wù),但它也可以配置為監(jiān)控網(wǎng)絡(luò)、服務(wù)和應(yīng)用程序性能。實(shí)際上,它附帶了最大的受支持集成列表,企業(yè)可以插入這些集成以接收生態(tài)系統(tǒng)的統(tǒng)一視圖。該工具可以聚合以下指標(biāo)和事件:
•SaaS和云計(jì)算提供商
•自動(dòng)化工具
•數(shù)據(jù)庫和通用服務(wù)器組件
•監(jiān)控和儀器工具
•源代碼控制和錯(cuò)誤跟蹤解決方案
•數(shù)據(jù)庫和通用服務(wù)器組件
用戶可以使用多種圖形、指標(biāo)和警報(bào)選項(xiàng)輕松自定義可視化儀表板和報(bào)告。小型公司可以擁有多達(dá)五臺主機(jī),免費(fèi)獲得Datadog。專業(yè)版和企業(yè)版按主機(jī)數(shù)量定價(jià)。
實(shí)施IT基礎(chǔ)設(shè)施監(jiān)控的好處
只需從工具的描述中,就可以很容易了解使用基礎(chǔ)設(shè)施監(jiān)控的好處。為了進(jìn)行總結(jié),這里列出了企業(yè)可以獲得的確切商業(yè)利益。
基于數(shù)據(jù)而非觀點(diǎn)或預(yù)感獲得見解
任何組織的IT部門都是寶貴的商品,負(fù)責(zé)從人力資源到銷售、營銷、客戶服務(wù)等各個(gè)部門的順利運(yùn)作。通過監(jiān)控,IT專業(yè)人員可以深入了解潛在問題,尤其是隨著組織的發(fā)展,對當(dāng)前系統(tǒng)的壓力越來越大。這些見解將轉(zhuǎn)化為基于可靠信息的建議和決策。
及早發(fā)現(xiàn)問題
使用主動(dòng)監(jiān)控工具意味著企業(yè)將在問題成為災(zāi)難之前收到警報(bào)。小差異和早期警告標(biāo)志將使企業(yè)的IT人員能夠預(yù)測潛在的問題,并阻止它們發(fā)生。
這是一種比災(zāi)難發(fā)生并試圖解決問題之后更具生產(chǎn)力的方法。當(dāng)它們只是一些小問題時(shí)最好得以解決。
計(jì)劃升級和IT預(yù)算
隨著組織的發(fā)展,當(dāng)前基礎(chǔ)設(shè)施的壓力也在增長。仔細(xì)監(jiān)控可以指出在計(jì)劃升級時(shí)要優(yōu)先考慮的區(qū)域。反過來,預(yù)算計(jì)劃也得到了加強(qiáng)。
減少停機(jī)時(shí)間
當(dāng)然這是底線。 停機(jī)會(huì)導(dǎo)致最終用戶的工作效率降低、訂單履行受阻、物流受損、客戶服務(wù)受到負(fù)面影響等。如果這些事情經(jīng)常發(fā)生,就會(huì)發(fā)生業(yè)務(wù)損失。