精品国产一级在线观看,国产成人综合久久精品亚洲,免费一级欧美大片在线观看

當前位置:數據網絡企業動態 → 正文

使用Prometheus監控Cloudflare的全球網絡

責任編輯:editor004 作者:Hrishikesh Barua |來源:企業網D1Net  2017-11-03 11:19:49 本文摘自:INFOQ

Matt Bostock在SRECON 2017歐洲大會的演講中,介紹了如何使用Prometheus實現對CloudFlare分布于全球的架構和網絡的監控。Prometheus是一種基于度量進行監控的工具,CloudFlare是一家CDN、DNS和DDoS防御(Mitigation)服務提供商。

基于度量的開源監控項目Prometheus最早推出于2012年,它是CNCF(原生云計算基金會,Cloud Native Computing Foundation)的成員。Prometheus的動態配置和查詢語言PromQL支持用戶編寫對告警的復雜查詢。CloudFlare提供CDN(內容分發網絡,Content Delivery Network)、分布式DNS和DDoS防御服務,這意味著其架構已擴展到全球范圍。監控這樣的架構及網絡無疑是一件復雜的工作。在演講中,Bostock介紹了Prometheus在其中發揮的作用。在CloudFlare,前期部署的Nagios的職能已有87%被Prometheus所替代。

CloudFlare提供類似于Anycast所提供的CDN服務。Anycast DNS使得DNS查詢可以被最接近用戶的服務器所處理,Anycast HTTP使得內容可以從距離用戶最近的服務提供。作為原始Web站點和用戶之間的中介,CloudFlare還檢查訪問者的流量中是否存在有威脅的模式。它提供了跨150個國家的116個數據中心,每秒處理500萬次HTTP請求,120萬次DNS請求,占全球因特網請求的10%。每個入網點(PoP,Point-Of-Presence)提供HTTP、DNS、DDoS防御和鍵值存儲服務。截至演講時,有188臺運行在生產環境中的Prometheus服務器需要監控。

圖片來源:https://promcon.io/2017-munich/talks/monitoring-cloudflares-planet-scale-edge-network-with-prometheus/

Prometheus是基于度量的,也就是說它采集時序度量,并基于度量構建其余的特性。它工作于Pull模式下,每臺監控服務器運行一個稱作“exporter”的進程,通過HTTP發布所采集的度量。CloudFlare為每個服務域部署了一個exporter,使用它們采集系統(例如CPU、內存、TCP、磁盤等)、網絡(例如HTTP、Ping等)、本地匹配(錯誤信息)和容器/命名空間的度量。其中,exporter使用了Google的開源項目cadvisor采集容器/命名空間的度量。Prometheus并不會永久地保存所有數據,因為它更側重于“此時此地”(here-and-now)的監控情況。數據不做下采樣,并在CloudFlare配置中保存15天。

在CloudFlare的核心數據中心,服務包括日志訪問、分析業務,以及使用Marathon、Mesos、Chronos、Docker、Sentry、Ceph(用于存儲)、Kafka、Spark、Elasticsearch和Kibana等技術棧構建的API。Prometheus在每個PoP通過exporter查詢服務器和服務獲取度量。每個PoP的高可用性是由使用多個Prometheus服務提供的。

Prometheus的報警管理稱為“Alertmanager”。CloudFlare的部署中包括一個Alermanager,由每個Prometheus服務器推送事件,并考慮了配置的高可用性。報警基于歷史數據做測試,確保服務的正確執行的。Bosun等新興監控工具也包括類似的特性。為提供更好的報警服務,其它的一些特性還包括了描述性的名稱、簡單易用性和一些可使接收者立刻采取行動的信息。

CloudFlare團隊使用jiralerts實現JIRA工單系統與Alertmanager的集成。JIRA可以用戶定制工作流,使得報警監控中可以包括一些監控工作流特定的用戶定制狀態。另一個稱為alertmanagere2s的工具接收報警,并將報警信息集成到Elasticsearch索引中,用于進一步的檢索和分析。CloudFlare已為Alertmanger構建了自己的儀表盤,稱為“unsee”。

那么Prometheus是如何監控自身情況的?這有兩種實現方法。一種是混合方法,即在同一數據中心中,由一個Prometheus去監控另一個Prometheus。另一種方法是自頂向下的方法,由頂層Prometheus服務器監控位于數據中心層面的Prometheus服務器。

CloudFlare SRE團隊的經驗是,盡早對環境和集群等的標簽和組身份做標準化;其它一些經驗是關于如何創建可視化,以及從同行和利益相關者生成買入。經驗指出,團隊的盡早參與將有助于服務與監控系統的更快整合。而報警本身則需要多次迭代進行調整和改進,這是一個開展中的過程。

查看英文原文: Monitoring Cloudflare's Global Network Using Prometheus

關鍵字:Prometheus下采樣

本文摘自:INFOQ

x 使用Prometheus監控Cloudflare的全球網絡 掃一掃
分享本文到朋友圈
當前位置:數據網絡企業動態 → 正文

使用Prometheus監控Cloudflare的全球網絡

責任編輯:editor004 作者:Hrishikesh Barua |來源:企業網D1Net  2017-11-03 11:19:49 本文摘自:INFOQ

Matt Bostock在SRECON 2017歐洲大會的演講中,介紹了如何使用Prometheus實現對CloudFlare分布于全球的架構和網絡的監控。Prometheus是一種基于度量進行監控的工具,CloudFlare是一家CDN、DNS和DDoS防御(Mitigation)服務提供商。

基于度量的開源監控項目Prometheus最早推出于2012年,它是CNCF(原生云計算基金會,Cloud Native Computing Foundation)的成員。Prometheus的動態配置和查詢語言PromQL支持用戶編寫對告警的復雜查詢。CloudFlare提供CDN(內容分發網絡,Content Delivery Network)、分布式DNS和DDoS防御服務,這意味著其架構已擴展到全球范圍。監控這樣的架構及網絡無疑是一件復雜的工作。在演講中,Bostock介紹了Prometheus在其中發揮的作用。在CloudFlare,前期部署的Nagios的職能已有87%被Prometheus所替代。

CloudFlare提供類似于Anycast所提供的CDN服務。Anycast DNS使得DNS查詢可以被最接近用戶的服務器所處理,Anycast HTTP使得內容可以從距離用戶最近的服務提供。作為原始Web站點和用戶之間的中介,CloudFlare還檢查訪問者的流量中是否存在有威脅的模式。它提供了跨150個國家的116個數據中心,每秒處理500萬次HTTP請求,120萬次DNS請求,占全球因特網請求的10%。每個入網點(PoP,Point-Of-Presence)提供HTTP、DNS、DDoS防御和鍵值存儲服務。截至演講時,有188臺運行在生產環境中的Prometheus服務器需要監控。

圖片來源:https://promcon.io/2017-munich/talks/monitoring-cloudflares-planet-scale-edge-network-with-prometheus/

Prometheus是基于度量的,也就是說它采集時序度量,并基于度量構建其余的特性。它工作于Pull模式下,每臺監控服務器運行一個稱作“exporter”的進程,通過HTTP發布所采集的度量。CloudFlare為每個服務域部署了一個exporter,使用它們采集系統(例如CPU、內存、TCP、磁盤等)、網絡(例如HTTP、Ping等)、本地匹配(錯誤信息)和容器/命名空間的度量。其中,exporter使用了Google的開源項目cadvisor采集容器/命名空間的度量。Prometheus并不會永久地保存所有數據,因為它更側重于“此時此地”(here-and-now)的監控情況。數據不做下采樣,并在CloudFlare配置中保存15天。

在CloudFlare的核心數據中心,服務包括日志訪問、分析業務,以及使用Marathon、Mesos、Chronos、Docker、Sentry、Ceph(用于存儲)、Kafka、Spark、Elasticsearch和Kibana等技術棧構建的API。Prometheus在每個PoP通過exporter查詢服務器和服務獲取度量。每個PoP的高可用性是由使用多個Prometheus服務提供的。

Prometheus的報警管理稱為“Alertmanager”。CloudFlare的部署中包括一個Alermanager,由每個Prometheus服務器推送事件,并考慮了配置的高可用性。報警基于歷史數據做測試,確保服務的正確執行的。Bosun等新興監控工具也包括類似的特性。為提供更好的報警服務,其它的一些特性還包括了描述性的名稱、簡單易用性和一些可使接收者立刻采取行動的信息。

CloudFlare團隊使用jiralerts實現JIRA工單系統與Alertmanager的集成。JIRA可以用戶定制工作流,使得報警監控中可以包括一些監控工作流特定的用戶定制狀態。另一個稱為alertmanagere2s的工具接收報警,并將報警信息集成到Elasticsearch索引中,用于進一步的檢索和分析。CloudFlare已為Alertmanger構建了自己的儀表盤,稱為“unsee”。

那么Prometheus是如何監控自身情況的?這有兩種實現方法。一種是混合方法,即在同一數據中心中,由一個Prometheus去監控另一個Prometheus。另一種方法是自頂向下的方法,由頂層Prometheus服務器監控位于數據中心層面的Prometheus服務器。

CloudFlare SRE團隊的經驗是,盡早對環境和集群等的標簽和組身份做標準化;其它一些經驗是關于如何創建可視化,以及從同行和利益相關者生成買入。經驗指出,團隊的盡早參與將有助于服務與監控系統的更快整合。而報警本身則需要多次迭代進行調整和改進,這是一個開展中的過程。

查看英文原文: Monitoring Cloudflare's Global Network Using Prometheus

關鍵字:Prometheus下采樣

本文摘自:INFOQ

電子周刊
回到頂部

關于我們聯系我們版權聲明隱私條款廣告服務友情鏈接投稿中心招賢納士

企業網版權所有 ©2010-2024 京ICP備09108050號-6 京公網安備 11010502049343號

^
  • <menuitem id="jw4sk"></menuitem>

    1. <form id="jw4sk"><tbody id="jw4sk"><dfn id="jw4sk"></dfn></tbody></form>
      主站蜘蛛池模板: 宣武区| 威海市| 彰武县| 田林县| 隆昌县| 永吉县| 竹溪县| 涡阳县| 寻乌县| 正阳县| 安塞县| 宁陕县| 布尔津县| 图们市| 芦山县| 灵川县| 绍兴市| 淮北市| 牙克石市| 前郭尔| 蒲江县| 英吉沙县| 陆丰市| 景宁| 从化市| 六盘水市| 山西省| 宜丰县| 惠东县| 留坝县| 社会| 锡林郭勒盟| 普定县| 泸州市| 云和县| 金塔县| 龙游县| 昌宁县| 晋中市| 肥西县| 麻栗坡县|