?? 歡迎大家來到景天科技苑??
???? 養成好習慣,先贊后看哦~????
?? 作者簡介:景天科技苑
??《頭銜》:大廠架構師,華為云開發者社區專家博主,阿里云開發者社區專家博主,CSDN全棧領域優質創作者,掘金優秀博主,51CTO博客專家等。
??《博客》:Python全棧,前后端開發,小程序開發,人工智能,js逆向,App逆向,網絡系統安全,數據分析,Django,fastapi,flask等框架,云原生k8s,Prometheus監控,linux,shell腳本等實操經驗,網站搭建,數據庫等分享。所屬的專欄:Prometheus監控系統零基礎到進階
景天的主頁:景天科技苑
文章目錄
- Alertmanager告警路由,告警靜默,告警抑制,高可用
- 一、AlertManager告警路由
- 1.1 告警路由介紹
- 1.2 告警路由實踐
- 1)配置AlertManager,添加子路由規則
- 1.2 告警路由實踐
- 1)配置AlertManager,添加子路由規則
- 2)檢查語法,并重新加載AlertManager
- 1.3 告警路由驗證
- 1)觸發mysql和redis的告警,驗證企業微信-DBA團隊是否能收到告警消息
- 2)觸發node相關的告警,驗證企業微信-OPS團隊是否能收到告警消息
- 3)觸發nginx相關的告警,驗證釘釘運維團隊是否能收到告警消息
- 二、AlertManager告警靜默
- 2.1 告警靜默介紹
- 1)先告警后靜默
- 2)先配置靜默
- 2.2 配置告警靜默
- 1、先告警后靜默
- 2、先配置靜默
- 三、AlertManager告警抑制
- 3.1 告警抑制介紹
- 3.2 告警抑制場景-1
- 1)模擬節點故障,并且模擬因為節點故障從?造成的其他級聯故障;
- 2)正常情況下我們會收到3條告警消息,但最為重要的就是節點Down機,其他告警消息都是因為節點Down而產生的級聯故障
- 3.3 告警抑制場景-2
- 1)假設我們運行了MySQL主從,我們的告警規則如下:
- 2)接下來,模擬主庫異常和從庫異常,看是否會收到兩條告警消息。
- 3)配置抑制規則,當主庫出現故障,則抑制從庫的故障
- 4)模擬主庫和從庫都告警,驗證最終是否僅收到主庫的告警,而抑制從庫的告警。
- 四、AleartManager高可用
- 4.1 AlertManager傳統架構
- 4.2 AlertManager高可用架構
- 4.3 AlertManager高可用配置實踐
- 1)將jigntian01節點上的,AlertManager拷貝止其他兩個節點
- 2)在所有節點上,準備 alertmanager_ha.service 的啟動配置文件
- 3)檢查alertmanager集群狀態
- 4)配置Prometheus對接多個AlertManager實例
- 4.4 AlertManager高可用結果驗證
- 1)測試集群同步狀態,當在一個節點上創建了一個靜默(Silence)記錄,其他節點的監控頁面能夠即時顯示該靜默的信息
- <