機器指標監控技術方案

文章目錄

  • 機器指標監控技術方案
    • 架構圖
      • 組件簡介
        • Prometheus 簡介
          • 核心特性
          • 適用場景
        • Grafana 簡介
          • 核心特性
          • 適用場景
        • Alertmanager 簡介
          • 核心特性
          • 適用場景
    • 數據采集
      • 機器Node Exporter
      • MySQL Exporter
      • Redis Exporter
      • ES Exporter
      • RocketMQ Exporter
      • Springcloud Exporter
      • Nacos
    • 數據存儲
      • 短期存儲
      • 長期存儲
        • 方案 1:Thanos(推薦)?
        • 方案 2:VictoriaMetrics
        • 方案 3:M3DB(Uber 開源)?
    • 數據查詢展示
      • 快速導入模板?
      • 機器指標監控模板
      • MySQL 指標監控模板
      • Redis 指標監控模板
      • ES 指標監控模板
      • RocketMQ 指標監控模板
      • Springcloud 指標監控模板
    • 指標異常告警
      • AlertManager
        • 核心特性
        • 適用場景
        • 協作流程

機器指標監控技術方案

架構圖

[圖片]

組件簡介

Prometheus 簡介

Prometheus 是一款開源的 監控和告警工具,由 Cloud Native Computing Foundation (CNCF) 托管,專為云原生環境設計。它采用 Pull(拉取) 模式采集指標數據,并支持強大的 PromQL 查詢語言,適用于 微服務、容器、中間件和基礎設施 的監控。

核心特性

? 多維度數據模型?:基于 metric_name{labels}=value 的鍵值對存儲,支持靈活查詢。
? 高效存儲?:采用時間序列數據庫(TSDB),支持高效查詢和壓縮存儲。
? 服務發現?:支持 Kubernetes、Consul、Nacos 等動態發現監控目標。
? 告警規則?:可定義靈活的告警條件(如 CPU > 90%),并推送至 Alertmanager。
? 豐富的 Exporter 生態?:支持 Node Exporter(機器監控)、MySQL Exporter(數據庫監控)等。

適用場景

📌 監控 Spring Cloud 微服務(JVM、HTTP 請求、線程池)
📌 監控 中間件(RocketMQ、MySQL、Redis、Elasticsearch)
📌 監控 服務器資源(CPU、內存、磁盤、網絡)

Grafana 簡介

Grafana 是一款開源的 數據可視化和監控分析平臺,支持多種數據源(如 Prometheus、MySQL、Elasticsearch),能夠將復雜的監控數據轉化為 直觀的儀表盤,幫助團隊快速發現和診斷問題。

核心特性

? 多數據源支持:可集成 Prometheus、InfluxDB、Elasticsearch、Loki 等。
? 豐富的可視化組件:折線圖、柱狀圖、儀表盤、熱力圖、日志面板等。
? 動態儀表盤:支持變量過濾(如按服務名、實例篩選數據)。
? 告警可視化:可在儀表盤直接查看告警狀態。
? 團隊協作:支持共享儀表盤、權限管理、版本回滾。

適用場景

📊 可視化 Prometheus 監控數據(如機器指標、微服務性能)
📊 日志分析(結合 Elasticsearch 或 Loki)
📊 業務數據監控(如訂單量、API 成功率)

Alertmanager 簡介

Alertmanager 是 Prometheus 生態中的 告警管理組件,負責對 Prometheus 觸發的告警進行 去重、分組、路由和通知,確保告警信息能高效、準確地送達相關人員。

核心特性

🔔 告警分組(Grouping)??:合并同類告警(如多臺機器高 CPU 告警合并為一條)。
🔔 告警抑制(Inhibition)??:避免冗余告警(如機器宕機時,忽略該機器上的服務告警)。
🔔 多通知渠道:支持郵件、Slack、釘釘、企業微信、Webhook 等。
🔔 靜默(Silence)??:臨時屏蔽特定告警(如維護期間)。
🔔 高可用:支持多實例集群部署,避免單點故障。

適用場景

🚨 微服務異常告警(如 HTTP 錯誤率飆升、JVM OOM)
🚨 中間件告警(如 RocketMQ 消息堆積、MySQL 慢查詢)
🚨 服務器告警(如磁盤空間不足、CPU 過載)

數據采集

exporter list https://prometheus.io/docs/instrumenting/exporters/

機器Node Exporter

https://github.com/prometheus/node_exporter

MySQL Exporter

https://github.com/prometheus/mysqld_exporter

Redis Exporter

https://github.com/oliver006/redis_exporter

ES Exporter

https://github.com/prometheus-community/elasticsearch_exporter

RocketMQ Exporter

https://github.com/apache/rocketmq-exporter

Springcloud Exporter

https://micrometer.io/docs/registry/prometheus

Nacos

使用動態服務發現
https://blog.csdn.net/qaknar826/article/details/147055927

scrape_configs:

  • job_name: ‘spring-cloud-apps’
    nacos_sd_configs:
    • server: ‘nacos-server-ip:8848’ # Nacos 地址
      group_name: ‘DEFAULT_GROUP’
      namespace_id: ‘your-namespace-id’
      metrics_path: ‘/actuator/prometheus’
      relabel_configs:
    • source_labels: [__meta_nacos_service_name]
      target_label: application

數據存儲

短期存儲

Prometheus 默認使用 本地時間序列數據庫(TSDB)? 存儲數據,默認保留 15天?
(storage.tsdb.retention.time=15d)
數據存儲在 --storage.tsdb.path 指定的目錄(默認 data/)
一個月內的短期存儲推薦默認的本地時序數據庫

長期存儲

方案 1:Thanos(推薦)?
  • 基于 Prometheus TSDB,支持無限擴展存儲。
  • 支持全局查詢、數據壓縮、降采樣(Downsampling)。
  • 集成對象存儲(如 S3、MinIO、阿里云 OSS)。
方案 2:VictoriaMetrics
  • 高性能時序數據庫,兼容 PromQL。
  • 存儲效率比 Prometheus TSDB 高 10 倍。
  • 支持單機版和集群版。
方案 3:M3DB(Uber 開源)?
  • 分布式時序數據庫,適合大規模監控。
  • 需要額外部署集群管理組件(如 etcd)。
    方案對比
    暫時無法在飛書文檔外展示此內容
    推薦選擇:
  • 中小規模?:VictoriaMetrics(簡單高效)。
  • 大規模/云原生?:Thanos + 對象存儲(如 S3)。

數據查詢展示

使用Grafana展示,Grafana支持使用模板。
模板庫:https://grafana.com/grafana/dashboards/

[圖片]

快速導入模板?

  1. 左側菜單 → Dashboards → New → Import。
  2. 輸入模板 ID 1860?(Node Exporter 官方模板)。
  3. 選擇 Prometheus 數據源,點擊 Import。

機器指標監控模板

https://grafana.com/grafana/dashboards/1860-node-exporter-full/
[圖片]

MySQL 指標監控模板

https://grafana.com/grafana/dashboards/7362-mysql-overview/
[圖片]

[圖片]

[圖片]

Redis 指標監控模板

Redis官方出的
https://grafana.com/grafana/dashboards/12776-redis/
[圖片]

Prometheus官方出的
https://grafana.com/grafana/dashboards/11835-redis-dashboard-for-prometheus-redis-exporter-helm-stable-redis-ha/
[圖片]

ES 指標監控模板

https://grafana.com/grafana/dashboards/9746-elasticsearch-example/
在這里插入圖片描述

[圖片]

RocketMQ 指標監控模板

https://grafana.com/grafana/dashboards/14612-rocketmq/
[圖片]

Springcloud 指標監控模板

https://grafana.com/grafana/dashboards/4701-jvm-micrometer/
[圖片]

[圖片]

指標異常告警

AlertManager

Alertmanager 是 Prometheus 生態中的 告警管理組件,負責對 Prometheus 觸發的告警進行 去重、分組、路由和通知,確保告警信息能高效、準確地送達相關人員。

核心特性

🔔 告警分組(Grouping)??:合并同類告警(如多臺機器高 CPU 告警合并為一條)。
🔔 告警抑制(Inhibition)??:避免冗余告警(如機器宕機時,忽略該機器上的服務告警)。
🔔 多通知渠道:支持郵件、Slack、釘釘、企業微信、Webhook 等。
🔔 靜默(Silence)??:臨時屏蔽特定告警(如維護期間)。
🔔 高可用:支持多實例集群部署,避免單點故障。

適用場景

🚨 微服務異常告警(如 HTTP 錯誤率飆升、JVM OOM)
🚨 中間件告警(如 RocketMQ 消息堆積、MySQL 慢查詢)
🚨 服務器告警(如磁盤空間不足、CPU 過載)

協作流程
  1. Prometheus 采集指標(如機器、微服務、中間件數據)。
  2. Grafana 可視化 Prometheus 數據,提供實時監控儀表盤。
  3. Prometheus 觸發告警規則,推送至 Alertmanager。
  4. Alertmanager 對告警進行分組、去重,并發送通知(郵件/釘釘等)。

本文來自互聯網用戶投稿,該文觀點僅代表作者本人,不代表本站立場。本站僅提供信息存儲空間服務,不擁有所有權,不承擔相關法律責任。
如若轉載,請注明出處:http://www.pswp.cn/bicheng/79068.shtml
繁體地址,請注明出處:http://hk.pswp.cn/bicheng/79068.shtml
英文地址,請注明出處:http://en.pswp.cn/bicheng/79068.shtml

如若內容造成侵權/違法違規/事實不符,請聯系多彩編程網進行投訴反饋email:809451989@qq.com,一經查實,立即刪除!

相關文章

【Office-Excel】單元格輸入數據后自動填充單位

1.自定義設置單元格格式 例如我想輸入數字10,回車確認后自動顯示10kg。 右擊單元格或者快捷鍵(Ctrl1),選擇設置單元格格式,自定義格式輸入: 0"kg"格式仍是數字,但是顯示是10kg&…

JavaScript的3D庫有哪些?

JavaScript的3D庫有哪些? 在3D開發領域,JavaScript提供了多種庫和框架,使開發者能夠在瀏覽器中創建豐富的3D體驗。以下是一些流行的3D方面的JavaScript庫: Three.js:這是最著名的用于創建3D圖形的JavaScript庫之一。它…

中央網信辦部署開展“清朗·整治AI技術濫用”專項行動

為規范AI服務和應用,促進行業健康有序發展,保障公民合法權益,近日,中央網信辦印發通知,在全國范圍內部署開展為期3個月的“清朗整治AI技術濫用”專項行動。 中央網信辦有關負責人表示,本次專項行動分兩個階…

論文閱讀:2024 arxiv Jailbreaking Black Box Large Language Models in Twenty Queries

總目錄 大模型安全相關研究:https://blog.csdn.net/WhiffeYF/article/details/142132328 Jailbreaking Black Box Large Language Models in Twenty Queries https://www.doubao.com/chat/4008882391220226 https://arxiv.org/pdf/2310.08419 速覽 這篇論文是來…

零基礎學指針2

零基礎學指針---大端和小端 零基礎學指針---什么是指針 零基礎學指針---取值運算符*和地址運算符& 零基礎學指針---結構體大小 零基礎學指針5---數據類型轉換 零基礎學指針6---指針數組和數組指針 零基礎學指針7---指針函數和函數指針 零基礎學指針8---函數指針數組…

《Python實戰進階》 No46:CPython的GIL與多線程優化

Python實戰進階 No46:CPython的GIL與多線程優化 摘要 全局解釋器鎖(GIL)是CPython的核心機制,它保證了線程安全卻限制了多核性能。本節通過concurrent.futures、C擴展優化和多進程架構,實戰演示如何突破GIL限制&#…

Golang實現函數默認參數

golang原生不支持默認參數 在日常開發中,我們有時候需要使用默認設置,但有時候需要提供自定義設置 結構體/類,在Java我們可以使用無參、有參構造函數來實現,在PHP中我們也可以實現(如 public function xxx($isCName false, $sec…

Chrome 136 H265 WebRTC 支持 正式版本已包含

時間過的真快,去年8月份寫過一篇文章介紹如何加參數方式啟動Chrome H265 硬件解碼器, 現在的136版本已經包含在內,至此WebRTC已經完整包含了H264和H265解碼器,這個事情應該從2015年開始,Google強推VP9 AV1&#xff0c…

12.SpringDoc OpenAPI 功能介紹(用于生成API接口文檔)

12.SpringDoc OpenAPI 功能介紹(用于生成API接口文檔) SpringDoc OpenAPI 是一個基于 OpenAPI 3.0/3.1 規范的工具,用于為 Spring Boot 應用生成 API 文檔。它是 springfox(Swagger 2.x)的現代替代方案,完全支持 Spring Boot 3.x…

CentOS Linux 環境二進制方式安裝 MySQL 5.7.32

文章目錄 安裝依賴包新建用戶解壓初始化配置文件啟動服務登錄MySQL修改密碼停止數據庫 安裝依賴包 yum -y install libaio perl perl-devel libncurses* autoconf numactl新建用戶 useradd mysql解壓 tar xf mysql-5.7.32-linux-glibc2.12-x86_64.tar.gz mv mysql-5.7.32-l…

Webug4.0通關筆記06- 第8關CSV注入

目錄 CSV注入漏洞 1.CSV漏洞簡介 2.漏洞原理 (1)公式執行 (2)DDE機制 (3)OS命令執行 3.漏洞防御 第08關 CSV注入 1.打開靶場 2.修改源碼 3.注入命令 4.導出excel表 5.打開excel表 CSV注入漏洞…

Windows和 macOS 上安裝 `nvm` 和 Node.js 16.16.0 的詳細教程。

Windows和 macOS 上安裝 nvm 和 Node.js 16.16.0 的詳細教程。 --- ### 1. 安裝 nvm(Node Version Manager) nvm 是一個 Node.js 版本管理工具,可以輕松安裝和切換不同版本的 Node.js。 #### Windows 安裝 nvm 1. **下載 nvm 安裝包**&#x…

[特殊字符] 藍橋杯省賽全解析:含金量、獲獎難度、參賽意義與發展價值全面剖析

藍橋杯省賽剛剛落幕,不論你是剛參加完比賽的同學,還是還在觀望是否值得投入時間去準備藍橋杯的學生,相信你都關心: 藍橋杯到底值不值得參加? 獲獎難不難?含金量如何? 和其它算法競賽相比有什么…

ASP.NET MVC后端控制器用模型 接收前端ajax數據為空

1、前端js代碼 如下: const formData {DeptName: D001,Phone: 12345678900 };$.ajax({url: "/Phone/SavePhone1",type: "POST",contentType: "application/json",data: JSON.stringify(formData), //必須要JSON.stringifysuccess:…

擁抱 Kotlin Flow

1. 引言 Kotlin Flow 是 Kotlin 協程生態中處理異步數據流的核心工具,它提供了一種聲明式、輕量級且與協程深度集成的響應式編程模型。與傳統的 RxJava 相比,Flow 更簡潔、更易于維護,尤其在 Android 開發中已成為主流選擇。本文將從基礎概念…

精益數據分析(34/126):深挖電商運營關鍵要點與指標

精益數據分析(34/126):深挖電商運營關鍵要點與指標 在創業和數據分析的學習之旅中,我們都在不斷探尋如何讓業務更上一層樓。今天,我依舊帶著和大家共同進步的想法,深入解讀《精益數據分析》中電商運營的關…

Learning vtkjs之ImageCropFilter

過濾器 圖片數據體積裁剪 介紹 vtkImageCropFilter可以裁剪vtkImageData。這只適用于IJK對齊的平面。 請注意,由于CPU限制的裁剪,這在大型數據集上會很慢。 效果 核心代碼 需要實現這個代碼主要邏輯 1、設定的crop的包圍盒 其實主要是IMax IMin JM…

深入理解 C++11 delete 關鍵字:禁用函數的藝術

一、什么是 delete 關鍵字 C11 引入的 delete 關鍵字是一種??顯式禁用函數??的語法機制。它允許開發者主動阻止特定函數的使用,比傳統的私有化聲明更直觀、更安全,且能在編譯期捕獲更多潛在錯誤。 二、為什么需要 delete? 1. 傳統方式…

深度剖析!GPT-image-1 API 開放對 AI 繪畫技術生態的沖擊!

4月24日凌晨,OpenAI正式發布了全新的圖像生成模型“gpt-image-1”,并通過API向全球開發者開放使用,這意味著其GPT-4o的圖像生成能力正式向開發者開放! 在這之前,GPT-4o的圖像生成功能于今年3月25日由 OpenAI 創始人兼 …

扣子流程圖批量導入飛書多維表格

文章目錄 整體結構分步驟進行處理1. 程序代碼處理2. 多維表格配置 整體結構 整個代碼塊結構如下: 首先,我們從其他流程中拿到一個數據列表,通過一個循環體,將每一個部分的內容都通過python代碼整理后,使用【插件】的…