Prometheus + Grafana + Micrometer 監控方案詳解

這套組合是當前Java生態中最流行的監控解決方案之一,特別適合云原生環境下的微服務應用監控。下面我將從技術實現到最佳實踐進行全面解析。

一、技術棧組成與協作

1. 組件分工

組件角色關鍵能力
Micrometer應用指標門面(Facade)統一指標采集API,對接多種監控系統
Prometheus時序數據庫+采集器指標存儲、查詢、告警規則處理
Grafana可視化平臺儀表盤展示、數據可視化分析

2. 數據流動

AppMicrometerPrometheusGrafana生成指標數據(JVM/HTTP等)暴露/metrics端點定期拉取指標數據存儲和聚合數據查詢數據渲染可視化圖表AppMicrometerPrometheusGrafana

二、Micrometer 集成實踐

1. Spring Boot 配置

Maven依賴

<dependency><groupId>io.micrometer</groupId><artifactId>micrometer-registry-prometheus</artifactId>
</dependency>
<dependency><groupId>org.springframework.boot</groupId><artifactId>spring-boot-starter-actuator</artifactId>
</dependency>

application.yml配置

management:endpoints:web:exposure:include: health,info,prometheusmetrics:export:prometheus:enabled: truetags:application: ${spring.application.name} # 統一添加應用標簽

2. 自定義指標示例

業務指標采集

@Service
public class OrderService {private final Counter orderCounter;private final Timer orderProcessingTimer;public OrderService(MeterRegistry registry) {// 創建計數器orderCounter = Counter.builder("orders.total").description("Total number of orders").tag("type", "online").register(registry);// 創建計時器orderProcessingTimer = Timer.builder("orders.processing.time").description("Order processing time").publishPercentiles(0.5, 0.95) // 50%和95%分位.register(registry);}public void processOrder(Order order) {// 方法1: 手動計時long start = System.currentTimeMillis();try {// 業務邏輯...orderCounter.increment();} finally {long duration = System.currentTimeMillis() - start;orderProcessingTimer.record(duration, TimeUnit.MILLISECONDS);}// 方法2: 使用Lambda自動計時orderProcessingTimer.record(() -> {// 業務邏輯...orderCounter.increment();});}
}

三、Prometheus 配置優化

1. 抓取配置示例

# prometheus.yml
global:scrape_interval: 15sevaluation_interval: 30sscrape_configs:- job_name: 'spring-apps'metrics_path: '/actuator/prometheus'scrape_interval: 10s # 對應用更頻繁采集static_configs:- targets: ['app1:8080', 'app2:8080']relabel_configs:- source_labels: [__address__]target_label: instance- source_labels: [__meta_service_name]target_label: service

2. 關鍵優化參數

存儲配置

# 控制塊存儲行為
storage:tsdb:retention: 15d # 數據保留時間out_of_order_time_window: 1h # 允許亂序數據窗口# 限制內存使用
query:lookback-delta: 5mmax-concurrency: 20

四、Grafana 儀表盤設計

1. 核心監控儀表盤

JVM監控面板配置

Panel 1: Heap Memory Usage
Query: sum(jvm_memory_used_bytes{area="heap"}) by (instance) / sum(jvm_memory_max_bytes{area="heap"}) by (instance)
Visualization: Time series with % unitPanel 2: GC Pause Time
Query: rate(jvm_gc_pause_seconds_sum[1m])
Visualization: HeatmapPanel 3: Thread States
Query: jvm_threads_states_threads{instance=~"$instance"}
Visualization: Stacked bar chart

2. 業務指標可視化

訂單業務看板

{"panels": [{"title": "Orders per Minute","targets": [{"expr": "rate(orders_total[1m])","legendFormat": "{{instance}}"}],"type": "graph","yaxes": [{"format": "ops"}]},{"title": "Processing Time (95%)","targets": [{"expr": "histogram_quantile(0.95, rate(orders_processing_time_seconds_bucket[1m]))","legendFormat": "P95"}],"type": "stat","unit": "s"}]
}

五、生產環境最佳實踐

1. 指標命名規范

類型前綴示例
計數器_totalhttp_requests_total
計量器_currentqueue_size_current
計時器_secondsapi_latency_seconds
分布概要_summaryresponse_size_summary

2. 標簽使用原則

  • 避免高基數標簽:如用戶ID、訂單號等
  • 統一標簽命名:團隊內保持一致(如env vs environment
  • 重要維度標記regionazservice_version

3. 資源優化技巧

Micrometer配置

@Bean
MeterRegistryCustomizer<MeterRegistry> metricsCommonTags() {return registry -> registry.config().meterFilter(MeterFilter.deny(id -> {// 過濾不需要的指標return id.getName().startsWith("jvm_classes");})).commonTags("region", System.getenv("AWS_REGION"));
}

Prometheus資源限制

# 容器部署時設置資源限制
resources:limits:memory: 8Girequests:cpu: 2memory: 4Gi

六、高級功能實現

1. 自定義Collector

public class CustomMetricsCollector extends Collector {@Overridepublic List<MetricFamilySamples> collect() {List<MetricFamilySamples> samples = new ArrayList<>();// 添加自定義指標samples.add(new MetricFamilySamples("custom_metric",Type.GAUGE,"Custom metric description",Collections.singletonList(new MetricFamilySamples.Sample("custom_metric",List.of("label1"),List.of("value1"),getCurrentValue()))));return samples;}
}// 注冊Collector
new CustomMetricsCollector().register();

2. 告警規則示例

groups:
- name: application-alertsrules:- alert: HighErrorRateexpr: rate(http_server_requests_errors_total[5m]) / rate(http_server_requests_total[5m]) > 0.05for: 10mlabels:severity: criticalannotations:summary: "High error rate on {{ $labels.instance }}"description: "Error rate is {{ $value }}"- alert: GCTooLongexpr: rate(jvm_gc_pause_seconds_sum[1h]) > 0.1labels:severity: warning

這套監控組合的優勢在于:

  1. 云原生友好:完美契合Kubernetes環境
  2. 低侵入性:Micrometer作為抽象層減少代碼耦合
  3. 高效存儲:Prometheus的TSDB壓縮比高
  4. 豐富可視化:Grafana社區提供大量現成儀表盤

建議實施路徑:

  1. 先搭建基礎監控(JVM/HTTP指標)
  2. 逐步添加業務指標
  3. 最后實現自定義告警和自動化處理

本文來自互聯網用戶投稿,該文觀點僅代表作者本人,不代表本站立場。本站僅提供信息存儲空間服務,不擁有所有權,不承擔相關法律責任。
如若轉載,請注明出處:http://www.pswp.cn/pingmian/91107.shtml
繁體地址,請注明出處:http://hk.pswp.cn/pingmian/91107.shtml
英文地址,請注明出處:http://en.pswp.cn/pingmian/91107.shtml

如若內容造成侵權/違法違規/事實不符,請聯系多彩編程網進行投訴反饋email:809451989@qq.com,一經查實,立即刪除!

相關文章

實習小記(個人中心的編輯模塊)

實習小記&#xff08;個人中心的編輯模塊&#xff09; 項目需要加一個個人中心的編輯模塊&#xff0c;也是差不多搞了一天下來&#xff0c;其中遇到了很多問題&#xff0c;也是來記錄、分享一下。 技術棧&#xff1a;React、antd、TypeScript 需求 點擊編輯&#xff0c;彈出編…

【7】串口編程三種模式(查詢/中斷/DMA)韋東山老師學習筆記(課程聽不懂的話試著來看看我的學習筆記吧)

<1>前置概念補充在深入拆解三種模式前&#xff0c;先通過提供的 “函數對比表” 建立整體認知&#xff1a;這張表是串口收發的「武器庫索引」&#xff0c;清晰標注了查詢、中斷、DMA 三種模式下&#xff0c;收發 / 回調函數的對應關系。后續會結合實際代碼&#xff0c;講…

【Kubernetes 指南】基礎入門——Kubernetes 201(二)

二、滾動升級- 滾動升級&#xff08;Rolling Update&#xff09;通過逐個容器替代升級的方式來實現無中斷的服務升級&#xff1a;- 在滾動升級的過程中&#xff0c;如果發現了失敗或者配置錯誤&#xff0c;還可以隨時回滾&#xff1a;- 需要注意的是&#xff0c; kubectl rolli…

網絡資源模板--基于Android Studio 實現的圖書商城App

目錄 一、測試環境說明 二、項目簡介 三、項目演示 四、部設計詳情&#xff08;部分) 登錄注冊頁 首頁 五、項目源碼 一、測試環境說明 電腦環境 Windows 11 編寫語言 JAVA 開發軟件 Android Studio (2020) 開發軟件只要大于等于測試版本即可(近幾年官網直接下載…

JavaWeb 進階:Vue.js 與 Spring Boot 全棧開發實戰(Java 開發者視角)

作為一名 Java 開發工程師&#xff0c;當你掌握了 HTML、CSS 和 JavaScript 的基礎后&#xff0c;是時候接觸現代前端框架了。Vue.js 以其簡潔的 API、漸進式的設計和優秀的中文文檔&#xff0c;成為眾多 Java 開發者入門前端框架的首選。Vue.js 讓你能快速構建響應式、組件化的…

智能體產品化的關鍵突破:企業智能化轉型的“最后一公里”如何邁過?

智能體產品化的關鍵突破&#xff1a;企業智能化轉型的“最后一公里”如何邁過&#xff1f; 在人工智能迅猛發展的當下&#xff0c;智能體&#xff08;Agent&#xff09;成為企業數字化轉型的新引擎。無論是市場分析、客戶服務&#xff0c;還是自動化辦公&#xff0c;智能體都被…

Rust × Elasticsearch官方 `elasticsearch` crate 上手指南

1 為什么選擇官方 Rust 客戶端&#xff1f; 語義化兼容&#xff1a;客戶端 主版本 與 ES 主版本 嚴格對應&#xff0c;8.x 客戶端可對接任何 8.x 服務器&#xff1b;不存在跨主版本兼容承諾 (docs.rs)100% API 覆蓋&#xff1a;穩定 API 全量映射&#xff0c;Beta/實驗特性可按…

怎樣畫流程圖?符號與流程解構教程

在數字化辦公和項目管理日益復雜的當下&#xff0c;流程圖早已不是工程師、項目經理的專屬工具&#xff0c;它正快速成為每一位職場人提升表達效率、理清工作邏輯的利器。無論是軟件開發中的流程規范、產品設計階段的用戶路徑&#xff0c;還是企業內部的審批流程、團隊協作機制…

vue3 + vite || Vue3 + Webpack創建項目

1.vue3 vite搭建項目方法 &#xff08;需要提前裝node,js&#xff09; 1. 使用官方 create-vite 工具&#xff08;推薦&#xff09; 1.使用npm----------------------------- npm create vuelatest2.使用pnpm----------------------------- pnpm create vuelatest3.使用yarn--…

Vue2-封裝一個含所有表單控件且支持動態增減行列的表格組件

效果1. 無編輯權限&#xff1a;顯示普通表格2. 有編輯權限&#xff1a;根據配置顯示編輯控件3. 可以動態新增行&#xff0c;也可以動態新增列 核心代碼無權限情況的核心代碼<!-- 無編輯權限時顯示普通表格 --><el-tablev-if"!hasEditPermission"ref"ta…

網絡原理 - TCP/IP(一)

目錄 1. 應用層&#xff1a;用戶與網絡的 “交互窗口” 1.1 應用層協議&#xff1a;規范交互的 “通用語言” 1.2 自定義協議&#xff1a;適配特殊需求的 “專屬規則” 1.3 應用層數據格式&#xff1a;讓數據 “說得明白” 1.3.1 XML&#xff1a;結構化但繁瑣的 “老…

Orange的運維學習日記--16.Linux時間管理

Orange的運維學習日記–16. Linux時間管理 文章目錄Orange的運維學習日記--16. Linux時間管理系統與硬件時鐘時鐘類型對比查看內核支持的時鐘源本地時間調整使用 date 查看與設置一次性同步&#xff1a;ntpdate同步到硬件時鐘&#xff1a;hwclock基于 systemd 的 timedatectl交…

Git 與 GitHub 的對比與使用指南

Git 與 GitHub 的對比與使用指南 在軟件開發中&#xff0c;Git 和 GitHub 是兩個密切相關但本質不同的工具。下面我將逐步解釋它們的定義、區別、核心概念以及如何協同使用&#xff0c;確保內容真實可靠&#xff0c;基于廣泛的技術實踐。 1. 什么是 Git&#xff1f; Git 是一個…

20250726-4-Kubernetes 網絡-Service DNS名稱解析_筆記

一、Service DNS名稱 ?1. 例題:通信需求 通信場景:項目A中的Pod需要與項目B中的Pod進行通信,直接使用Pod IP不可行,因為Pod IP會隨著Pod生命周期變化。 解決方案:通過Service提供的穩定IP地址進行通信,不受Pod重建、擴容/縮容等操作影響。 2. CoreDNS介紹 ?? 基本功能…

vscode 登錄ssh記住密碼直接登錄設置

第一種情況在系統已經生成密鑰對的情況下&#xff1a;點擊這里的設置第二步&#xff1a;第三步&#xff1a;沒有填寫的給填寫一下第四步驟&#xff1a;保存后進入選擇這個點開第五步&#xff1a;去Linux終端下輸入這個命令就OK了echo "ssh-rsa內容" >> ~/.ssh/…

Nginx 動靜分離配置(詳細版)

本文介紹了Nginx 動靜分離相關配置&#xff0c;主要包括了配置文件創建、配置示例、配置原理解析以及重新啟用配置文件等等 本文目錄1. 創建 Nginx 配置文件2. 配置示例3. 配置原理解析4. 啟用配置文件并重新加載 Nginx1. 創建 Nginx 配置文件 在 /etc/nginx/sites-available …

C# CAN通信上位機系統設計與實現

C# CAN通信上位機系統設計與實現 C# CAN通信上位機程序&#xff0c;支持多種CAN適配器&#xff0c;提供數據收發、協議解析、數據可視化等功能。 using System; using System.Collections.Generic; using System.ComponentModel; using System.Data; using System.Drawing; usi…

Ubuntu20.04子系統

常用 # 導出分發版到 E盤 wsl --export Ubuntu-20.04 E:\wsl-ubuntu20.04.tar # 注銷原有分發版 wsl --unregister Ubuntu-20.04 # 導入到 E盤的新路徑&#xff08;例如 E:\WSL\Ubuntu-20.04&#xff09; wsl --import Ubuntu-20.04 E:\WSL\Ubuntu-20.04 E:\wsl-ubuntu20.04.t…

【設計模式】狀態模式 (狀態對象(Objects for States))

狀態模式&#xff08;State Pattern&#xff09;詳解一、狀態模式簡介 狀態模式&#xff08;State Pattern&#xff09; 是一種 行為型設計模式(對象行為型模式)&#xff0c;它允許一個對象在其內部狀態改變時改變其行為。換句話說&#xff0c;對象看起來好像修改了它的類。 你…

工業前端組件庫重構心法:如何讓開發效率提升60%的交互模塊設計邏輯

工業前端組件庫重構心法&#xff1a;如何讓開發效率提升60%的交互模塊設計邏輯內容摘要在工業項目開發中&#xff0c;前端組件庫是提升開發效率的關鍵。然而&#xff0c;許多團隊的組件庫存在設計不合理、維護困難等問題&#xff0c;導致開發效率低下。如果能夠重構組件庫&…