http.server.requests
HTTP 接口性能瓶頸 http.server.requests.max + system.cpu.usage 代碼熱點分析或橫向擴容
核心接口性能指標,包含以下維度:
count:請求總數
max/sum:最大及總響應時間
status:HTTP 狀態碼分布(如 5xx 錯誤率)
應用場景:識別高延遲接口或異常請求激增。
/metrics/http.server.requests?tag=uri:xxx
指定URL分析
jvm.buffer.count
當前緩沖區數量(Direct/Mapped),監控堆外內存使用。
?作用:統計 JVM 緩沖區(如 Direct Buffer 和 Mapped Buffer)的數量。
?應用場景:監控堆外內存使用情況,排查 NIO 操作中的緩沖區泄漏問題。
Direct 網絡傳輸、大文件讀寫 減少堆內外數據拷貝,提升 I/O 性能 堆外內存泄漏(需監控 jvm.buffer.memory.used 是否持續增長)
?Mapped 數據庫文件操作、日志持久化 文件直接映射內存,避免磁盤頻繁讀寫 未關閉 FileChannel 導致虛擬內存耗盡或文件鎖沖突
?**direct 緩沖區泄漏**:若 direct 類型數量持續增加且不釋放,可能引發 OutOfMemoryError: Direct buffer memory。
?**mapped 緩沖區未關閉**:可能導致系統虛擬內存占用過高,甚至影響其他進程。
?**jvm.buffer.memory.used**:緩沖區占用的內存大小(需區分 direct 和 mapped)。
?**process.resident_memory**:進程總內存使用量,輔助判斷堆外內存泄漏。
jvm.buffer.memory.used
緩沖區內存占用
?作用:記錄當前緩沖區實際占用的內存大小(單位:字節)。
?示例:若該值持續增長,可能因未正確釋放 DirectByteBuffer 導致內存溢出。
jvm.buffer.total.capacity
?作用:顯示所有緩沖區的總容量上限。
?關聯分析:與 jvm.buffer.memory.used 對比,判斷緩沖區利用率是否合理。
緩沖區總容量,結合 jvm.buffer.memory.used 分析利用率。
jvm.classes.loaded
?作用:統計 JVM 已加載的類數量,反映應用運行時的類加載動態。
?典型問題:類加載數異常增長可能由重復加載或類加載器泄漏引起。
類加載異常 jvm.classes.loaded/unloaded 結合 JVM 分析工具(如 JProfiler)
已加載/卸載的類數量,異常值可能暗示類加載器泄漏或動態代理濫用。
jvm.classes.unloaded
?作用:記錄 JVM 生命周期內已卸載的類總數。
?意義:正常情況下卸載數較低,頻繁卸載可能影響性能(如熱部署場景)。
已加載/卸載的類數量,異常值可能暗示類加載器泄漏或動態代理濫用。
jvm.gc.live.data.size
老年代存活數據大小(反映內存碎片情況)
jvm.gc.max.data.size
?功能:垃圾回收管理的最大內存區域容量(例如老年代最大空間)。
?分析:若 jvm.memory.used 持續接近此值,可能觸發頻繁 Full GC,需優化對象生命周期或擴容堆內存。
?場景:結合 jvm.gc.pause 判斷是否因內存不足導致 GC 效率下降。
jvm.gc.memory.allocated
GC 期間分配的內存總量
Young GC 時年輕代分配的內存空間,反映對象創建速率。
jvm.gc.memory.promoted
Young GC 后晉升到老年代的內存大小,用于分析對象生命周期合理性。
顯示 Young GC 后晉升到老年代的內存大小,用于分析對象生命周期
jvm.gc.pause
內存泄漏 jvm.memory.used + jvm.gc.pause 分析堆內存增長與 Full GC 頻率
GC 耗時(jvm.gc.pause)及堆內存分配情況
GC 暫停時間(用于分析垃圾回收效率)
GC 暫停時間,衡量垃圾回收效率(如頻繁 Full GC 可能引發性能問題)。
?**Allocation Failure**:內存分配失敗(常見于年輕代空間不足時觸發Minor GC)。
?**end of minor GC**:年輕代GC(Minor GC)結束。
?**end of major GC**:老年代GC(Major/Full GC)結束。
jvm.memory.committed
已提交內存量(JVM 向操作系統申請的物理內存),反映實際資源占用。
jvm.memory.max
查看 JVM 最大內存
JVM 最大可用內存
JVM 可分配的最大內存,對比 used 可計算內存利用率。
jvm.memory.used
當前 JVM 內存使用量(堆/非堆)
內存泄漏 jvm.memory.used + jvm.gc.pause 分析堆內存增長與 Full GC 頻率
當前 JVM 內存使用量(堆/非堆),用于實時監控內存泄漏或溢出風險。
示例:若堆內存持續增長且無下降趨勢,可能存在內存泄漏。
jvm.threads.daemon
?功能:當前 JVM 守護線程數量(如垃圾回收線程)。
?分析:若守護線程數異常增加(如遠高于默認值),可能因線程池配置錯誤或框架內部泄漏。
?場景:對比 jvm.threads.live 分析線程總數是否合理。
jvm.threads.live
當前活躍線程數(排查線程泄漏)
結合 jvm.threads.live 和 tomcat.threads.busy 診斷線程阻塞問題
高并發性能瓶頸 jvm.threads.live、system.cpu.usage 檢測線程阻塞或 CPU 過載
當前活躍線程數,突增可能因線程泄漏或任務阻塞。
高并發線程阻塞 jvm.threads.live + jvm.threads.states 優化鎖機制或線程池配置
jvm.threads.peak
歷史峰值線程數
jvm.threads.states
按狀態(BLOCKED、WAITING 等)分類的線程數量
?作用:按線程狀態(如 BLOCKED、WAITING、RUNNABLE)分類統計線程數量。
?排查場景:
BLOCKED 線程過多:可能由鎖競爭或同步瓶頸導致。
WAITING 線程堆積:常見于任務隊列處理能力不足。
按狀態(BLOCKED/WAITING/RUNNABLE)統計線程數,排查鎖競爭或任務隊列積壓。
高并發線程阻塞 jvm.threads.live + jvm.threads.states 優化鎖機制或線程池配置
logback.events
記錄 Logback 日志事件數量(如 INFO/WARN/ERROR 級別日志統計)
?作用:統計 Logback 日志框架輸出的不同級別日志事件數量(如 INFO、WARN、ERROR)。
?配置:需依賴 micrometer-core 和 Logback 集成,自動記錄日志頻率。
?示例:監控 ERROR 級別日志的突發增長,觸發告警機制。
日志級別統計(INFO/WARN/ERROR),監控日志風暴或異常頻率。
process.cpu.usage
當前進程 CPU 占用
當前進程 CPU 占用,結合線程指標分析熱點代碼。
process.files.max
?功能:操作系統允許進程打開的最大文件句柄數。
?分析:若 process.files.open 接近此值,可能導致 "Too many open files" 錯誤,需調整系統限制(ulimit)或檢查文件泄漏。
process.files.open
?功能:當前進程已打開的文件句柄數(包括 Socket、日志文件等)。
?分析:持續增長可能因未正確關閉資源(如數據庫連接、流未釋放)。
process.files.open process.files.max process.files.open / process.files.max > 0.8
process.start.time
進程啟動時間戳
?作用:記錄應用進程啟動的時間戳(Unix 時間戳格式)。
?用途:用于計算應用運行時長,或與其他時間序列數據關聯分析。
啟動時間戳,用于計算運行周期。
process.uptime
應用運行時長(秒)
?作用:顯示應用已運行的時長(單位:秒)。
?示例:結合告警系統,監控長時間運行的進程是否存在內存泄漏。
應用持續運行時間,長期運行需關注內存泄漏。
system.cpu.count
CPU 核心數,用于資源擴容決策。
CPU 核心數(用于資源規劃)
system.cpu.usage
系統整體 CPU 使用率
高并發性能瓶頸 jvm.threads.live、system.cpu.usage 檢測線程阻塞或 CPU 過載
系統整體 CPU 使用率,超 80% 需警惕資源瓶頸。
HTTP 接口性能瓶頸 http.server.requests.max + system.cpu.usage 代碼熱點分析或橫向擴容
system.load.average.1m
?功能:系統過去 1 分鐘的平均負載(單位:核心數占比)。
?分析:
負載值 > CPU 核心數表示系統過載。
若負載高但 system.cpu.usage 低,可能因 I/O 阻塞或鎖競爭。
?場景:結合 jvm.threads.states 判斷是否因線程阻塞導致負載堆積。
system.load.average.1m system.cpu.usage system.load.average.1m > (system.cpu.count * 2)
tomcat.sessions.active.current
活躍會話數
當前活躍會話數
當前活躍會話數,評估用戶并發量。
tomcat.sessions.active.max
功能:歷史活躍會話數的峰值。
?分析:對比當前活躍會話數(tomcat.sessions.active.current),評估系統承載能力是否需擴容。
tomcat.sessions.alive.max
?作用:統計會話存活時間的最大值,反映用戶會話的活躍程度。
?優化建議:若該值過高,需檢查會話超時配置是否合理。
tomcat.sessions.created
?功能:自應用啟動以來創建的會話總數。
?分析:
高頻會話創建(如每秒數百次)可能因無 Session 復用(如未設置 Cookie)或遭受攻擊。
結合 tomcat.sessions.expired 優化會話超時時間。
tomcat.sessions.expired
過期會話數(用于會話超時配置優化)
過期會話數,優化會話超時配置。
tomcat.sessions.rejected
因超出最大限制被拒絕的會話數
Tomcat 會話管理 tomcat.sessions.rejected 調整 server.tomcat.max-sessions 配置
?作用:記錄因超出 Tomcat 最大會話數限制而被拒絕創建的會話數量。
?調優方向:調整 server.tomcat.max-sessions 參數或優化會話管理策略。
Tomcat 會話過載 tomcat.sessions.rejected 調整 max-sessions 參數
因超出最大會話數被拒絕的請求數,需調整 server.tomcat.max-sessions。