架構思維：通用架構模式

架構思維：通用架構模式_系統監控的設計

在這里插入圖片描述

引言

架構思維：通用架構模式_從設計到代碼構建穩如磐石的系統
架構思維：通用架構模式_穩如老狗的SDK設計最佳實踐

架構思維：通用架構模式_懷疑下游的設計思路與最佳實踐

我們以“防備上游、做好自己、懷疑下游”的準則，分別從系統設計、部署和代碼層面，介紹了如何構建高可用后臺系統。但再完善的防護也難保萬無一失，真正的挑戰在于在用戶感知之前，第一時間發現問題。

接下來我們將從監控的角度出發，教你如何設計微服務監控，幫助快速、自動地暴露故障，保障系統穩定運行。

監控是指對系統運行狀態數據持續審查，并設定閾值，對超出閾值的指標發出告警的機制。如下所示，監控數據通常以 時間（X 軸） 與 指標值（Y 軸） 的曲線圖形式展示：

在這里插入圖片描述

X 軸：時間間隔（秒或分鐘）
Y 軸：該間隔內匯聚的指標（數量、平均值、最大值等）

用于統計某個事件或方法的調用次數，比如接口被調用次數、某段邏輯執行次數。

在這里插入圖片描述

圖 2：次數監控示例
Y 軸：指定間隔內總調用次數

關注接口或依賴調用的延遲，常用指標有：

通常將 Avg、Max、TP99X 三者合并展示：

> **圖 3：性能監控示例**

計算指定區間內業務執行成功的比例。

在這里插入圖片描述

在可用率判斷中，要區分：

閾值設置需結合接口級別和 SLA，核心接口可設 100%，其他接口可適當放寬。

業務

在這里插入圖片描述

次數監控
1. 基于壓測瓶頸設閾值告警，并配合限流
2. 按調用方維度統計，快速定位流量異常來源
3. 同環比監控，自動識別突增
性能監控
1. 必要時只告警 Avg、Max、TP999（或 TP9999）
2. 按調用方分層監控，排查使用差異
3. 基于入參（如批量大小）分段監控，輔助優化策略
可用率監控
1. 接口級與調用方級雙重告警
2. 按業務/非業務異常判定成功與否
3. 閾值分級：重要接口近乎 100%，普通接口可降至 95%

在這里插入圖片描述

在這里插入圖片描述

本文來自互聯網用戶投稿，該文觀點僅代表作者本人，不代表本站立場。本站僅提供信息存儲空間服務，不擁有所有權，不承擔相關法律責任。
如若轉載，請注明出處：http://www.pswp.cn/web/79603.shtml
繁體地址，請注明出處：http://hk.pswp.cn/web/79603.shtml
英文地址，請注明出處：http://en.pswp.cn/web/79603.shtml

如若內容造成侵權/違法違規/事實不符，請聯系多彩編程網進行投訴反饋email:809451989@qq.com，一經查實，立即刪除！