K8S 性能瓶頸排查
隨著業務量增長,Kubernetes 集群經常出現:
- ? Pod 啟動慢?
- ? API 響應慢?
- ? 節點 CPU 飆高?
- ? 服務無故中斷?
這可能是性能瓶頸在悄悄作祟。
性能瓶頸全局視角
# K8S 性能瓶頸排查思維導圖- 集群層面- API Server 響應慢- Etcd 壓力大- 控制面組件異常- 節點層面- CPU / Memory / Disk I/O 飽和- Kubelet 資源不足- 宿主機負載高- Pod 層面- OOM / CPU Throttling- Pending / CrashLoopBackOff- 容器冷啟動慢- 網絡層面- DNS 延遲- Service 負載不均- 網絡丟包 / 延遲- 存儲層面- PV 響應慢- PVC 掛載失敗- IO 延遲高
核心性能瓶頸定位指標
1. API Server 響應慢
可使用 Prometheus + Grafana 面板查看:
- ?
apiserver_request_duration_seconds