1. 實際參與過生產級 K8s 集群
回答示例:
目前我負責的 K8s 集群規模為?300 個物理節點,分布在 3 個可用區(AZ),采用多控制平面高可用架構。集群日常運行約?12,000 個 Pod,資源利用率保持在 65%-75%,預留 25% 資源應對業務高峰。
承載的核心業務包括:
- 在線業務:電商平臺的前端服務(React + Nginx)、后端 API(Spring Cloud 微服務),通過 Ingress 進行流量分發,每日支撐百萬級 PV;
- 數據處理:Spark 和 Flink 作業集群,處理離線 ETL 和實時日志分析,高峰期啟動 3000+Pod;
- 中間件服務:Redis 集群、Kafka 消息隊列、MySQL 數據庫(StatefulSet 部署),保障數據存儲與傳輸;
- CI/CD 流水線:基于 Jenkins Agent Pod 動態構建、測試和部署應用,日均執行 2000 + 次流水線任務。
為保障集群穩定,我們采用 Prometheus + Grafana 監控資源使用,通過 HPA 自動伸縮 Pod,并定期進行混沌工程演練,確保業務 SLA 不低于 99.95%。