5分鐘搞懂K8S Pod Terminating/Unknown故障排查

Kubernetes集群中的Pod有時候會進入Terminating或Unknown狀態,本文列舉了6種可能的原因,幫助我們排查這種現象。原文: K8s Troubleshooting — Pod in Terminating or Unknown Status

alt

有時我們會看到K8S集群中的pod進入"Terminating"或"Unknown"狀態,pod進入這兩種狀態可能有以下原因:

alt
  • 優雅終止周期(Graceful termination period): 當pod被刪除時,會進入"Terminating"狀態,等待容器優雅關閉。如果容器關閉所需時間超過默認期限(默認30秒),則pod將保持在"Terminating"狀態。
  • Finalizers: Finalizer是一種允許在刪除資源之前清理資源的機制。如果pod有Finalizer,并且相關的清理操作被卡住或沒有響應,則pod將保持在"Terminating"狀態。
  • 無響應容器(Unresponsive containers): 如果pod中的容器在終止過程中沒有響應SIGTERM信號,則可能導致pod卡在"Terminating"狀態。
  • 節點問題(Node issues): 如果節點無響應、斷開連接或遇到其他問題,pod可能會進入"Unknown"狀態。在這種情況下,Kubernetes控制平面無法確定pod的實際狀態。
  • 網絡問題(Network issues): 節點與Kubernetes控制平面之間的連接問題可能導致pod進入"Unknown"狀態。例如,如果控制平面無法與節點通信,則無法接收來自pod的狀態更新。
  • Kubelet問題: 如果節點上運行的Kubelet進程出現問題或崩潰,可能會導致無法將pod狀態上報給控制平面,從而造成pod進入"Unknown"狀態。
故障排查
優雅終止周期(Graceful termination period)

K8S中的優雅終止周期是在刪除pod時,容器的優雅關閉時間。在此期間,容器接收SIGTERM信號,執行必要的清理工作,例如關閉連接,完成正在進行的任務,并在資源終止之前釋放資源,默認為30秒。

  • 檢查pod狀態和事件: 通過 kubectl檢查pod的狀態和事件以獲取相關信息:
$?kubectl?describe?pod?<pod-name>?-n?<namespace>
  • 檢查容器日志:
$?kubectl?logs?<pod-name>?-c?<container-name>?-n?<namespace>?--previous
  • 調整優雅終止周期: 如果容器始終需要更多的時間來清理資源,可以通過在pod的YAML文件中設置 terminationGracePeriodSeconds字段來調整pod的終止周期。
apiVersion:?v1
kind:?Pod
metadata:
??name:?my-pod
spec:
??terminationGracePeriodSeconds:?60
??containers:
??-?name:?my-container
????image:?my-image
Finalizers

Finalizer允許在刪除資源之前清理資源,如果pod上存在Finalizer,并且相關的清理操作被卡住或沒有響應,則pod將保持在"Terminating"狀態。例如:

apiVersion:?v1
kind:?Pod
metadata:
??name:?my-finalizer-pod
??finalizers:
????-?example.com/cleanup
spec:
??containers:
??-?name:?busybox
????image:?busybox
????command:?["sh",?"-c",?"sleep?3600"]

檢查是否有finalizer,可以運行以下命令:

$?kubectl?get?pod?<pod-name>?-n?<namespace>?-o?json

如果確定不需要finalizer,或者確定可以將其安全刪除,可以使用kubectl patch命令。但是,這樣做要小心,因為可能會導致意想不到的副作用:

$?kubectl?patch?pod?<pod-name>?-n?<namespace>?-p?'{"metadata":{"finalizers":["<finalizer-1>",?"<finalizer-2>",?...]}}'
無響應容器(Unresponsive containers)

當容器消耗過多系統資源時,可能會進入無響應狀態。

  • kubectl describe命令查看Pod狀態和事件。
$?kubectl?describe?pod?<pod-name>?-n?<namespace>
  • 檢查Pod/container日志:
$?kubectl?logs?<pod-name>?-c?<container-name>?-n?<namespace>
  • 強制刪除pod: 可以強制刪除被卡住的pod
$?kubectl?delete?pod?<pod-name>?-n?<namespace>?--force?--grace-period=0
節點/網絡/Kubelet問題

執行以下步驟處理節點問題:

  • 檢查節點狀態/事件: 檢查pod所在節點的狀態:
$?kubectl?describe?node?<node-name>
$?kubectl?get?events?--field-selector?involvedObject.kind=Node,involvedObject.name=<node-name>
  • 檢查節點系統日志
$?journalctl?-u?kubelet
$?journalctl?-u?docker
$?journalctl?-u?containerd
$?cat?/var/log/messages
  • 排空節點: 如果已經確定了節點問題,并且需要執行維護,可以排空節點以安全驅逐所有正在運行的pod,并將節點標記為不可調度:
$?kubectl?drain?<node-name>
結論
alt

你好,我是俞凡,在Motorola做過研發,現在在Mavenir做技術工作,對通信、網絡、后端架構、云原生、DevOps、CICD、區塊鏈、AI等技術始終保持著濃厚的興趣,平時喜歡閱讀、思考,相信持續學習、終身成長,歡迎一起交流學習。為了方便大家以后能第一時間看到文章,請朋友們關注公眾號"DeepNoMind",并設個星標吧,如果能一鍵三連(轉發、點贊、在看),則能給我帶來更多的支持和動力,激勵我持續寫下去,和大家共同成長進步!

- END -

本文由 mdnice 多平臺發布

本文來自互聯網用戶投稿,該文觀點僅代表作者本人,不代表本站立場。本站僅提供信息存儲空間服務,不擁有所有權,不承擔相關法律責任。
如若轉載,請注明出處:http://www.pswp.cn/news/213670.shtml
繁體地址,請注明出處:http://hk.pswp.cn/news/213670.shtml
英文地址,請注明出處:http://en.pswp.cn/news/213670.shtml

如若內容造成侵權/違法違規/事實不符,請聯系多彩編程網進行投訴反饋email:809451989@qq.com,一經查實,立即刪除!

相關文章

每日一練【查找總價格為目標值的兩個商品】

一、題目描述 題目鏈接 購物車內的商品價格按照升序記錄于數組 price。請在購物車中找到兩個商品的價格總和剛好是 target。若存在多種情況&#xff0c;返回任一結果即可。 示例 1&#xff1a; 輸入&#xff1a;price [3, 9, 12, 15], target 18 輸出&#xff1a;[3,15] …

成都工業學院Web技術基礎(WEB)實驗一:HTML5排版標簽使用

寫在前面 1、基于2022級計算機大類實驗指導書 2、代碼僅提供參考&#xff0c;前端變化比較大&#xff0c;按照要求&#xff0c;只能做到像&#xff0c;不能做到一模一樣 3、圖片和文字僅為示例&#xff0c;需要自行替換 4、如果代碼不滿足你的要求&#xff0c;請尋求其他的…

Python+AI實現AI繪畫

&#x1f517; 運行環境&#xff1a;Python &#x1f6a9; 撰寫作者&#xff1a;左手の明天 &#x1f947; 精選專欄&#xff1a;《python》 &#x1f525; 推薦專欄&#xff1a;《算法研究》 &#x1f510;#### 防偽水印——左手の明天 ####&#x1f510; &#x1f497; 大家…

Gemini與GPT-4的巔峰對決:AI界的雙壁之戰

隨著人工智能技術的飛速發展&#xff0c;AI領域的競爭越來越激烈。在這個充滿挑戰與機遇的時代&#xff0c;兩個備受矚目的AI巨頭——Gemini Pro和GPT-4&#xff0c;成為了人們關注的焦點。這兩者都以其強大的功能和卓越的性能&#xff0c;引領著AI領域的發展潮流。本文將詳細介…

MyBatisX插件

MyBatisX插件 MyBatis-Plus為我們提供了強大的mapper和service模板&#xff0c;能夠大大的提高開發效率。 但是在真正開發過程中&#xff0c;MyBatis-Plus并不能為我們解決所有問題&#xff0c;例如一些復雜的SQL&#xff0c;多表聯查&#xff0c;我們就需要自己去編寫代碼和SQ…

connection error;reply-code=503;unknown exchange type ‘x-delayed-message‘

錯誤原因 這個錯誤表明你的 RabbitMQ 服務器不認識交換機類型 “x-delayed-message”&#xff0c;這通常是因為你的 RabbitMQ 服務器沒有啟用 rabbitmq_delayed_message_exchange 插件&#xff0c;或者插件版本與你的 RabbitMQ 服務器不兼容。 解決方法 啟用 RabbitMQ 延遲隊…

JAVA安全之Spring參數綁定漏洞CVE-2022-22965

前言 在介紹這個漏洞前&#xff0c;介紹下在spring下的參數綁定 在Spring框架中&#xff0c;參數綁定是一種常見的操作&#xff0c;用于將HTTP請求的參數值綁定到Controller方法的參數上。下面是一些示例&#xff0c;展示了如何在Spring中進行參數綁定&#xff1a; 示例1&am…

2024年C語言基礎知識入門來了,一文搞定C語言基礎知識!

一、C語言基礎知識入門 c語言基礎知識入門一經出現就以其功能豐富、表達能力強、靈活方便、應用面廣等特點迅速在全世界普及和推廣。C語言不但執行效率高而且可移植性好&#xff0c;可以用來開發應用軟件、驅動、操作系統等&#xff0c;2024年C語言基礎知識入門大全。C語言基礎…

Spring boot 使用Redis 消息發布訂閱

Spring boot 使用Redis 消息發布訂閱 文章目錄 Spring boot 使用Redis 消息發布訂閱Redis 消息發布訂閱Redis 發布訂閱 命令 Spring boot 實現消息發布訂閱發布消息消息監聽主題訂閱 Spring boot 監聽 Key 過期事件消息監聽主題訂閱 最近在做請求風控的時候&#xff0c;在網上搜…

postgreSql邏輯復制常用語句匯總和說明

簡單說明 postgreSql邏輯復制的原理這里不再贅述&#xff0c;度娘一下即可。這里只是對常用的語句做一些匯總和說明&#xff0c;以便日后查找時方便。 邏輯復制的概念 邏輯復制整體上采用的是一個發布訂閱的模型&#xff0c;訂閱者可以訂閱一個或者多個發布者&#xff0c; 發…

全套的外貿出口業務流程,趕緊收藏起來吧

很多做外貿的小伙伴入行遇到的第一個問題就是對外貿業務流程的不熟悉&#xff0c;今天小易給大家整理了一份外貿業務全流程&#xff0c;從開發客戶到售后服務一整套流程&#xff0c;一起來看看吧&#xff01; 目前做外貿開發客戶的渠道一般有以下幾種&#xff1a; 1、自建站、外…

如何在 Windows 中恢復已刪除的 Excel 文件?– 8 個有效方法!

如何恢復已刪除的Excel文件&#xff1f;如果您不小心刪除了 Excel 文件或該文件已損壞&#xff0c;您無需擔心會丟失寶貴的數據。MiniTool 分區向導的這篇文章提供了 8 種有效的方法來幫助您恢復它們。 Microsoft Excel 是 Microsoft 為 Windows、macOS、Android、iOS 和 iPad…

【lesson4】數據類型之數值類型

文章目錄 數據分類數值類型tinyint類型有符號類型測試無符號類型測試 bit類型測試 float類型有符號測試無符號測試 decimal類型測試 數據分類 數值類型 tinyint類型 說明&#xff1a;tinyint 有符號能存儲的范圍是-128-127&#xff0c;無符號能存儲的范圍是0~255 有符號類型…

藍橋杯-動態規劃專題-子數組系列,雙指針

目錄 一、單詞拆分 二、環繞字符串中唯一的子字符串 雙指針-三數之和 ArrayList(Arrays.asList(array)) 四、四數之和&#xff08;思路和三數之和一樣&#xff0c;只是多了一層循環&#xff09; 一、單詞拆分 1.狀態表示 dp[i]:到達i位置結尾&#xff0c;能否被dict拆分 …

Terraform實戰(二)-terraform創建阿里云資源

1 初始化環境 1.1 創建初始文件夾 $ cd /data $ mkdir terraform $ mkdir aliyun terraform作為terraform的配置文件夾&#xff0c;內部的每一個.tf&#xff0c;.tfvars文件都會被加載。 1.2 配置provider 創建providers.tf文件&#xff0c;配置provider依賴。 provider…

想學編程,但不知道從哪里學起,應該怎么辦?

怎樣學習任何一種編程語言 我將教你怎樣學習任何一種你將來可能要學習的編程語言。本書的章節是基于我和很多程序員學習編程的經歷組織的&#xff0c;下面是我通常遵循的流程。 1&#xff0e;找到關于這種編程語言的書或介紹性讀物。 2&#xff0e;通讀這本書&#xff0c;把…

MYSQL數據類型詳解

MySQL支持多種數據類型&#xff0c;這些數據類型可以分為三大類&#xff1a;數值、日期和時間以及字符串&#xff08;字符&#xff09;類型。這些數據類型可以幫助我們根據需要選擇合適的類型來存儲數據。選擇合適的數據類型對于確保數據的完整性和性能至關重要。 以下…

RHEL8_Linux用rpm管理軟件

本章主要介紹使用rpm對軟件包進行管理 使用rpm查詢軟件的信息使用rpm安裝及卸載軟件使用rpm對軟件進行更新使用rpm對軟件進行驗證 rpm 全稱是redhat package manager&#xff0c;后來改成rpm package manager&#xff0c;這是根據源碼包編譯出來的包。先從光盤中拷貝一個包&am…

基于Java Swing泡泡龍游戲(Java畢業設計)

大家好&#xff0c;我是DeBug&#xff0c;很高興你能來閱讀&#xff01;作為一名熱愛編程的程序員&#xff0c;我希望通過這些教學筆記與大家分享我的編程經驗和知識。在這里&#xff0c;我將會結合實際項目經驗&#xff0c;分享編程技巧、最佳實踐以及解決問題的方法。無論你是…

AP9111手電筒專用集成電路芯片 單節干電池 LED手電筒IC

概述 AP9111 是 LED 手電筒專用集成電路芯片 &#xff0c;是一款采用大規模集成電路技術&#xff0c;專門針對單節干電池的 LED 手電筒設計的一款專用集成電路。外加 1 個電感元件&#xff0c;即可構成 LED 手電筒驅動電路板。AP 9111 性能優越、可靠性高、使用簡單、生產一致…