K8S常見問題匯總

一、 驅逐 master 節點上的所有 Pod

這會“清空”一個節點(包括 master)上的所有可驅逐的 Pod:

kubectl drain <master-node-name> --ignore-daemonsets --delete-emptydir-data
  • --ignore-daemonsets:保留 DaemonSet 類型的 Pod
  • --delete-emptydir-data:允許刪除使用 emptyDir 的本地數據

例如:

kubectl drain master-node-01 --ignore-daemonsets --delete-emptydir-data

?? 注意: 你可能需要先允許對 master 節點操作:

kubectl taint nodes master-node-01 node-role.kubernetes.io/master-

要徹底不讓 Pod 再運行在 master 節點上,你可以通過以下幾種方式來實現。推薦使用的是 給 master 節點打 taint,并確保 Pod 不會設置容忍(toleration)去匹配這個 taint。

? 步驟一:給 master 節點打 Taint(防止調度業務 Pod)

執行以下命令,給 master 節點打 taint:

kubectl taint nodes <master-node-name> node-role.kubernetes.io/master=:NoSchedule

例如,如果你的 master 節點名字是 master-node-01:

kubectl taint nodes master-node-01 node-role.kubernetes.io/master=:NoSchedule

這條命令的意思是:不允許任何沒有明確容忍該 taint 的 Pod 調度到 master 節點上。

? 步驟二:確保你的業務 Pod 沒有添加 tolerations

查看你的 Deployment、StatefulSet、Pod 等 YAML,確認里面沒有如下 toleration 字段:

tolerations:
- key: "node-role.kubernetes.io/master"effect: "NoSchedule"

如果有,要把這段刪掉。

?(可選)步驟三:把現有運行在 master 節點上的 Pod 遷移出去


kubectl drain <master-node-name> --ignore-daemonsets --delete-emptydir-data

例如:

kubectl drain master-node-01 --ignore-daemonsets --delete-emptydir-data

這樣會驅逐業務 Pod,但保留 DaemonSet 等系統 Pod。

🚫 常見誤區

  • 只設置了 taint,不遷移現有 Pod → 現有 Pod 不會自動移動,要你手動 drain

  • 有容忍規則的 Pod 仍然可以調度到 master → 所以要確保沒有寫 tolerations

二、調度失敗

如果出現報錯0/3 nodes are available: 1 Insufficient cpu, 1 node(s) had untolerated taint {node-role.kubernetes.io/master: }, 1 node(s) had untolerated taint {node.kubernetes.io/disk-pressure: }. preemption: 0/3 nodes are available: 1 No preemption victims found for incoming pod, 2 Preemption is not helpful for scheduling..
這個報錯信息說明 Pod 無法調度 到任何節點,原因如下:

? 調度失敗原因解析

共 3 個節點,全部不可用:

1?? 1 Insufficient cpu
有一個節點 CPU 不足,無法調度 Pod。

2?? 1 node(s) had untolerated taint {node-role.kubernetes.io/master: }
有一個節點是 master,并且帶有 taint node-role.kubernetes.io/master:NoSchedule,但 Pod 沒有 toleration,所以不能調度過去。

3?? 1 node(s) had untolerated taint {node.kubernetes.io/disk-pressure: }
有一個節點存在 磁盤壓力(disk pressure),K8s 自動打了 taint:

node.kubernetes.io/disk-pressure:NoSchedule

Pod 默認不會容忍這個 taint,所以不能調度過去。

? 方法:清理磁盤壓力節點

在master節點執行下面命令:

kubectl describe node <node-name>

?當前節點的問題:

  • 磁盤空間不足 導致:

    • 自動打上 disk-pressure taint;

    • kubelet 嘗試清理鏡像失敗:

Failed to garbage collect required amount of images.
Attempted to free 46250890035 bytes, but only found 0 bytes eligible to free.
  • 被標記為不能調度業務 Pod。

? 建議解決步驟:

? 1. 清理無用鏡像

在 k8s-node1 節點上運行以下命令:

sudo crictl rmi --prune

sudo docker system prune -a

?? 第二個命令適用于使用 Docker 作為容器運行時的情況,你用的是 containerd,所以首選 crictl 命令。

? 2. 查看哪些文件占用了磁盤空間

你可以使用以下命令找出大文件和目錄(推薦):

sudo du -h / --max-depth=1 | sort -hr | head -n 20

特別關注 /var/lib/containerd//var/lib/docker/,這些目錄通常會積累大量鏡像和容器數據。

本文來自互聯網用戶投稿,該文觀點僅代表作者本人,不代表本站立場。本站僅提供信息存儲空間服務,不擁有所有權,不承擔相關法律責任。
如若轉載,請注明出處:http://www.pswp.cn/web/79064.shtml
繁體地址,請注明出處:http://hk.pswp.cn/web/79064.shtml
英文地址,請注明出處:http://en.pswp.cn/web/79064.shtml

如若內容造成侵權/違法違規/事實不符,請聯系多彩編程網進行投訴反饋email:809451989@qq.com,一經查實,立即刪除!

相關文章

【銀河麒麟高級服務器操作系統】服務器外掛存儲ioerror分析及處理分享

更多銀河麒麟操作系統產品及技術討論&#xff0c;歡迎加入銀河麒麟操作系統官方論壇 forum.kylinos.cn 了解更多銀河麒麟操作系統全新產品&#xff0c;請點擊訪問 麒麟軟件產品專區&#xff1a;product.kylinos.cn 開發者專區&#xff1a;developer.kylinos.cn 文檔中心&a…

C++命名空間、內聯與捕獲

命名空間namespace 最常見的命名空間是std,你一定非常熟悉,也就是: using namespace std;命名空間的基本格式 注意,要在頭文件里面定義! namespace namespace_name{data_type function_name(data_type parameter){data_type result;//function contentreturn result;}…

軟件測試名詞科普:驅動模塊、樁模塊

目錄 1. 驅動模塊 2. 樁模塊? 3. 驅動模塊 vs 樁模塊 對比表 4. 示例代碼 在軟件測試中&#xff0c;?驅動模塊&#xff08;Driver Module&#xff09;?和樁模塊&#xff08;Stub Module&#xff09;?是兩種用于單元測試的關鍵組件&#xff0c;主要用于模擬測試環境中的…

線程池的核心參數和線程創建方式,線程和進程

Java線程池的核心參數 Java線程池通過ThreadPoolExecutor類進行配置&#xff0c;其核心參數如下&#xff1a; corePoolSize&#xff08;核心線程數&#xff09; 作用&#xff1a;線程池中保持活動的最小線程數&#xff0c;即使這些線程處于空閑狀態。 行為&#xff1a;默認情…

【報錯】view size is not compatible with input tensor‘s size and stride

完整報錯 Traceback (most recent call last): File "D:\360MoveData\Users\HONOR\whu\TwoStageTraining.py", line 590, in <module> criterionseg_criterion, save_dir./models, writerwriter_first_stage) File "D:\360MoveData\Users\HONOR\whu\TwoS…

汽車免拆診斷案例|車輛行駛中急加速車身抖動故障排除 2 例

案例1 2017款豐田卡羅拉車行駛中急加速車身偶爾抖動 故障現象  一輛 2017款豐田卡羅拉車&#xff0c;搭載9NR 發動機&#xff0c;累計行駛里程約為9.6萬km。車主進廠反映&#xff0c;該車行駛中急加速時&#xff0c;車身偶爾抖動。 故障診斷  接車后試車&#xff0c;發動機…

vue3 computed方法使用詳細講解

Computed方法用于創建計算屬性&#xff0c;它的值由其他響應式數據計算得出&#xff0c;并且會在依賴數據發生改變時自動更新。因為vue3兼容vue2的選項式api,所以習慣用vue2的小伙伴可以直接用vue2的方法寫是沒有問題的。但我這里介紹的是computed在vue3中的新語法&#xff1a;…

std::iota(C++)

std::iota 1. 概述2. 函數原型3. 使用示例示例 1&#xff1a;填充 vector<int>示例 2&#xff1a;從非零起始值開始 4. 應用場景5. 注意事項6. 與其它算法比較小結 1. 概述 std::iota 定義在頭文件 中&#xff0c;C11 起引入。 它用于向前迭代器區間依次填入連續遞增的數…

基于Jaccard算法的用戶瀏覽歷史推薦商品系統實戰+springboot+vue源碼實現

大家好&#xff0c;這里是小羅畢設工作室。今天給大家帶來了一套完整的推薦系統&#xff1a; “基于Jaccard算法的用戶瀏覽歷史推薦商品系統”。 系統源碼后端實現是springboot&#xff0c;前端是vue3。 視頻演示 基于Jaccard算法的用戶瀏覽歷史推薦商品系統實戰 圖片截圖 算法…

正態分布和冪律分布

1. 背景與引入 正態分布 歷史來源&#xff1a;18世紀由高斯&#xff08;Gauss&#xff09;在研究測量誤差時提出&#xff0c;后被廣泛應用于自然現象和社會科學的數據建模。重要性&#xff1a;被稱為“鐘形曲線”&#xff0c;是統計學中最核心的分布之一&#xff0c;支撐中心極…

免費AI圖像編輯平臺,最新無損放大技術

軟件介紹 騰訊ARC網頁在線AI圖片處理是一款由騰訊ARC實驗室推出的在線圖像處理工具。憑借騰訊的科技實力&#xff0c;這款工具在圖像處理領域展現了卓越的性能。 功能亮點 這款在線圖像處理工具提供多種功能&#xff0c;包括人像修復、人像摳圖、動漫增強、萬物識別以及…

# 部署深度學習模型:Flask API 服務端與客戶端通信實戰

部署深度學習模型&#xff1a;Flask API 服務端與客戶端通信實戰 在這篇文章中&#xff0c;我們將探討如何使用 Flask 框架部署一個深度學習模型&#xff0c;并通過客戶端與服務端進行通信。我們將通過一個實際的例子&#xff0c;展示如何構建服務端和客戶端&#xff0c;以及如…

物理服務器緊急救援:CentOS系統密碼重置全流程實戰指南

前言 在企業IT運維實踐中&#xff0c;物理服務器密碼丟失是典型的"低概率高風險"事件。某金融科技公司曾因核心服務器密碼遺失導致業務中斷36小時&#xff0c;直接損失超過800萬元。這起真實案例揭示了系統密碼管理的關鍵性——當承載重要業務的物理服務器遭遇密碼丟…

【學習心得】好用算力平臺推薦OpenBayes“貝式計算”

好用是有定義的&#xff0c;我之前用過AutoDL和DAMODEL&#xff08;丹摩智算&#xff09;&#xff0c;我這里就不扯哪些我覺得不關鍵的因素。先不廢話直接給出導航鏈接以及CSDN上的官方主頁&#xff1a; OpenBayes官方網站https://openbayes.com/ OpenBayes官方CSDN賬號主頁h…

政務瀏覽器 一站式首頁功能配置說明

一、政務瀏覽器自定義首頁目的和意義 政務綜合窗口&#xff0c;通常需要打開諸多的業務系統進行受理和查詢&#xff1b;反復的錄入系統地址或者在收藏夾查找系統入口&#xff0c;影響辦事效率。政務瀏覽器為該場景設計了一款可定制的“首頁”。 “首頁”可以根據需要&#xff0…

linux nginx配置訪問目錄,訪問文件直接下載,linux配置nginx直鏈下載

很簡單的一個配置&#xff0c;不指定為啥&#xff0c;別人寫的都好麻煩&#xff0c;而且很多配置了也不行&#xff0c;明明就是幾句話的事啊&#xff0c;唉。 話不多說&#xff0c;直接上配置 worker_processes 1; events {worker_connections 1024; } http {include …

驅動開發硬核特訓 · Day 28(上篇):pinctrl 子系統詳解與實戰分析

&#x1f4da; 技術平臺&#xff1a;嵌入式Jerry&#xff08;B站&#xff09; 一、引言 在嵌入式系統中&#xff0c;SoC 芯片的引腳通常具有多種功能&#xff0c;如 GPIO、UART、I2C、SPI 等。為了在不同的應用場景中靈活配置引腳功能&#xff0c;Linux 內核引入了 pinctrl&am…

圖漾相機——Sample_V2示例程序(待補充)

文章目錄 1.SDK支持的平臺類型1.1 Windows 平臺1.2 Linux平臺 2.Sample_V2編譯流程2.1 Windows環境2.2 Linux環境編譯 3.Sample_V2示例程序測試3.1 ListDevice_v23.2 DepthStream_v23.3 ExposureTimeSetting_v23.4 ForceDeviceIP_v23.5 GetCalibData_v23.6 NetStatistic_v23.7 …

Google-chrome版本升級后sogou輸入法不工作了

背景&#xff1a; 筆記本Thinkpad E450&#xff0c;操作系統Ubuntu 24.04.2 LTS&#xff0c;Chrome瀏覽器版本135.0.7049.114-1&#xff0c;Edge瀏覽器版本131.0.2903.99-1&#xff0c;輸入法Sogou版本4.2.1.145 現象&#xff1a; - **正常場景**&#xff1a;Edge中可通過Ctrl…

7系列 之 OSERDESE2

背景 《ug471_7Series_SelectIO.pdf》介紹了Xilinx 7 系列 SelectIO 的輸入/輸出特性及邏輯資源的相關內容。 第 1 章《SelectIO Resources》介紹了輸出驅動器和輸入接收器的電氣特性&#xff0c;并通過大量實例解析了各類標準接口的實現。 第 2 章《SelectIO Logic Resource…