大模型流式長鏈接場景下 k8s 優雅退出 JAVA

一、 java?bootstrap.yml??

bootstrap.yml 啟動文件增加timeout-per-shutdown-phase?

spring:lifecycle:timeout-per-shutdown-phase: 30m# 這個值是故意設置這么大的,因為現在推理服務支持深度思考# 為了保證用戶側的連接不被斷開,因此我們需要設置超大 graceful shutdown 時間# 注意: 為了保證這個值是有效的,需要確保 k8s 中的 terminationGracePeriod 不低于此時間# 否則 k8s 會強制殺死 pod(這個值相當于不生效)# 上線前需要檢查 nacos 中是否有這個配置,防止配置被覆蓋

timeout-per-shutdown-phase:?

服務主進程優雅退出的時間 默認30s,配置該參數后可以實現如果當前還有未斷開的鏈接那么主進程會在給定的時間后強制退出。

應用場景下:

當程序收到 kill -15的信號java默認timeout-per-shutdown-phase的參數為30s 也就說等待30s后pod內的進程就會自動退出(kill -9)之后就會與上游的服務斷開鏈接,如果上游的服務有復用鏈接的特性那么會更為明顯。屆時客戶端就會接受到503(服務暫時不可用)的http狀態碼。

二、k8s yaml 增加配置

        lifecycle:preStop:exec:command:- sh- -c- sleep 70terminationGracePeriodSeconds: 1800

?配置解釋:

preStop:

必須配置,否則每次發布k8s的pod進入到Terminating狀態后,會立刻刪除pod網絡相關的配置例如Pod Ip 、路由等

應用場景下:?

配置preStop后pod會進入到Terminating狀態同時會從endpointSlice上摘除這個節點,也就意味著該節點不會接收新的流量,但是pod的IP以及網絡配置還是存在的因為pod沒有進入到回收的階段還在sleep, 通過preStop鉤子 進入到sleep階段 這個時候就會將已經進入到該pod的請求繼續進行處理,不會強制中斷和上游的鏈接


terminationGracePeriodSeconds:

給定pod最大回收的時間,我這里配置了1800s,pod一旦超過了30分鐘即使還有未中斷的鏈接(沒有處理完的請求) 都會強制被回收。

本文來自互聯網用戶投稿,該文觀點僅代表作者本人,不代表本站立場。本站僅提供信息存儲空間服務,不擁有所有權,不承擔相關法律責任。
如若轉載,請注明出處:http://www.pswp.cn/bicheng/91436.shtml
繁體地址,請注明出處:http://hk.pswp.cn/bicheng/91436.shtml
英文地址,請注明出處:http://en.pswp.cn/bicheng/91436.shtml

如若內容造成侵權/違法違規/事實不符,請聯系多彩編程網進行投訴反饋email:809451989@qq.com,一經查實,立即刪除!

相關文章

uni-app用css編寫族譜樹家譜樹

需求背景:公司接到一個項目,是需要做一個族譜微信小程序,需要有族譜樹,且可以添加家族人員。 靈感來源:在插件市場中下載了作者 羊羊不想寫代碼 的插件tree-list族譜,樹形列表,可縮放滑動 - DC…

思途JSP學習 0731

繼0730,我們對項目做最后的升級一、刪除功能1、新增復選框輔助刪除條目的選擇修改我們的list.jsp和list.js在列表的第一列增加一列選擇框2、給復選框添加全選與行點擊選擇功能在行選擇功能中,因為此時的選擇框還未生成,所以我們將事件委托給他…

某訊視頻風控參數逆向分析

文章目錄1. 寫在前面2. 接口分析3. 加密分析4. 扣JS代碼【🏠作者主頁】:吳秋霖 【💼作者介紹】:擅長爬蟲與JS加密逆向分析!Python領域優質創作者、CSDN博客專家、阿里云博客專家、華為云享專家。一路走來長期堅守并致力…

[Broken IOS] 配置CLI | 終端用戶界面TUI

鏈接:https://palera.in/ docs:palera1n palera1n 是一款專為 Jailbroken蘋果設備 設計的強大工具,支持運行 iOS/iPadOS/tvOS 15.0 及更新系統 的 iPhone、iPad 和 Apple TV。 該工具通過 DFU 模式 下的底層 USB 通信引導設備,…

論文閱讀|ArxiV 2024|Mamba進一步研究|VSSD

論文地址:pdf 代碼地址:code 文章目錄1.研究背景與動機2. 核心方法2.1 預備知識:mamba-ssm2.2 非因果狀態空間對偶性2.3 視覺狀態空間對偶性模型3. 實驗結果3.1 圖像分類任務3.2 目標檢測任務3.3 語義分割任務3.4 消融實驗4.局限性與結論4.1 局限性4.2 結…

Flutter中 Provider 的基礎用法超詳細講解(二)之ChangeNotifierProvider

目錄 前言 一、什么是ChangeNotifierProvider? 二、ChangeNotifier的簡單用法 1.定義狀態類 2.使用ChangeNotifierProvider提供狀態 3.獲取狀態并監聽更新 1.Consumer 2.通過API方式獲取 1.Provider.of (context) 2.context.watch () 3.context.read () 4.各種獲…

2025電商CPS分銷與推客系統小程序開發:趨勢、架構與實戰解析

一、行業趨勢:CPS模式與社交電商的深度融合1.1 電商行業新趨勢根據《2025年電子商務行業發展趨勢預測報告》,社交電商與內容營銷已成為核心增長點。消費者行為呈現三大特征:消費習慣轉變:線上購物占比超70%,Z世代用戶更…

Conda環境下配置的基本命令

功能命令創建環境conda create -n myenv python3.11激活環境conda activate myenv刪除環境conda env remove -n myenv復制環境conda create -n newenv --clone myenv列出所有環境conda env list列出環境所有包conda list徹底清除某個 Conda 環境中的所有已安裝包(但…

Ps2025

快捷鍵CShs保存CSw存儲為S選取疊加選取,A選取減去選區C回車保存路徑內容識別 SF5 ADel填充前景色CDel填充背景色A上下 上下行間距A左右 左右字間距C左鍵絲滑放大縮小CASE蓋印圖層C}上移一格CG新建組sF6羽化像素鋼筆工具打上抹點,按住shift水平拉調增弧度左右兩個手柄…

ceph sc 設置文件系統格式化參數

前言 默認的 sc 文件系統 inode 太少,對于小文件場景,往往會出現容量沒滿,inode 已經用盡的情況,本文說明如何設置 inode。 說明 本文使用的是 rook-ceph 部署的 ceph 作為存儲后端。 xfs 文件系統 sc 創建帶格式化參數的 xfs 文件系統的 sc allowVolumeExpansion: t…

【LY88】ubuntu下的常用操作

vscode 下載安裝包 在安裝包所處文件夾空白區域右鍵調出終端 輸入下行命令安裝 c后接tab自動補全安裝包名稱(前提是該文件夾中僅這一個c開頭文件,否則得再輸點字母,保證其可唯一索引到) sudo dpkg -i ctab安裝完畢后輸入code&…

web應用從服務器主動推動數據到客戶端的方式

html5 websocket 全雙工交互 全雙工通信:建立持久連接,服務端和客戶端可隨時互相發送消息 低延遲:適合實時應用(聊天、游戲、股票行情等) socket協議是與HTTP協議平級的,websocket協議是建立在TCP協議之上的…

基于Spring Boot實現中醫醫學處方管理實踐

基于Spring Boot實現中醫醫學處方管理 以下是基于Spring Boot實現中醫醫學處方管理的相關示例和資源整理,涵蓋基礎架構、功能模塊及實際應用案例: 基礎項目結構 Spring Boot中醫處方系統通常采用MVC分層設計: 實體類:定義處方、藥材、患者等JPA實體 @Entity public clas…

從“人工核驗”到“智能鑒防”:護照鑒偽設備的科技革命

“一本偽造護照的查獲成本從72小時降至3秒,背后是光學傳感、量子加密與多模態AI的十年協同進化。”2025年全球邊檢口岸查獲偽假護照近500份,其中芯片偽造占比首超40%。當造假技術逼近分子級仿制,傳統肉眼鑒別徹底失效,多光譜成像、…

無人機飛控系統3D (C++)實踐

大疆無人機飛控系統3D模型開發 大疆無人機飛控系統3D模型開發(C++) 核心架構設計 大疆無人機的飛控系統通常采用分層架構,分為硬件抽象層(HAL)、中間件層和應用層。HAL負責與傳感器/執行器直接交互,中間件處理數據融合和通信協議,應用層實現核心控制算法。 典型代碼結…

ES6中import與export的用法詳解

目錄 一、ES6模塊化的核心概念 1. 模塊化的基本規則 二、export的用法 1. 命名導出(Named Export) 示例: 2. 默認導出(Default Export) 示例: 默認導出函數或類: 3. 導出語句的統一聲明…

硬核技術協同:x86 生態、機密計算與云原生等技術如何為產業數字化轉型筑底賦能

在產業數字化轉型的浪潮中,x86 生態構建、機密計算與 AI 融合、高性能網卡突破、云原生 OS 實踐、國產數據庫優化等技術領域的突破,正成為支撐數字化基礎設施升級與業務創新的核心引擎。以下從技術深度與產業實踐角度,系統性解析各領域的最新…

Java項目:基于SSM框架實現的網絡財務管理系統【ssm+B/S架構+源碼+數據庫+畢業論文+遠程部署】

摘 要 現代經濟快節奏發展以及不斷完善升級的信息化技術,讓傳統數據信息的管理升級為軟件存儲,歸納,集中處理數據信息的管理方式。本網絡財務管理系統就是在這樣的大環境下誕生,其可以幫助管理者在短時間內處理完畢龐大的數據信息…

1.5.Vue v-for 和 指令修飾符

vue v-for當你使用 v-for 指令來渲染列表時,為每個元素提供一個唯一的 key 屬性是非常重要的。key 是用來給 Vue 一個提示,以便它能夠追蹤每個節點的身份,從而更高效地更新虛擬 DOM。key 的作用唯一標識:key 應該是每項數據的唯一…

(RedmiBook)上禁用觸摸板或自帶鍵盤

在紅米筆記本(RedmiBook)上禁用觸摸板或自帶鍵盤,可以通過以下幾種方法實現: 方法一:通過設備管理器禁用(Windows 系統) 禁用觸摸板 打開設備管理器 按 Win X → 選擇 “設備管理器”或 Win …