[CVPR 2025] 高效無監督Prompt與偏好對齊驅動的半監督醫學分割

CVPR 2025 | 優化SAM:高效無監督Prompt與偏好對齊驅動的半監督醫學分割

論文信息

  • 標題:Enhancing SAM with Efficient Prompting and Preference Optimization for Semi-supervised Medical Image Segmentation
  • 作者:Aishik Konwer, Zhijian Yang, Erhan Bas, Cao Xiao, Prateek Prasanna, Parminder Bhatia, Taha Kass-Hout
  • 單位:Stony Brook University, GE Healthcare
  • 會議:CVPR 2025

背景簡介

Segment Anything Model(SAM)等基礎模型已成為醫學圖像分割的重要工具,但仍依賴大量人工標注或專家prompt,難以充分利用無標注大數據,且人工成本高昂。現有自監督/弱監督提升方案要么僅用于訓練偽標簽,要么缺乏高效的偏好對齊,仍未實現真正低標注、高性能的自動化醫學分割。


創新方法

  1. 高效無監督Prompt生成

    • 融合BiomedCLIP、MedVInT(VQA)、GPT-4等多模態大模型,自動生成融合語義、定位、形狀等關鍵信息的bounding box和文本prompt,無需人工參與
    • 視覺prompt基于CLIP生成顯著性圖+CRF優化,提取目標區域坐標;文本prompt融合疾病/器官通用描述和VQA輸出。
  2. 偏好對齊的直接優化(Direct Preference Optimization, DPO)

    • 訓練初期用少量標注數據微調prompt模塊,后續在無標注數據上,通過“虛擬標注員”對多組掩碼候選進行評分/排序,直接優化模型對偏好分割的正確性,無需顯式reward建模或真實人工反饋。
    • DPO損失函數可自動獎勵高分候選,懲罰低分候選,實現端到端半監督優化。

方法流程

  1. 階段一(Prompt微調):用10%有標注數據,聯合視覺(BiomedCLIP)+文本(MedVInT+GPT-4)prompt指導SAM-Med2D主干微調。
  2. 階段二(偏好對齊訓練):剩余無標注數據,自動生成多組分割候選,用IoU分數(與真實掩碼對比模擬虛擬評分)分為4檔,依照DPO損失優化模型,使其輸出更貼合高評分分割。
  3. 端到端無需Reward模型:全流程無需人工反饋或reward函數訓練,極簡實現,高效易用。

主要實驗與結果

  • 數據集:涵蓋胸部X光肺分割、乳腺超聲腫瘤分割、Abdominal CT多器官分割,支持X-ray、US、CT等多模態。
  • 少標注強性能:僅用10-20%標注數據,性能大幅優于U-Net、nnU-Net、SAM、SAM-Med2D、Self-prompt等SOTA方法,在20%數據下胸片Dice達到78.87,遠超同類。
  • 半監督優勢明顯:在50%數據量下,半監督DPO模型Dice可達89.68,接近全監督prompt-only模型(91.42)。
  • 邊界精度與泛化:分割邊界更精細,腫瘤/肺/多器官實驗中對小結構和難分割區域表現突出。
  • 魯棒性:評分噪聲(虛擬評分誤差)下性能損失極小,體現方法穩健性。

消融實驗

  • 各模塊貢獻明確:無監督prompt、VQA、GPT-4等模塊疊加顯著提升性能。
  • 不同Preference策略:排名優于單獨評分和“只優化最好”候選,且無監督數據越多,提升越大。
  • 參數選擇:DPO損失中的權重參數經實驗證明最優為β1=1, β2=0.5。

總結與展望

本方法實現了面向半監督醫學圖像分割的高效無監督prompt+偏好對齊優化,極大降低對人工標注和專家干預的依賴,泛化性和實用性突出。未來可拓展至3D/時序醫學影像、更多大模型prompt融合與真實用戶偏好采集。


歡迎關注,獲取更多CVPR 2025醫學AI前沿論文解讀!

本文來自互聯網用戶投稿,該文觀點僅代表作者本人,不代表本站立場。本站僅提供信息存儲空間服務,不擁有所有權,不承擔相關法律責任。
如若轉載,請注明出處:http://www.pswp.cn/bicheng/86669.shtml
繁體地址,請注明出處:http://hk.pswp.cn/bicheng/86669.shtml
英文地址,請注明出處:http://en.pswp.cn/bicheng/86669.shtml

如若內容造成侵權/違法違規/事實不符,請聯系多彩編程網進行投訴反饋email:809451989@qq.com,一經查實,立即刪除!

相關文章

【C++】責任鏈模式

目錄 一、模式核心概念與結構二、C++ 實現示例:員工請假審批系統三、責任鏈模式的關鍵特性四、應用場景五、責任鏈模式與其他設計模式的關系六、C++ 標準庫中的責任鏈模式應用七、優缺點分析八、實戰案例:Web 請求過濾器鏈九、實現注意事項如果這篇文章對你有所幫助,渴望獲得…

dp進階,樹形背包(dfs+01)

顧名思義,就是在對樹進行搜索的時候,由于限制了子節點選根節點必選和節點數限制,所以需要額外利用背包來維護最大值 假設根節點就是0,我們很容易 發現,這就是一個正常的樹求和,但是限制了節點數量&#xf…

微信小程序安卓手機輸入框文字飄出輸入框

最近在開發微信小程序遇到一個問題,安卓手機輸入框文字飄出輸入框,但是ios系統的手機則正常。 使用情景:做了一個彈窗,彈窗內是表單,需要填寫一些信息,但是在填寫信息時光標不顯示,輸入的內容飄…

3 大語言模型預訓練數據-3.2 數據處理-3.2.2 冗余去除——3.后綴數組(Suffix Array)在大模型數據去重中的原理與實戰

后綴數組(Suffix Array)在大模型數據去重中的原理與實戰 一、后綴數組的核心原理與數據結構二、后綴數組去重的核心流程1. **文檔預處理與合并**2. **構建后綴數組**3. **計算最長公共前綴(LCP)數組**4. **基于LCP檢測重復文檔** …

數據庫外連接詳解:方式、差異與關鍵注意事項

🔄 數據庫外連接詳解:方式、差異與關鍵注意事項 外連接用于保留至少一個表的全部行,即使另一表無匹配記錄。以下是三種外連接方式的深度解析: 🔍 一、外連接的三種類型 1. 左外連接 (LEFT OUTER JOIN) 作用&#xf…

vscode把less文件生成css文件配置,設置生成自定義文件名稱和路徑

1.下載less插件 在插件市場搜索 less 2.設置生成配置 3.修改out屬性 "less.compile": {"compress": false, // 是否刪除多余空白字符 一行顯示[壓縮]"sourceMap": false, // 是否創建文件目錄樹,true的話會自動生成一個 .css.map …

探索相機成像的奧秘 - 齊次坐標、徑向失真和圖像傳感器傾斜

引言 大家好!今天我們將一起探索相機成像背后的一些關鍵技術概念:齊次坐標、徑向失真和圖像傳感器傾斜。這些概念對于理解相機如何捕捉和處理圖像至關重要。我們將通過簡單易懂的語言和嚴謹的公式來詳細解釋這些概念。 齊次坐標(Homogeneou…

校企協同育人,智慧養老實訓基地助力人才就業無憂

隨著我國人口老齡化程度不斷加深,智慧養老產業蓬勃發展,對專業人才的需求日益迫切。校企協同打造智慧養老實訓基地,成為解決人才供需矛盾、提升人才培養質量的重要途徑。通過科學的建設方案,智慧養老實訓基地能夠為學生提供實踐平…

從需求到落地:一個AI訓練平臺的售前全流程復盤

目錄 一、項目背景:客戶要建自己的AI訓練平臺 二、需求梳理三板斧:并發量、存儲帶寬、模型種類 1. 并發訓練量 2. 存儲帶寬需求 3. 模型類型與參數規模 三、解決方案設計:GPU選型 + 高速網絡 + 存儲架構 ? GPU服務器選型 ? 網絡與通信架構 ? 存儲與數據緩存 四…

織夢DedeCMS轉WordPress

最近,有個用戶找模板兔遷移網站,源站用的dede,需要轉成wp,文章數量大概7000-8000篇,其中有個需求是保證舊文章的鏈接有效,在wp上的新文章與舊文章的鏈接類型不一樣,所以這涉及到偽靜態來處理跳轉…

installGo.sh

#!/bin/bash # 檢查是否以root用戶運行 if [ "$(id -u)" -ne 0 ]; then echo "請使用root權限運行此腳本" exit 1 fi # 檢查是否安裝了必要的工具 for cmd in curl wget tar; do if ! command -v $cmd &> /dev/null; then echo…

【技術難題】el-table的全局數據排序實現示例,不受分頁影響,以及異步請求帶來的頁面渲染問題

參考鏈接:https://blog.csdn.net/qq_35770559/article/details/131183121 問題代碼 編輯頁面detail.vue <el-form title="列表信息" name="detail"><el-form><el-form-item><el-buttontype="cyan"icon="el-icon-p…

非功能測試

非功能測試范疇&#xff1a;界面測試&#xff0c;易用性測試&#xff0c;兼容性測試&#xff0c;文檔測試&#xff0c;安裝/卸載測試等等 界面測試 1.窗體界面測試 1.窗體定義&#xff1a;指整個軟件窗口&#xff0c;也可稱為窗口&#xff0c;是界面測試的基本單位 2.控件分…

一起endpoint迷路的問題排查總結

今天上班&#xff0c;一到工位上&#xff0c;就有同事和我說有客戶反映自己的容器的一些指標在監控平臺不上報了&#xff0c;我當時一看機器所在的監控&#xff0c;發現確實是這樣 確實存在某個點開始數據就沒了&#xff0c;主要這個點當時也沒有任何的操作變更&#xff0c;于…

官方 Linker Scripts 語法和規則解析(2)

系列文章目錄 官方 Linker Scripts 語法和規則解析&#xff08;1&#xff09; 官方 Linker Scripts 語法和規則解析&#xff08;2&#xff09; 官方 Linker Scripts 語法和規則解析&#xff08;3&#xff09; 鏈接腳本(Linker Scripts)語法和規則解析(自官方手冊) 7.9. 鏈接腳…

CentOS 7 通過YUM安裝MySQL 8.0完整指南

一、準備工作&#xff1a;更新系統與YUM源 # 1. 更換阿里云鏡像源 wget -O /etc/yum.repos.d/CentOS-Base.repo http://mirrors.aliyun.com/repo/Centos-7.repo# 2. 清理并重建緩存 yum clean all yum makecache# 3. 升級系統所有包 yum -y update 二、安裝MySQL 8.0 1. 下載…

qq郵箱 新版 怎么去掉個性簽名?

qq郵箱 新版 怎么去掉個性簽名&#xff1f; 新版的qq郵箱&#xff0c;用著還不錯&#xff0c;特別是搜索&#xff0c;比以前好多&#xff0c;以前加載的時候&#xff0c;搜索框里有一行字&#xff0c;加載不完&#xff0c;就沒法搜索&#xff0c;特別菜。現在好多了。 不過現在…

C++:string類(1)

一.初步了解STL STL是Standard Template Library的縮寫&#xff0c;中文譯為標準模板庫&#xff0c;是C標準庫的重要組成部分。它本質上是一套基于模板的通用編程工具&#xff0c;通過模板技術實現了數據結構和算法的抽象與復用&#xff0c;讓開發者無需重復編寫基礎功能&…

如何避免靜態變量初始化中的異常

確保初始化表達式的安全性 基本數據類型初始化 對于基本數據類型&#xff08;如int、double、boolean等&#xff09;的靜態變量初始化&#xff0c;要確保賦值的表達式是合法的。例如&#xff0c;在初始化一個int類型的靜態變量時&#xff0c;避免出現除數為零的情況。 class Sa…

【151】基于Springboot+Vue實現的校園訂餐管理系統小程序(有文檔+PPT+視頻)

系統介紹 視頻演示 基于SpringbootVue實現的校園訂餐管理系統小程序&#xff08;有文檔PPT視頻&#xff09; 基于SpringbootVue實現的校園訂餐管理系統小程序采用前后端分離的架構方式&#xff0c;系統設計了管理員、商家、用戶三種角色&#xff0c;系統分為管理端、小程序端&…