Deep semi-supervised learning for medical image segmentation: A review

概述

在這里插入圖片描述
在這里插入圖片描述

  1. 醫學圖像分割的重要性:它是計算機輔助診斷(CAD)的關鍵部分,能幫助醫生定位病變、評估治療效果,減輕醫生工作量。

  2. 深度學習技術的應用:U-Net等網絡在醫學圖像分割中表現優異,近期大型視覺語言模型也展現出潛力。

  3. 數據稀缺的挑戰:醫學圖像標注數據少(因疾病罕見、隱私問題、標注成本高),導致模型容易過擬合。

  4. 現有解決方案的局限性:降低模型復雜度、正則化、數據增強等方法效果有限。

  5. 半監督學習的潛力:通過利用少量標注數據和大量未標注數據,可能緩解數據稀缺問題,包括傳統方法(多視圖、圖模型、生成模型)和深度半監督學習。

現在AI技術(尤其是深度學習)在醫學影像分析中很厲害,比如用U-Net這種網絡可以自動圈出CT或MRI圖像里的腫瘤或器官,幫醫生更快診斷。但問題是,訓練這些AI需要大量帶標注的醫療圖片,而現實中這種數據很難搞到——要么因為罕見病例少,要么因為患者隱私保護,而且請專家標注圖片又貴又費時間。

目前解決數據少的方法(比如簡化AI模型、數據增強)效果一般,所以研究者開始嘗試“半監督學習”:讓AI既學少量標注數據,也利用大量未標注數據(比如醫院里現成的未標記片子),這樣可能更省錢又高效。

假設你要教小朋友認動物,但只有幾張帶標簽的貓狗圖片(有標注數據),和一堆無標簽的動物照片(未標注數據)。傳統方法是只反復用那幾張帶標簽的圖訓練,而深度半監督學習會

  1. 先用帶標簽的圖教基礎規則(比如貓有尖耳朵)。

  2. 對無標簽圖片,讓模型自己猜標簽(偽標簽)或發現規律(比如“這兩張圖耳朵形狀一致,可能是同類”)。

  3. 通過設計更聰明的練習(損失函數)或學習工具(模型結構),讓小朋友舉一反三,最終認得更準

![[Pasted image 20250702095110.png]]

三個關鍵假設

平滑假設(保證局部一致性)

相似的輸入,應該有相似的輸出
如果兩個樣本(比如兩張醫學圖像)在特征空間里距離很近(比如像素分布、紋理相似),那它們的標簽(比如是否患病)也應該相似

聚類假設(保證全局一致性)

同一類別的數據會聚在一起
數據在特征空間中會形成聚類(Cluster),同一聚類內的樣本屬于同一類別
因此,決策邊界(分類的分界線)應該避開高密度區域(即不要穿過聚類中心)

低密度分離假設

分類邊界應該位于數據稀疏的地方
聚類假設的強化版,明確要求決策邊界不能穿過數據密集區,而要在空白區域。

圖像五大分割方法

偽標簽法(Pseudo-Labeling)

先用標注數據訓練初始模型,然后用該模型對未標注數據預測偽標簽(Pseudo-Label),再將這些偽標簽加入訓練集重新訓練模型。

典型方法

  • 自訓練(Self-training):模型自己生成偽標簽迭代優化。

  • 協同訓練(Co-training):多個模型互相提供偽標簽(如不同視角或模態的數據)。

改進方向

  • 篩選高置信度偽標簽(避免錯誤標簽累積)。

  • 動態閾值調整(不同類別采用不同置信度閾值)。

  • 不確定性估計(剔除不可靠預測)。

優點:簡單易實現,計算成本低
缺點:錯誤偽標簽會導致“累積偏差”(誤差越來越大)
未來方向:結合不確定性建模、多模型協同優

一致性正則化(Consistency Regularization)

對同一輸入施加不同擾動(如噪聲、數據增強),要求模型輸出保持一致(即預測結果不應因微小變化而劇烈波動)

![[Pasted image 20250702114946.png]]

(1)數據一致性(Data Consistency)
對未標注數據進行不同增強或擾動,強制模型對這些變體給出相同或相似的預測

(2) 模型一致性(Model Consistency)
模型本身施加約束(如參數擾動、多模型交互),確保不同模型變體的輸出一致

(3)任務一致性(Task Consistency)
通過多任務學習輔助任務(如重建、分類)約束主任務(分割)的一致性。

典型方法

  • Π-Model:同一圖像兩次不同增強后預測應一致。

  • Mean Teacher:學生模型和教師模型(EMA平滑版)輸出需一致。

  • FixMatch:強增強數據與弱增強數據的預測一致。

改進方向

  • 更強的數據增強策略(如MixUp、CutMix)。

  • 自適應一致性權重(不同樣本賦予不同重要性)。

優點:避免依賴偽標簽,適合噪聲多的數據。
缺點:對擾動方式敏感,可能過擬合增強策略。
未來方向:自適應擾動策略、多模態一致性學習。

基于生成對抗網絡(GAN)的方法

![[Pasted image 20250702112729.png]]

利用**生成器(Generator)合成逼真數據,判別器(Discriminator)區分真實標注數據和生成數據,通過對抗訓練提升分割性能。

典型方法

  • SegAN:生成器生成分割圖,判別器判斷其真實性。

  • CycleGAN:跨模態數據轉換(如MRI→CT)輔助分割。

改進方向

  • 更穩定的GAN訓練(如Wasserstein GAN)。

  • 結合半監督損失(如一致性正則化+GAN)。

優點:能生成多樣化數據,緩解標注不足問題。
缺點:訓練不穩定,計算成本高。
未來方向:輕量化GAN、結合擴散模型(Diffusion Models)。

基于對比學習(Contrastive Learning)的方法

讓相似樣本(正樣本)在特征空間靠近,不相似樣本(負樣本)遠離,從而學習更好的特征表示(之前看過的facenet也是)

高級特征 vs. 低級特征

![[Pasted image 20250702113147.png]]

典型方法

  • SimCLR:同一圖像的不同增強版本作為正樣本。

  • MoCo:使用動態記憶庫存儲負樣本。

改進方向

  • 醫學圖像特異性對比策略(如解剖結構相似性)。

  • 減少負樣本偏差(醫學數據類別不平衡)

優點:特征提取能力強,適合小樣本場景。
缺點:需要大量負樣本,計算開銷大。
未來方向:無負樣本對比學習(如BYOL)、跨模態對比

混合方法(Hybrid Methods)

結合上述多種方法(如偽標簽+一致性正則化+對比學習),取長補短

典型方法

  • UPS(Uncertainty-aware Pseudo-labeling and Self-training):偽標簽+不確定性估計。

  • CCT(Cross-Consistency Training):一致性+對比學習。

優點:性能通常優于單一方法。
缺點:設計復雜,調參難度大。
未來方向:自動化方法組合(如NAS搜索最優混合策略)。

方法核心思想優點缺點適用場景
偽標簽法模型自生成標簽迭代訓練簡單、計算高效錯誤標簽累積風險標注數據較少但質量高
一致性正則化不同擾動下預測應一致避免偽標簽偏差依賴數據增強策略數據增強有效的任務(如CT)
GAN方法生成對抗數據提升泛化能力數據多樣性增強訓練不穩定、計算成本高需要合成數據的復雜任務
對比學習特征空間正負樣本分離特征提取能力強需大量負樣本、計算量大小樣本但需強特征表示的任務
混合方法結合多種策略性能通常最優設計復雜、調參難對精度要求極高的任務

評估指標

  1. Dice系數(Dice Score):

    • 衡量預測結果和醫生標注的重疊程度(0~1,越接近1越好)。

    • 通俗理解:像“考試得分”,90分(Dice=0.9)比70分(Dice=0.7)好。

  2. Jaccard指數(IoU):

    • 類似Dice,但計算方式不同(通常比Dice略低)。
  3. 平均表面距離(ASD)

    • 預測邊界和真實邊界的平均誤差(單位:毫米)。

    • 通俗理解:像“測量腫瘤邊界的偏差”,誤差越小越好。

  4. 95% Hausdorff距離(HD95)

    • 剔除5%異常值后的最大邊界誤差(對噪聲更魯棒)。

    • 通俗理解:像“去掉最離譜的錯題后,看最差能錯多遠”。

類型代表方法性能表現原因分析
單模型自訓練(Chen et al. 2022)較低易過擬合(標注數據少時,模型“死記硬背”)。
多模型Mean Teacher、UMCT更高、更穩定多模型互相糾錯(如教師模型提供穩定偽標簽,協同訓練多視角學習)。
例外URPC(單模型+金字塔一致性)媲美多模型通過多尺度(多模態???)一致性約束(不同放大倍率的預測需一致),減少偏差。

本文來自互聯網用戶投稿,該文觀點僅代表作者本人,不代表本站立場。本站僅提供信息存儲空間服務,不擁有所有權,不承擔相關法律責任。
如若轉載,請注明出處:http://www.pswp.cn/pingmian/87148.shtml
繁體地址,請注明出處:http://hk.pswp.cn/pingmian/87148.shtml
英文地址,請注明出處:http://en.pswp.cn/pingmian/87148.shtml

如若內容造成侵權/違法違規/事實不符,請聯系多彩編程網進行投訴反饋email:809451989@qq.com,一經查實,立即刪除!

相關文章

[云上玩轉Qwen3系列之四]PAI-LangStudio x AI搜索開放平臺 x ElasticSearch: 構建AI Search RAG全棧應用

本文詳細介紹了如何使用 PAI-LangStudio 和 Qwen3 構建基于AI搜索開放平臺 x ElasticSearch 的 AI Search RAG 智能檢索應用。該應用通過使用 AI 搜索開放平臺、ElasticSearch 全文檢索向量檢索引擎的混合檢索技術配合阿里云最新發布的 Qwen3 推理模型編排在一個 Agentic Workf…

前端請求瀏覽器提示net::ERR_UNSAFE_PORT的解決方案

起因 項目中后端給到了6666端口的服務地址, 隨即前端項目訪問中瀏覽器報錯如下: 不安全端口在主流瀏覽器(Chrome/Firefox/Edge/Safari)中會被攔截,觸發瀏覽器Network的status列顯示 net::ERR_UNSAFE_PORT 錯誤, 以下是常見的不安全端口一覽…

【Bluedroid】藍牙設備管理器初始化全流程深度解析(BTA_dm_on_hw_on)

本文全面剖析Android藍牙設備管理器在硬件啟動時的初始化流程,涵蓋控制塊創建、服務發現啟動、設備類配置、安全密鑰加載、超時參數設置等核心環節。通過分析從底層硬件交互到上層服務注冊的全鏈路調用,揭示藍牙系統從硬件就緒到功能可用的完整啟動機制&…

大語言模型:是逐字生成還是一次多詞?

大語言模型(LLM)既可以按順序逐個生成單詞(token),也能實現一次生成多個 token 核心差異源于解碼策略與模型架構設計 一、常規“逐個生成”模式(基礎邏輯) 多數入門級演示或簡單文本生成中,LLM 會默認按 “生成一個 token → 拼接回輸入 → 再生成下一個” 的流程,…

通俗易懂的LangGraph圖定義解析

LangGraph 是一個基于狀態的工作流框架,它通過 節點(Nodes) 和 邊(Edges) 的組合,構建出復雜的工作流邏輯。這種設計特別適合處理需要動態決策、循環、多步驟交互的場景(比如對話系統、智能代理…

K8s Pod調度基礎——2

目錄 一、Deployment ?一、Deployment 原理? ?二、核心特性? ?三、意義與場景? ?四、示例與逐行解釋? ?五、總結? StatefulSet ?一、StatefulSet 原理? ?二、核心特性? ?三、意義與場景? ?四、示例與逐行解釋? ?五、總結? 彼此的區別 一、本質…

Java 大視界 -- Java 大數據在智能醫療健康管理中的慢性病風險預測與個性化干預(330)

Java 大視界 -- Java 大數據在智能醫療健康管理中的慢性病風險預測與個性化干預(330) 引言:正文:一、Java 構建的醫療數據融合平臺(多源數據安全打通)1.1 分布式醫療數據集成系統(符合 HIPAA 與…

beego打包發布到Centos系統及國產麒麟系統完整教程

1、先清除go緩存,用下面命令 go clean -cache go clean -modcache 2、更新庫文件 go mod tidy 3、安裝beego go install github.com/beego/bee/v2latest 4、查看bee版本 5、進行打包然后傳到Centos和麒麟服務器如下代碼 bee pack -be GOOSlinux -be GOARCHa…

Instagram和facebook廣告對比解析

一、平臺用戶畫像對比 用戶基礎數據 (1)活躍用戶規模 Instagram:20億MAU,以年輕群體為主力 Facebook:29億MAU,覆蓋全年齡段用戶 (2)核心用戶特征 Instagram: ? 25-3…

[MIA 2025]CLIP in medical imaging: A survey

論文網址:CLIP in medical imaging: A survey - ScienceDirect 項目頁面:github.com 英文是純手打的!論文原文的summarizing and paraphrasing。可能會出現難以避免的拼寫錯誤和語法錯誤,若有發現歡迎評論指正!文章偏…

Python通訊錄系統實戰教程

具體介紹見 通訊錄管理系統設計與實現(C)-CSDN博客 class Person:def __init__(self, name"", sex0, age0, phone"", addr""):self.m_name name # 姓名self.m_Sex sex # 性別(1-男,2-女…

蝦米壁紙分類頁面代碼

<template> <view class"wallpaper-category"> <custom-nav-bar title"分類列表"></custom-nav-bar> <!-- 分類展示 --> <scroll-view scroll-y class"category-scroll-view"> <view cl…

K8s-pod 調度基礎

目錄 Replication Controller&#xff08;RC&#xff09; 概念 關鍵字段 Replica Set&#xff08;RS&#xff09; 概念 關鍵字段 RC 與 RS 的區別 無狀態應用管理Deployment 無狀態應用&#xff08;Stateless Application&#xff09; 什么是無狀態&#xff1f; 無狀…

Vue + RuoYi 前后端分離入門手冊

Vue RuoYi 前后端分離技術棧是一個非常流行且成熟的企業級后臺管理系統開發方案&#xff0c;尤其在國內 Java 開發社區中廣泛應用。它結合了現代化的前端框架 Vue.js 和基于 Spring Boot 的后端框架 RuoYi&#xff0c;提供了開箱即用的權限管理、代碼生成、監控等功能&#xf…

JSON 安裝使用教程

一、JSON 簡介 JSON&#xff08;JavaScript Object Notation&#xff09;是一種輕量級的數據交換格式&#xff0c;易于人閱讀和編寫&#xff0c;同時也易于機器解析和生成。它廣泛應用于前后端數據通信、配置文件、API 傳輸等場景。 二、JSON 是否需要安裝&#xff1f; 不需要…

十大網絡協議

十大網絡協議 標題1. HTTP&#xff08;HyperText Transfer Protocol&#xff0c;超文本傳輸協議&#xff09;標題2. HTTPS&#xff08;Secure Hypertext Transfer Protocol&#xff0c;安全超文本傳輸協議&#xff09;標題3. HTTP/3標題4. TCP&#xff08;Transmission Control…

【語音告警】博靈智能語音報警燈Modbus TCP觸發告警實例-語音報警燈|聲光報警器|網絡信號燈

功能說明 本文將以Python代碼為例&#xff0c;講解如何通過Python代碼調用博靈語音通知終端A4實現聲光語音告警。 本代碼實現Python觸發Modbus寫多寄存器和寫單寄存器實現調用通知終端模板播報功能&#xff08;通知終端內置TTS語音合成技術&#xff0c;本案例不講解如何文本轉…

攝像頭 rtsp數據量 和正常數據流有什么區別

攝像頭RTSP數據流和正常數據流&#xff08;如HTTP傳輸的普通文件或網頁數據&#xff09;在多個方面存在顯著差異&#xff0c;主要體現在協議特性、數據量、實時性、應用場景等方面。以下是具體對比&#xff1a; 1. 協議與傳輸方式 RTSP流&#xff1a; 實時流協議&#xff08;R…

深入理解裝飾器模式:動態擴展對象功能的靈活設計模式

深入理解裝飾器模式&#xff1a;動態擴展對象功能的靈活設計模式 &#x1f31f; 嗨&#xff0c;我是IRpickstars&#xff01; &#x1f30c; 總有一行代碼&#xff0c;能點亮萬千星辰。 &#x1f50d; 在技術的宇宙中&#xff0c;我愿做永不停歇的探索者。 ? 用代碼丈量世界…

141.在 Vue 3 中使用 OpenLayers Link 交互:把地圖中心點 / 縮放級別 / 旋轉角度實時寫進 URL,并同步解析顯示

本文分享一個前端小技巧&#xff1a;借助 OpenLayers 的 Link 交互 在瀏覽器地址欄實時記錄地圖狀態&#xff0c;同時把這些參數解析出來展示在頁面上。 ? 雙向同步&#xff1a;拖動、縮放、旋轉地圖時&#xff0c;URL 自動更新&#xff1b;手動修改 URL 或后退 / 前進&#x…