基于提示驅動的潛在領域泛化的醫學圖像分類方法(Python實現代碼和數據分析)

摘要
醫學圖像分析中的深度學習模型易受數據集偽影偏差、相機差異、成像設備差異等導致的分布偏移影響,導致在真實臨床環境中診斷不可靠。領域泛化(Domain Generalization, DG)方法旨在通過多領域訓練提升模型在未知領域的性能,但其依賴精確的領域標簽,而醫學數據通常缺乏此類標簽。為此,我們提出一種無需領域標簽的領域泛化框架——提示驅動的潛在領域泛化(Prompt-driven Latent Domain Generalization, PLDG)。該框架包含無監督領域發現與提示學習:首先通過聚類與偏差相關的風格特征生成偽領域標簽,隨后利用協作式領域提示引導視覺變換器(ViT)從多樣化的潛在領域學習知識。通過領域提示生成器實現跨領域知識共享,并采用領域混合策略緩解偽標簽噪聲問題。在皮膚癌分類、糖尿病視網膜病變分類和組織病理學癌癥檢測等任務上的實驗表明,PLDG無需領域標簽即可達到或超越傳統DG方法的性能。

關鍵詞:領域泛化,提示學習,皮膚病學,皮膚癌,糖尿病視網膜病變

I. 引言

深度學習在醫學圖像分析中取得了顯著進展,但其性能易受分布偏移的影響。例如,皮膚鏡圖像分類模型可能過度依賴標尺、凝膠氣泡等偽影而非實際病灶特征;糖尿病視網膜病變(Diabetic Retinopathy, DR)分類模型可能過擬合特定相機的成像風格。此類偏差導致模型在真實臨床場景中的泛化能力受限。傳統領域泛化方法旨在通過多領域訓練提升模型對未知領域的適應性,但其依賴預定義的領域標簽。然而,醫學數據中領域標簽常面臨以下挑戰:

  1. 獲取成本高:領域標簽需人工標注,耗時費力;

  2. 定義模糊:醫學圖像的領域劃分(如偽影類型、醫院來源)缺乏統一標準,不同專家可能存在分歧;

  3. 任務依賴性:領域劃分與下游任務強相關,難以跨任務遷移。

現有方法存在兩大局限性:

  1. 數據集層面:依賴領域標簽的假設不切實際;

  2. 算法層面:領域不變特征學習可能忽略對未知領域有用的信號,而集成學習方法未充分利用跨領域信息。

為此,我們提出潛在領域泛化(Latent Domain Generalization, LDG),通過無監督方式自動發現潛在領域并實現模型泛化。本文的核心貢獻如下:

  1. 無需領域標簽的框架:提出PLDG,通過聚類ViT淺層風格特征生成偽領域標簽,結合提示學習實現跨領域知識遷移;

  2. 領域提示生成器:通過低秩分解促進領域提示間的知識共享;

  3. 領域混合策略:緩解偽標簽噪聲問題,增強決策邊界靈活性;

  4. 廣泛驗證:在皮膚病變、DR分類、癌癥檢測及去偏任務中驗證有效性,性能超越傳統DG方法。


II. 相關工作

A. 領域泛化

傳統方法包括:

  • 領域對抗訓練:如DANN通過對抗損失對齊特征分布;

  • 統計對齊:如CORAL匹配二階統計量;

  • 元學習:通過模擬領域偏移優化模型魯棒性。
    近期研究表明,ViT因其對紋理偏差的弱敏感性,在DG任務中表現優于CNN。然而,現有方法仍依賴領域標簽,且醫學圖像領域泛化研究較少。

B. 醫學圖像中的領域泛化

現有工作多依賴人工標注的偽影標簽或數據集差異作為領域標簽,但存在噪聲和定義不準確問題。例如,Bissoto等人通過二元分類器標注皮膚數據集的偽影標簽,但標注結果可能存在誤差;Mohammad等人將不同DR數據集直接視為不同領域,忽略了數據集內部相機多樣性。本文首次提出基于ViT風格特征的無監督領域發現方法,擺脫對預定義標簽的依賴。

C. 提示學習

提示學習通過添加可學習向量適配預訓練模型至下游任務。例如,VPT在ViT中插入可學習提示以微調模型;Doprompt為不同領域設計獨立提示以捕獲領域特定知識。與現有方法不同,PLDG引入領域提示生成器,通過共享提示與低秩分解實現跨領域協作學習。


III. 方法

A. 問題定義

B. 整體框架

PLDG框架如圖1所示,包含以下步驟:

  1. 無監督領域發現:基于ViT淺層CLS令牌的風格特征聚類生成偽領域標簽;

  2. 領域提示學習:通過領域提示生成器與混合策略優化模型,提升跨領域泛化能力。


C. 基于簡約性偏差的偽領域標簽聚類

深度學習模型存在簡約性偏差(Simplicity Bias),即傾向于學習簡單特征(如背景偽影)而非復雜語義特征。本文利用該特性,從ViT淺層(如第1層)提取CLS令牌風格特征,通過k-means聚類生成偽領域標簽。風格特征對齊損失定義為:


D. 基于ViT的領域提示學習


2. 損失函數


IV. 實驗結果

A. 實驗設置


B. 對比實驗

1. 皮膚癌分類(表I)

PLDG在Derm7pt_derm和PAD數據集上分別提升3.46%和14.18%,平均ROC-AUC達84.32%,優于DANN、CORAL等傳統方法。

2. DR分類(表II)

PLDG平均準確率達75.6%,顯著高于依賴領域標簽的方法(如ERM++:72.1%),表明其在領域標簽噪聲場景下的優勢。

3. 癌癥檢測(表III)

PLDG在Camelyon17-WILDS上準確率為89.7%,僅次于使用領域標簽的EPVT(90.2%),驗證其實際應用價值。


C. 消融實驗(表IV、V)

逐步添加提示(P)、適配器(A)、混合(M)、生成器(G)組件,結果顯示:

  • +P:平均ROC-AUC提升3.39%;

  • +P+A+M:進一步提升0.87%;

  • +P+A+M+G:最終提升1.26%,驗證各模塊的有效性。


D. 超參數分析(圖4)

  • 提示長度:4時性能最優;

  • 聚類數:4時平均ROC-AUC最高,且對聚類數不敏感(2~5均表現良好)。


E. 領域提示權重分析(圖5)

領域距離(Fr'echet距離)與提示權重呈負相關,表明模型能自適應關注與目標領域相似的源領域。


F. 聚類分析(圖6、7)

  • ViT淺層(L1)CLS令牌聚類結果與類別標簽無關(NMI=0.12),主要反映風格特征;

  • t-SNE可視化顯示偽領域對應“墨水標記”、“暗角”、“深膚色”等醫學相關偏差。


G. 去偏評估(圖8)

在陷阱數據集中,PLDG在最高偏差等級(Bias=1)時ROC-AUC為68.5%,顯著優于ERM(62.37%),表明其對分布偏移的魯棒性。


V. 結論

本文提出PLDG框架,首次在醫學圖像分類中實現無需領域標簽的潛在領域泛化。實驗表明:

  1. 領域標簽非必要:通過偽標簽發現,PLDG性能媲美甚至超越傳統DG方法;

  2. 跨領域知識共享:領域提示生成器有效促進知識遷移;

  3. 魯棒性:領域混合策略緩解偽標簽噪聲,提升模型泛化能力。未來工作將擴展至多模態醫學數據與實時部署場景。(代碼QQandweichat)


參考文獻

[1] P. Schramowski, W. Stammer, S. Teso, A. Brugger, F. Herbert,
X. Shao, H. Luigs, A. Mahlein, and K. Kersting, “Making deep neural
networks right for the right scientific reasons by interacting with their
explanations,” Nat. Mach. Intell. , vol. 2, no. 8, pp. 476–486, 2020.
[Online]. Available: https://doi.org/10.1038/s42256-020-0212-3
[2] A. S. Ross, M. C. Hughes, and F. Doshi-Velez, “Right for the
right reasons: Training differentiable models by constraining their
explanations,” in Proceedings of the Twenty-Sixth International Joint
Conference on Artificial Intelligence, IJCAI 2017, Melbourne, Australia,
August 19-25, 2017 , C. Sierra, Ed. ijcai.org, 2017, pp. 2662–2670.
[Online]. Available: https://doi.org/10.24963/ijcai.2017/371
[3] A. Bissoto, C. Barata, E. Valle, and S. Avila, “Artifact-based domain
generalization of skin lesion models,” in ECCV Workshops , 2022.
[4] A. Bissoto, M. Fornaciali, E. Valle, and S. Avila, “(de) constructing
bias on skin lesion datasets,” 2019 IEEE/CVF Conference on Computer
Vision and Pattern Recognition Workshops (CVPRW) , pp. 2766–2774,
2019.
[5] S. Yan, Z. Yu, X. Zhang, D. Mahapatra, S. S. Chandra, M. Janda,
P. Soyer, and Z. Ge, “Towards trustable skin cancer diagnosis via rewrit
ing model’s decision,” in Proceedings of the IEEE/CVF Conference
on Computer Vision and Pattern Recognition (CVPR) , June 2023, pp.
11 568–11 577.
[6] M. Atwany and M. Yaqub, “Drgen: Domain generalization in diabetic
retinopathy classification,” in Medical Image Computing and Computer
Assisted Intervention – MICCAI 2022 , L. Wang, Q. Dou, P. T. Fletcher,
S. Speidel, and S. Li, Eds. Cham: Springer Nature Switzerland, 2022,
pp. 635–644.
[7] D. M. Nguyen, T. T. Mai, N. T. Than, A. Prange, and D. Sonntag,
“Self-supervised domain adaptation for diabetic retinopathy grading
using vessel image reconstruction,” in KI 2021: Advances in Artificial
Intelligence: 44th German Conference on AI, Virtual Event, September
27–October 1, 2021, Proceedings 44 . Springer, 2021, pp. 349–361.

圖1?傳統領域泛化與潛在領域泛化對比

圖2?PLDG算法流程
圖3?領域提示生成器與混合策略示意圖


圖4?提示長度與聚類數對性能的影響


圖5?領域提示權重與領域距離的關系
圖6?偽領域標簽與類別/領域標簽的標準化互信息(NMI)


圖7?偽領域標簽的t-SNE可視化


圖8?陷阱數據集去偏性能對比

本文來自互聯網用戶投稿,該文觀點僅代表作者本人,不代表本站立場。本站僅提供信息存儲空間服務,不擁有所有權,不承擔相關法律責任。
如若轉載,請注明出處:http://www.pswp.cn/diannao/72356.shtml
繁體地址,請注明出處:http://hk.pswp.cn/diannao/72356.shtml
英文地址,請注明出處:http://en.pswp.cn/diannao/72356.shtml

如若內容造成侵權/違法違規/事實不符,請聯系多彩編程網進行投訴反饋email:809451989@qq.com,一經查實,立即刪除!

相關文章

C#—Settings配置詳解

C#—Settings配置詳解 在C#項目中,全局配置通常指的是應用程序的設置(settings),這些設置可以跨多個類或組件使用,并且通常用于存儲應用程序的配置信息,如數據庫連接字符串、用戶偏好設置等。 Settings配置…

國自然面上項目|基于多模態MR影像的膠質母細胞瘤高危區域定位及預后預測研究|基金申請·25-02-28

小羅碎碎念 今天和大家分享一個面上項目,執行年限為2019.01~2022.12,直接費用為57萬元。 膠質母細胞瘤(GBM)預后差且差異大,異質性是重要因素,臨床手段難評價。影像組學為異質性研究提供方法&am…

Nat Mach Intell | AI分子對接算法評測

《Nature Machine Intelligence》發表重磅評測,系統評估AI與物理方法在虛擬篩選(VS)中的表現,突破藥物發現效率瓶頸。 核心評測體系:三大數據集 研究團隊構建了三個新型測試集: TrueDecoy:含14…

安路FPGA開發入門:軟件安裝與點燈與仿真(TangDynasty ModelSim)

文章目錄 前言軟件安裝開發軟件仿真軟件 點燈測試代碼編寫與編譯引腳分配固件下載 仿真測試ModelSim添加仿真庫TangDynasty仿真設置進行仿真 后記 前言 最近因為工作需要用安路的FPGA,這里對安路FPGA開發相關流程做個記錄。作為測試只需要一個核心板(我這…

千峰React:外部庫引用

flushSync強制刷新 如果不強制刷新是這樣:每次count在下一輪才更新 import { useState, useRef } from react import { flushSync } from react-domfunction App() {const [count, setCount] useState(0)const refuseRef(null)const handleClick () > { setCo…

防火墻旁掛組網雙機熱備負載均衡

一,二層交換網絡: 使用MSTPVRRP組網形式 VLAN 2--->SW3為主,SW4 作為備份 VLAN 3--->SW4為主,SW3 作為備份 MSTP 設計 --->SW3 、 4 、 5 運行 實例 1 : VLAN 2 實例 2 : VLAN 3 SW3 是實例 1 的主根,實…

結合PyMuPDF+pdfplumber,刪除PDF指定文本后面的內容

?? 一、需求場景解析 在日常辦公中,我們經常會遇到這樣的痛點: 合同處理:收到上百份PDF合同,需要找到"簽署頁"之后的內容并刪除報表加工:批量移除財務報表中的敏感數據區域文檔歸檔:快速提取技術文檔的關鍵章節傳統的手動操作方式存在三大致命缺陷: ? 耗時…

二、QT和驅動模塊實現智能家居----2、編譯支持QT的系統

因為我們的Linux內核文件不支持QT系統(當然如果你的支持,完全跳過這篇文章),所以我們要從網上下載很多軟件包,這里直接用百問網的軟件包,非常方便。 一:Ubuntu 配置 1 設置交叉編譯工具鏈 以…

el-select的下拉選擇框插入el-checkbox

el-check注意這里要使用model-value綁定數據 <el-selectv-model"selectDevice"multiplecollapse-tags:multiple-limit"5"style"width: 200px"popper-class"select-popover-class" ><el-optionv-for"item in deviceList…

UNION 和 UNION ALL 的區別:深入解析 SQL 中的合并操作

在 SQL 的世界里&#xff0c;當我們需要合并多個查詢結果集時&#xff0c;UNION和UNION ALL是兩個常用的操作符。雖然它們的功能看起來相似&#xff0c;但實際上有著重要的區別&#xff0c;這些區別在不同的應用場景中會對查詢結果和性能產生顯著影響。本文將詳細探討UNION和UN…

5.Linux配置虛擬機

步驟一 步驟二 步驟三 步驟四 finalshell

2024華為OD機試真題-熱點網站統計(C++)-E卷-100分

2024華為OD機試最新E卷題庫-(C卷+D卷+E卷)-(JAVA、Python、C++) 目錄 題目描述 輸入描述 輸出描述 用例1 用例2 考點 題目解析 代碼 c++ 題目描述 企業路由器的統計頁面,有一個功能需要動態統計公司訪問最多的網頁 URL top N。 請設計一個算法,可以高效動態統計 …

SOUI基于Zint生成EAN碼

EAN碼廣泛應用與歐洲的零售業。包括EAN-2、EAN-5、EAN-8和EAN-12碼。分別編碼 2、5、7 或 12 位數字。此外&#xff0c;可以使用 字符將 EAN-2 和 EAN-5 附加符號添加到 EAN-8 和 EAN-13 符號中&#xff0c;就像 UPC 符號一樣。 EAN-8校驗碼計算&#xff1a; 從左往右奇數位的…

QT實現簡約美觀的動畫Checkbox

*最終效果: * 一共三個文件: main.cpp , FancyCheckbox.h , FancyCheckbox.cpp main.cpp #include <QApplication> #include "FancyCheckbox.h" #include <QGridLayout> int main(int argc, char *argv[]) {QApplication a(argc, argv);QWidget* w new…

arm | lrzsz移植記錄

1 我的使用場景 開發板無網絡, 無奈只得用U盤拷貝文件 文件不大, 每次都插拔U盤, 很繁瑣 原來的環境不支持rz等命令 就需要移植這個命令來使用 下載地址 https://ohse.de/uwe/releases/lrzsz-0.12.20.tar.gz 2 編譯腳本 # 主要內容在這里 configure_for_arm(){mkdir -p $PA…

Hadoop之01:HDFS分布式文件系統

HDFS分布式文件系統 1.目標 理解分布式思想學會使用HDFS的常用命令掌握如何使用java api操作HDFS能獨立描述HDFS三大組件namenode、secondarynamenode、datanode的作用理解并獨立描述HDFS讀寫流程HDFS如何解決大量小文件存儲問題 2. HDFS 2.1 HDFS是什么 HDFS是Hadoop中的一…

矩陣 trick 系列 題解

1.AT_dp_r Walk&#xff08;矩陣圖論&#xff09; 題意 一個有向圖有 n n n 個節點&#xff0c;編號 1 1 1 至 n n n。 給出一個二維數組 A 1... n , 1... n A_{1...n,1...n} A1...n,1...n?&#xff0c;若 A i , j 1 A_{i,j}1 Ai,j?1 說明節點 i i i 到節點 j j j …

使用AoT讓.NetFramework4.7.2程序調用.Net8編寫的庫

1、創建.Net8的庫&#xff0c;雙擊解決方案中的項目&#xff0c;修改如下&#xff0c;啟用AoT&#xff1a; <Project Sdk"Microsoft.NET.Sdk"><PropertyGroup><OutputType>Library</OutputType><PublishAot>true</PublishAot>&…

Goby 漏洞安全通告| Ollama /api/tags 未授權訪問漏洞(CNVD-2025-04094)

漏洞名稱&#xff1a;Ollama /api/tags 未授權訪問漏洞&#xff08;CNVD-2025-04094&#xff09; English Name&#xff1a;Ollama /api/tags Unauthorized Access Vulnerability (CNVD-2025-04094) CVSS core: 6.5 風險等級&#xff1a; 中風險 漏洞描述&#xff1a; O…

端到端自動駕駛——cnn網絡搭建

論文參考&#xff1a;https://arxiv.org/abs/1604.07316 demo 今天主要來看一個如何通過圖像直接到控制的自動駕駛端到端的項目&#xff0c;首先需要配置好我的仿真環境&#xff0c;下載軟件udacity&#xff1a; https://d17h27t6h515a5.cloudfront.net/topher/2016/November…