TransMIL:基于Transformer的多實例學習

MIL是弱監督分類問題的有力工具。然而,目前的MIL方法通常基于iid假設,忽略了不同實例之間的相關性。為了解決這個問題,作者提出了一個新的框架,稱為相關性MIL,并提供了收斂性的證明。基于此框架,還設計了一個基于Transformer的MIL (TransMIL)。TransMIL可以有效地處理不平衡/平衡和二元/多分類,具有良好的可視化和可解釋性。在CAMELYON16數據集上,二元腫瘤分類的測試AUC高達93.09%。在TCGANSCLC和TCGA-RCC數據集上,癌癥亞型分類的AUC分別高達96.03%和98.82%。

來自:TransMIL: Transformer based Correlated Multiple Instance Learning for Whole Slide Image Classification

目錄

  • 背景概述
  • 方法
    • 如何應用Transformer到相關性MIL

背景概述

WSI將活檢切片上的組織轉換成完全保留原始組織結構的十億像素圖像。然而,WSI中基于深度學習的活檢診斷由于像素空間龐大導致缺乏像素級標注。為了解決這個問題,通常采用MIL將診斷分析作為一個弱監督學習問題。

在基于深度學習的MIL中,一個簡單的想法是對CNN提取的instance特征嵌入進行pooling操作。Ilse等人提出了一種基于注意力的聚合算子,通過可訓練的注意力為每個實例提供額外的貢獻信息。此外,Li將非局部注意力引入了MIL問題。通過計算得分最高的實例與其他實例之間的相似度,賦予每個實例不同的注意力權重,從而得到可解釋的注意力圖。

然而,所有這些方法都基于這樣的假設:每個bag中的所有實例都是獨立且同分布的。雖然在許多任務中取得了一些改進,但在許多情況下,這種假設并不完全有效。實際上,在做出診斷決定時,病理學家通常會同時考慮單個區域周圍的環境信息和不同區域之間的相關信息。因此,在MIL診斷中考慮不同instance之間的相關性是可取的。

目前,Transformer由于具有較強的描述序列中不同token之間的相關性以及對遠距離信息建模的能力,被廣泛應用于視覺任務中。如圖1所示,Transformer采用自注意力機制,可以關注序列內每個token之間的兩兩相關性。然而,傳統的Transformer受到其計算復雜性的限制,只能處理較短的序列(例如,小于1000或512)。因此,它不適合WSI等大尺寸圖像。
fig1

  • 圖1:決策過程圖示。MIL注意力機制:遵循iid假設。自注意機制:屬于相關性MIL。

方法

以二元MIL為例,我們想要預測target value Y i ∈ { 0 , 1 } Y_{i}\in\left\{0,1\right\} Yi?{0,1},給定一個bag X i X_{i} Xi?(instance為 { x i , 1 , x i , 2 , . . . , x i , n } \left\{x_{i,1},x_{i,2},...,x_{i,n}\right\} {xi,1?,xi,2?,...,xi,n?}),其中 i = 1 , . . , b i=1,..,b i=1,..,b,實例級標簽是未知的: { y i , 1 , y i , 2 , . . . , y i , n } \left\{y_{i,1},y_{i,2},...,y_{i,n}\right\} {yi,1?,yi,2?,...,yi,n?},bag標簽是已知的,并且與實例標簽有聯系:
eq1
b b b是袋的總數, n n n是第 i i i個袋里的實例數, n n n的個數可以根據不同的袋而變化。

關于相關性MIL的優勢,文中給出了證明,但是在此略過。主要意思是:

  • 考慮實例相關性可以具有更小的信息熵,從而減少不確定性,為MIL帶來更多有效信息。TransMIL與過去方法的主要區別如圖2

fig2

  • 圖2:不同pooling矩陣 P P P的差異。假設從a中的WSI采樣5個instance, P ∈ R 5 × 5 P\in\R^{5\times 5} PR5×5是對應的pooling矩陣,其中對角線內的值表示instance自身的注意力權重,其余值表示不同instance之間的相關性。b,c,d 都忽略了相關信息,因此 P P P是對角矩陣。在b中,第一個實例是由Max-pooling算子選擇的,所以在對角線位置只有一個非零值。在c中,由于Mean-pooling運算符,對角線內的所有值都是相同的。在d中,由于引入的是bypass注意力,對角線內的值可能會發生變化。但其余位置為0(獨立同分布假設)。e服從相關性假設,因此在非對角線位置存在非零值,表示不同實例之間存在相關性。

對于MIL的pooling,這里有一個通用的三步法:
ag1

  • 形態信息:morphological,空間信息:spatial

如何應用Transformer到相關性MIL

Transformer使用自注意力機制對序列中所有令牌之間的交互進行建模,位置信息的添加進一步增加了順序信息。因此,將Transformer引入相關性MIL問題是合理的,其中函數 h h h對實例之間的空間信息進行編碼,pooling矩陣 P P P使用自注意力進行信息聚合。為了說明這一點,進一步給出一個正式的定義。

給定一個bag集合 { X 1 , . . . , X b } \left\{X_{1},...,X_{b}\right\} {X1?,...,Xb?},每個bag對應一個標簽 Y i Y_{i} Yi?。目標是學習映射: X → T → Y \mathbb{X} \rightarrow \mathbb{T}\rightarrow \mathbb{Y} XTY,即從bag空間,到Transformer空間,再到標簽空間。

為了更好地描述 X → T \mathbb{X} \rightarrow \mathbb{T} XT的映射,作者設計了一個包含兩個Transformer層和一個位置編碼層的TPT模塊,其中Transformer層用于聚合形態信息,PPEG (Pyramid position encoding Generator)用于編碼空間信息。所提出的基于MIL (TransMIL)的Transformer的概述如圖3所示。

fig3

  • 圖3:每個WSI被裁剪成patch(背景被丟棄),并被ResNet50嵌入到特征向量中。然后用TPT模塊對序列進行處理:1)序列的平方;2)序列相關性建模;3)條件位置編碼與局部信息融合;4)深度特征聚合;5) T → Y \mathbb{T}\rightarrow \mathbb{Y} TY的映射。

序列來自每個WSI中的特征嵌入。TPT模塊的處理步驟如算法2所示,其中MSA表示多頭自注意力,MLP表示多層感知機,LN表示 Layer Norm。
ag2

本文來自互聯網用戶投稿,該文觀點僅代表作者本人,不代表本站立場。本站僅提供信息存儲空間服務,不擁有所有權,不承擔相關法律責任。
如若轉載,請注明出處:http://www.pswp.cn/diannao/39560.shtml
繁體地址,請注明出處:http://hk.pswp.cn/diannao/39560.shtml
英文地址,請注明出處:http://en.pswp.cn/diannao/39560.shtml

如若內容造成侵權/違法違規/事實不符,請聯系多彩編程網進行投訴反饋email:809451989@qq.com,一經查實,立即刪除!

相關文章

3.js - 反射率(reflectivity) 、折射率(ior)

沒啥太大的感覺 反射率 reflectivity 概念 反射率:指的是,材質表面反射光線的能力反射率,用于控制材質對環境光,或光源的反射程度反射率越高,材質表面反射的光線越多,看起來就越光亮使用 適用于&#xff0…

【OCPP】ocpp1.6協議第5.1章節Cancel Reservation的介紹及翻譯

目錄 5.1 取消預約Cancel Reservation-概述 Cancel Reservation CancelReservation.req 請求消息 CancelReservation.conf 確認消息 取消預定的流程 應用場景 示例消息 CancelReservation.req 示例 CancelReservation.conf 示例 總結 5.1 取消預約Cancel Reservation…

VScode 常用插件

基礎開發插件 Chinese (Simplified)(簡體中文語言包):這是適用于VS Code的中文(簡體)語言包,適用于英語不太流利的用戶。Auto Rename Tag:這個插件可以同步修改HTML/XML標簽,當用戶修…

【PYG】Cora數據集分類任務計算損失,cross_entropy為什么不能直接替換成mse_loss

cross_entropy計算誤差方式,輸入向量z為[1,2,3],預測y為[1],選擇數為2,計算出一大坨e的式子為3.405,再用-23.405計算得到1.405MSE計算誤差方式,輸入z為[1,2,3],預測向量應該是[1,0,0]&#xff0…

Dify入門指南

一.Dify介紹 生成式 AI 應用創新引擎,開源的 LLM 應用開發平臺。提供從 Agent 構建到 AI workflow 編排、RAG 檢索、模型管理等能力,輕松構建和運營生成式 AI 原生應用,比 LangChain 更易用。一個平臺,接入全球大型語言模型。不同…

CesiumJS【Basic】- #050 繪制掃描線(Primitive方式)

文章目錄 繪制掃描線(Primitive方式)- 需要自定義著色器1 目標2 代碼2.1 main.ts繪制掃描線(Primitive方式)- 需要自定義著色器 1 目標 使用Primitive方式繪制掃描線 2 代碼 2.1 main.ts import * as Cesium from cesium;const viewer = new Cesium.Viewer(cesiumConta…

自我反思與暑假及大三上學期規劃

又要放暑假了,依稀記得上個暑假一邊練車,一邊試圖拿捏C語言,第一次感覺暑假也可以如此忙碌。但是開學以后,我并沒有把重心放在期望自己應該做的事情上,更多的時間花費在了處理學院的相關事務。現在看來,大二…

《昇思 25 天學習打卡營第 9 天 | FCN 圖像語義分割 》

活動地址:https://xihe.mindspore.cn/events/mindspore-training-camp 簽名:Sam9029 這一章節 出現了一個 深度學習 中經常出現的概念 全卷積網絡(Fully Convolutional Networks) : 官話:FCN 主要用于圖像分割領域&…

德璞資本:橋水公司如何利用AI實現投資決策的精準提升?

摘要: 在金融科技的浪潮中,橋水公司推出了一只依靠機器學習決策的創新基金,吸引了大量投資者的關注。本文將深入探討該基金的背景、AI技術的應用、對橋水公司轉型的影響,以及未來發展的前景。 新基金背景:橋水公司的創…

2024年7月2日 (周二) 葉子游戲新聞

老板鍵工具來喚去: 它可以為常用程序自定義快捷鍵,實現一鍵喚起、一鍵隱藏的 Windows 工具,并且支持窗口動態綁定快捷鍵(無需設置自動實現)。 卸載工具 HiBitUninstaller: Windows上的軟件卸載工具 經典名作30周年新篇《恐怖驚魂夜…

MyBatis入門案例

實施前的準備工作: 1.準備數據庫表2.創建一個新的springboot工程,選擇引入對應的起步依賴(mybatis、mysql驅動、lombok)3.在application.properties文件中引入數據庫連接信息4.創建對應的實體類Emp(實體類屬性采用駝峰…

throw 和return的區別,A函數里面執行B函數 B函數異常后 不再執行A函數

function aFun() {try {bFun();console.log(22222222222);} catch (e) {// 如果bFun中拋出異常,中止aFun的執行console.log(e.message);} }function bFun() {let a 1, b 1;if (a b) {throw new Error(Stopped by bFun); // 拋出異常,停止aFun}// bFun…

python3遞歸目錄刪除N天前的文件(帶有日志記錄)

本來想用linux find去處理,為了裝逼,寫了py玩玩,刪除2w個文件總共用了2毫秒。因為這個腳本有記錄刪除時間,你可以看到開始時間和最后刪除的時間。由于只用了2毫秒,把我嚇了一跳以為刪錯文件了!! #!/usr/bin/env python3 # -*- encoding: utf-8 -*-@File : del_N…

補瀏覽器環境

一,導言 // global是node中的關鍵字(全局變量),在node中調用其中的元素時,可以直接引用,不用加global前綴,和瀏覽器中的window類似;在瀏覽器中可能會使用window前綴:win…

校園水質信息化監管系統——水質監管物聯網系統

隨著物聯網技術的發展越來越成熟,它不斷地與人們的日常生活和工作深入融合,推動著社會的進步。其中物聯網系統集成在高校實踐課程中可以應用到許多項目,如環境氣象檢測、花卉種植信息化監管、水質信息化監管、校園設施物聯網信息化改造、停車…

C++編程(八)多態

文章目錄 一、多態(一)概念1. 多態2. 函數重寫3. 虛函數 (二)實現多態的條件1. 繼承關系2. 父類中寫虛函數3. 在子類中重寫父類的虛函數4.父類的指針或引用指向子類的對象5. 使用示例 (三)虛析構函數&#…

springboot項目jar包修改數據庫配置運行時異常

一、背景 我將軟件成功打好jar包了,到部署的時候發現jar包中數據庫配置寫的有問題,不想再重新打包了,打算直接修改配置文件,結果修改配置后,再通過java -jar運行時就報錯了。 二、問題描述 本地項目是springBoot項目…

【計算機圖形學 | 基于MFC三維圖形開發】期末考試知識點匯總(上)

文章目錄 視頻教程第一章 計算機圖形學概述計算機圖形學的定義計算機圖形學的應用計算機圖形學 vs 圖像處理 vs模式識別圖形顯示器的發展及工作原理理解三維渲染管線 第二章 基本圖元的掃描轉換掃描轉換直線的掃描轉換DDA算法Bresenham算法中點畫線算法圓的掃描轉換中點畫圓算法…

Java中的持續集成與持續部署

Java中的持續集成與持續部署 大家好,我是免費搭建查券返利機器人省錢賺傭金就用微賺淘客系統3.0的小編,也是冬天不穿秋褲,天冷也要風度的程序猿!今天我們將深入探討Java中的持續集成(Continuous Integration&#xff…

熟練掌握Docker及linux常用命令排查線上問題。熟悉Git, Maven等項目管理及構建工具,熟悉微服務中基于Jenkins的CI/CD

掌握Docker、Linux命令、項目管理及構建工具,以及CI/CD流程是現代軟件開發和運維的關鍵技能。以下是對這些技能的概述和一些實踐建議: ### Docker - **概述**:Docker是一個開源的容器化平臺,允許開發者打包應用及其依賴到一個可移…