SvANet:微小醫學目標分割網絡,增強早期疾病檢測

SvANet:微小醫學目標分割網絡,增強早期疾病檢測

    • 提出背景
      • 前人工作
        • 醫學對象分割
        • 微小醫學對象分割
        • 注意力機制
    • SvANet 結構圖
      • SvANet 解法拆解
        • 解法
        • 邏輯鏈

?


論文:SvANet: A Scale-variant Attention-based Network for Small Medical Object Segmentation

代碼:https://github.com/anthonyweidai/SvANet

提出背景

一種新型神經網絡,名為SvANet,該網絡專為圖像中小型醫療對象的分割而設計,這對于早期疾病檢測和準確診斷至關重要。

  1. 問題背景:早期檢測和診斷疾病可以顯著提高治療效果。當疾病表現為醫學圖像中的小感染區域時,這一點尤為重要,因為這些小區域難以準確檢測。

  2. 當前挑戰:傳統的深度學習模型,如卷積神經網絡(CNNs),在小對象分割方面常常遇到困難,因為它們通過重復的處理步驟(如卷積和池化)丟失了重要細節。隨著模型對圖像數據更深層的處理,這個問題會加劇。

  3. SvANet解決方案:提出的SvANet通過以下方式解決這些挑戰:

    • 蒙特卡羅注意力:此組件在不同的尺度上生成注意力圖,幫助網絡了解在圖像中應該關注的位置。
    • 尺度變化注意力:這可能允許網絡對圖像中不同大小的特征給予不同程度的關注,這對檢測小對象至關重要。
    • 視覺變壓器:結合傳統的卷積方法和視覺Transformer,以捕獲圖像中的局部和更全局的特征。
      ?
      這種模型以一種類似于Transformer處理序列的方式處理圖像,可能更好地捕捉全局上下文。
  4. 性能:SvANet在多種類型的醫學圖像中分割小醫療對象方面表現出色,通過在幾個數據集上的高分表現得到證明,非常接近醫生的診斷結果。

    這些數據集包括腎腫瘤、皮膚病變、肝腫瘤、視網膜等圖像,其中感興趣的對象與整個圖像大小相比非常小。

SvANet是一種復雜的工具,旨在增強醫學成像中微小、可能表明疾病的異常的檢測,從而支持更好的早期診斷實踐。

前人工作

這段內容主要討論了醫學圖像分割中幾個關鍵的研究領域和技術進展,特別是如何處理小尺寸的醫療對象。我來為你簡化解釋每一部分:

醫學對象分割
  • 基礎技術: 使用編碼器-解碼器結構進行醫學圖像分割。這種結構首先通過編碼器提取特征,然后通過解碼器生成分割掩碼,以區分圖像中的不同醫學對象。
  • U形結構: 通過使用卷積層連接編碼器和解碼器的分支,這種結構幫助信息在網絡中有效傳播,用于更好地分割圖像中的對象,如腫瘤細胞等。
微小醫學對象分割
  • 挑戰: 深度學習中的卷積和池化操作可能會壓縮輸入數據,損害醫學對象的形態特征。
  • 解決方案: 提出多種方法來改善小尺寸對象的分割效果,包括使用空洞卷積、跳躍連接、特征金字塔、多列結構和注意力機制等,這些技術有助于提取和放大圖像中的小對象特征。
注意力機制
  • 應用: 在語義分割中廣泛使用注意力機制來突出重要特征。
  • 技術創新: 結合通道注意力和空間注意力,提高多維特征的學習能力和分割精度。還引入了反向注意力和自注意力技術,以提取更細致的邊界信息和增強輸入數據內部的依賴關系。

?

SvANet 結構圖

在這里插入圖片描述

這張圖是一個復雜的神經網絡架構圖,稱為SvANet,用于醫學圖像的小物體分割。

  1. 輸入圖像: 最左側展示了不同醫學成像方式的小醫療對象的圖片,包括全幅成像(WSI)、眼科成像(Oph)、皮膚科成像(Derm)、結腸鏡檢查(COL)、磁共振成像(MRI)、計算機斷層掃描(CT)、和顯微鏡成像(MSCP)。

  2. MCAtn(蒙特卡羅注意力)模塊: 在左上方的虛線框內,這部分通過使用不同規模的池化輸出大小來生成注意力圖,從而在單一階段內學習小物體的空間信息和對象關系。

  3. SvAttn(尺度變化注意力)模塊: 在頂部中間的虛線框內,此模塊生成基于逐步壓縮的特征圖的注意力圖,從而捕捉小醫療對象的位置和形態本質。

  4. AssemFormer: 在右上角的虛線框中,這部分結合了卷積和視覺變換器,通過組裝張量來融合局部空間層次和片間表示,提供圖像數據的全面理解。

  5. 卷積與池化操作: 圖中展示了多階段的卷積和池化操作,這些都是深度學習中常用的技術,用于提取特征和降低維度。

  6. ASPP(空洞空間金字塔池化): 在預測步驟之前,這一模塊用于捕捉圖像中的上下文信息,有助于改善分割的準確性。

  7. 預測輸出: 圖的右下角展示了不同成像方式的醫學圖像分割結果。

整體來看,這個架構通過結合傳統的卷積神經網絡和最新的視覺變換器技術,旨在更有效地檢測和分割醫學圖像中的小型對象,特別是在復雜和信息豐富的醫療圖像處理場景中。

?

以視網膜圖像分割為例:

  1. 輸入圖像: 在此例中,輸入圖像為視網膜成像(Oph),如圖中左側部分所示。視網膜圖像通常用于診斷各種眼病,如糖尿病性視網膜病變等。

    視網膜圖像的分辨率和細節要求極高,因為需要精確地識別和分割出細微的血管和病變區域。

  2. MCAtn(蒙特卡羅注意力): 這一模塊處理視網膜圖像,通過不同規模的池化來創建注意力圖,這有助于模型在不同大小的結構上聚焦,特別是小而重要的細節,如微小血管或早期病變。

  3. SvAttn(尺度變化注意力): 在處理視網膜圖像時,這個模塊通過分析不同尺度的特征圖來更好地理解圖像的深層結構。

    它幫助模型在不同層次上了解視網膜的復雜結構,特別是在圖像中較難觀察到的部分。

  4. AssemFormer: 這個部分將卷積層和視覺變換器的優勢結合起來,通過組裝張量,提供對視網膜圖像局部和全局特征的深入理解。

    它有效地整合了視網膜圖像中的局部細節和整體結構信息,有助于提高分割的準確性和魯棒性。

  5. 預測輸出: 最終,模型預測視網膜圖像中的關鍵特征,如圖中右下角的示例。

    這可以包括分割血管、識別病變區域等,這些信息對于后續的診斷和治療規劃至關重要。

通過這種高級別的網絡架構,SvANet能夠處理復雜的視網膜圖像,并執行精確的醫學圖像分割任務,從而支持眼科醫生更好地診斷和治療眼部疾病。

這樣的技術進步對于提早診斷和治療許多潛在嚴重的眼部疾病具有重要意義。

SvANet 解法拆解

目的:提高對醫學圖像中小型醫療對象的分割和識別精度。

問題

  1. 小型醫療對象在圖像中的特征不明顯,易被忽略。
  2. 多尺度的特征捕捉困難,導致在不同尺寸和深度的特征識別上存在局限性。
  3. 傳統的卷積網絡在處理極小對象時信息丟失嚴重。
解法

消融實驗:蒙特卡洛注意力 (MCAttn) 和 交叉尺度引導是提高預測精度的關鍵組件,而AssemFormer和MCBottleneck對提高陽性診斷(有某種疾病存在)的準確性至關重要。

  1. 蒙特卡洛注意力 (MCAttn)
    • 特征:使用隨機采樣的池化操作生成尺度不依賴的注意力圖,允許模型在不同尺度上捕捉關鍵信息。
    • 原因:傳統的全局平均池化在捕獲跨尺度相關性方面能力有限。
    • 例子:在處理含有細小血管的視網膜圖像時,MCAttn 能夠增強模型對這些微小結構的識別能力。

處理特征提取過程中的尺度不變性,強化模型在處理小尺度特征時的表現。

與傳統的全局注意力機制相比,MCAttn在特定的池化層中實施,直接增強了小對象特征的識別率,減少了背景噪聲的干擾。

在這里插入圖片描述

圖顯示了使用不同注意力機制的MCBottleneck和跨尺度引導(Cross-scale Guidance)生成的輸出特征圖。

  • (a) 輸入圖像:原始的醫學圖像。
  • (b) 地面真實情況(Ground Truth):標注了正確的醫學對象位置和形態。
  • ?, (d), (e), (f):不同注意力機制(如SE、CBAM、CoorAttn)下的輸出特征圖,展示了模型如何處理輸入圖像并突出不同特征。
  • (g) 單元格代表使用蒙特卡洛注意力機制的輸出特征圖

通過對比 (b)、(g),這些圖表展示了SvANet和其他模型如何在處理細小和微小醫學對象方面的不同,特別是在保留細節和精確定位方面的能力。

  1. 跨尺度特征引導
    • 特征:利用早期模型階段的高分辨率特征來指導后續階段的特征學習。
    • 原因:小型醫療對象的信息內容隨對象尺寸減小而顯著減少,需要額外的引導來增強特征的學習。
    • 例子:在處理多層次的皮膚癌圖像時,跨尺度特征引導幫助模型在深層學習小癌癥區域的同時,不丟失淺層的高分辨率細節。

通過跨不同階段的特征引導來增強模型對細節的捕捉能力。

利用高分辨率特征來指導模型在后續階段更好地學習小尺度醫療對象的特征。

  1. 尺度變化注意力 (SvAttn)
    • 特征:處理全局特征表示有局限性,通過跨多個尺度處理全局依賴性。
    • 原因:需要在保持長距離相關性的同時克服單一尺度特征的局限。
    • 例子:在處理MRI圖像中的小腫瘤時,SvAttn 允許模型在不同的尺度上有效分辨腫瘤和正常組織。

使模型能在不同尺度上動態調整,從而更精準地識別和分割小尺度醫療對象。

  1. 與視覺變換器結合的卷積 (AssemFormer)

    • 特征:結合了卷積和變換器的優勢,同時學習局部和全局特征。
    • 原因:變換器缺乏歸納偏見,需要與卷積結合來增強特征學習。
    • 例子:在處理復雜的腦部圖像時,AssemFormer能夠同時捕捉到精細的局部結構(如血管和神經纖維)和整體的腦區分布。

    ?
    結合了卷積和變換器操作,同時學習輸入醫學圖像的局部和全局特征。

    通過融合兩種技術的優勢,增強模型對醫療對象形態、深度和顏色分布的全局信息捕捉能力。

邏輯鏈

這些子解法構成一個網絡式的邏輯鏈,其中每個子解法相互支持,共同解決小型醫療對象識別和分割的問題:

  • 蒙特卡洛注意力 提供了跨尺度的特征識別能力。
  • 跨尺度特征引導 利用高分辨率特征強化后續學習。
  • 尺度變化注意力 進一步增強跨尺度特征的全局依賴處理。
  • 與視覺變換器結合的卷積 結合局部與全局特征學習,確保詳細和全面的對象分割。

這種方法能夠顯著提高對醫學圖像中小型和超小型對象的分割精度,對提早發現和診斷疾病至關重要。

在這里插入圖片描述
這張圖展示了在不同數據集(ATLAS、KiTS23和SpermHealth)中對各種醫學對象(如腫瘤、囊腫和精子)的分割結果。

這些示例反映了不同模型在處理超小對象、小對象和超過10%面積的對象時的效果:

  • (a) 輸入圖像:原始醫學掃描圖。
  • (b) 地面真實情況(Ground Truth):用不同顏色標記的醫學對象,例如綠色代表肝臟,紅色代表腫瘤。
  • ? HRNet的預測結果。
  • (d) TransNetR的預測結果。
  • (e) SvANet的預測結果(即本文提出的方法)。

圖中顯示SvANet在定位和識別醫學對象方面通常比其他方法更為準確和詳細,特別是在細節和邊界的識別上。

視網膜血管分割:

在這里插入圖片描述
在這里插入圖片描述
在這里插入圖片描述

本文來自互聯網用戶投稿,該文觀點僅代表作者本人,不代表本站立場。本站僅提供信息存儲空間服務,不擁有所有權,不承擔相關法律責任。
如若轉載,請注明出處:http://www.pswp.cn/web/44486.shtml
繁體地址,請注明出處:http://hk.pswp.cn/web/44486.shtml
英文地址,請注明出處:http://en.pswp.cn/web/44486.shtml

如若內容造成侵權/違法違規/事實不符,請聯系多彩編程網進行投訴反饋email:809451989@qq.com,一經查實,立即刪除!

相關文章

【JAVA poi-tl-ext 富文本轉word】

富文本轉word 環境使用poi-tl-ext的原因富文本轉word代碼 環境 jdk 1.8 <dependency><groupId>io.github.draco1023</groupId><artifactId>poi-tl-ext</artifactId><version>0.4.16</version> </dependency>poi-tl-ext已經包…

可靈重大升級!新增Web端上線、首尾幀控制、單次生成視頻時長增加至10s!

快手視頻生成大模型“可靈”&#xff08;Kling&#xff09;&#xff0c;作為全球首個真正用戶可用的視頻生成大模型&#xff0c;自面世以來&#xff0c;憑借其無與倫比的視頻生成效果&#xff0c;在全球范圍內贏得了用戶的熱烈追捧與高度評價。截至目前&#xff0c;申請體驗其內…

修正版頭像上傳組件

修正版頭像上傳組件 文章說明核心源碼展示運行效果展示源碼下載 文章說明 在頭像剪切上傳一文中&#xff0c;我采用div做裁剪效果&#xff0c;感覺會有一些小問題&#xff0c;在昨天基于canvas繪制的功能中改進了一版&#xff0c;讓代碼變得更簡潔&#xff0c;而且通用性相對高…

永恒之藍:一場網絡風暴的啟示

引言 在網絡安全的漫長歷史中&#xff0c;“永恒之藍”&#xff08;EternalBlue&#xff09;是一個不可忽視的里程碑事件。它不僅揭示了網絡世界的脆弱性&#xff0c;還促使全球范圍內對網絡安全的重視達到了前所未有的高度。本文將深入探討“永恒之藍”漏洞的起源、影響及其對…

【WebGIS】從設計層面設計系統

本項目在通過現代信息技術手段&#xff0c;對古村古鎮進行多方位、多角度的數字化記錄、展示與傳播&#xff0c;實現文化遺產的數字化保護、活化利用與共享。項目內容主要包括&#xff1a;1&#xff09;古村古鎮數據庫的建立&#xff1a;通過多種渠道收集古村古鎮的各類信息&am…

期貨量化交易客戶端開源教學第八節——TCP通信服務類

private FReciveStr: AnsiString; {接收到的數據} IsConErr: Boolean; {網絡連接是否失敗} FSocket_LB: Integer; {TCP連接類別,0為交易,1為行情,2為查詢} FRetryCount: Integer; {網絡連接重試次數} FLoginErrEvent: TLoginErrEvent; {…

如何從 PDF 中刪除背景

您是否曾經收到過充滿分散注意力背景的掃描 PDF 文檔&#xff1f;也許是帶有繁忙水印的舊收據或背景光線不均勻的掃描文檔。雖然這些背景可能看起來沒什么大不了的&#xff0c;但它們會使您的工作空間變得混亂&#xff0c;并使您難以專注于重要信息。輕松刪除這些不需要的元素并…

短視頻SEO矩陣系統:源碼開發與部署全攻略

在數字化時代&#xff0c;短視頻已成為人們獲取信息、娛樂休閑的重要方式。隨著短視頻平臺的興起&#xff0c;如何讓自己的內容在眾多視頻中脫穎而出&#xff0c;成為每個創作者和內容運營者關注的焦點。本文將為您深入解析短視頻SEO矩陣系統的源碼開發與部署&#xff0c;助您在…

MT6825磁編碼IC在智能雙旋機器人中的應用

MT6825磁編碼IC在智能雙旋機器人中的應用&#xff0c;無疑為這一領域的創新和發展注入了新的活力。作為一款高性能的磁性位置傳感器&#xff0c;MT6825以其獨特的優勢&#xff0c;在智能雙旋機器人的運動控制、定位精度以及系統穩定性等方面發揮了關鍵作用。 www.abitions.com …

django ninja get not allowed 能用 put delete

遇到一個奇怪的問題&#xff0c;django-ninja 編寫的 get post 方法不能使用 # 獲取Material router.get(/material, responseList[MaterialSchemaOut]) paginate(MyPagination) def list_material(request, filters: Filters Query(...)):qs retrieve(request, Material, f…

Midjourney v6.5 可能會在“7月底”發布,并改進了真實感和皮膚紋理

Midjourney v6.5即將發布&#xff0c;這一更新將大幅提升圖像的真實感和皮膚紋理&#xff0c;為用戶帶來更逼真的視覺體驗。首席執行官David Holz在電話會議中宣布&#xff0c;新版本將提高圖像清晰度&#xff0c;特別是在手部和皮膚細節上&#xff0c;同時改進Web應用程序和個…

ABAP調用BAPI時COMMIT WORK AND WAIT未按照預期同步提交問題分析

背景&#xff1a; 在做ABAP開發時&#xff0c;經常會有連續調用BAPI的需求&#xff0c;比如先創建銷售訂單&#xff0c;再依據銷售訂單創建交貨單&#xff0c;再對交貨單進行過賬等類似的一連串調用&#xff0c;這種類似的場景往往需要前一步操作的數據完全寫入數據庫才能進行…

編譯打包自己的云手機(redroid)鏡像

前言 香橙派上跑云手機可以看之前的文章&#xff1a; 香橙派5plus上跑云手機方案一 redroid(帶硬件加速)香橙派5plus上跑云手機方案二 waydroid 還有一個cuttlefish方案沒說&#xff0c;后面再研究&#xff0c;cuttlefish的優勢在于可以自定義內核且selinux是開啟的&#xf…

vue3下載base64文件

如果后端明確告訴你返回的是base64&#xff0c;那請求頭就不用帶responseType: “blob”,和普通的接口一樣發送就行 await materialsFile({ id: proxy.$route.query.id }).then((res) > {if (res) {// atob先解碼base64數據const raw window.atob(res.data);// 獲取解碼后…

vscode 遠程開發

目錄 vscode 遠程連接 選擇 Python 環境 vscode 遠程連接 按 CtrlShiftP 打開命令面板。輸入并選擇 Remote-SSH: Open SSH Configuration File...。選擇 ~/.ssh/config 文件&#xff08;如果有多個選項&#xff09;。在打開的文件中添加或修改你的 SSH 配置。 這個可以右鍵…

Jupyter Notebook基礎:用IPython實現動態編程

Jupyter Notebook基礎&#xff1a;用IPython實現動態編程 1. 引言 Jupyter Notebook是一個基于Web的交互式計算環境&#xff0c;允許用戶創建和共享包含實時代碼、方程式、可視化和文本敘述的文檔。它廣泛應用于數據清洗與轉換、數值模擬、統計建模、機器學習以及其他數據科學…

開放開源開先河(一)

2022年7月28日&#xff0c;以“軟件定義世界 開源共筑未來”為主題的全球數字經濟大會開放原子開源峰會在北京開幕&#xff0c;承辦主峰會和為捐贈人進行授牌儀式的開放原子開源基金會再次進入公眾視野。基金會秘書長孫文龍從匯聚全球產業鏈開源力量、核心鏈接能力、開發者分享…

Aop切面編程(2)--代理模式

1、代理模式的理解&#xff1a;不修改A對象的代碼的基礎上&#xff0c;對A代碼塊進行拓展。通過創建ProxyA代理對象&#xff0c;拓展A對象并調用A對象的核心功能&#xff1b; 即&#xff1a;不修改對象的源碼基礎上&#xff0c;創建代理對象&#xff0c;進行功能的附加和增強&…

端到端擁塞控制的本質

昨天整理了一篇 bbr 的微分方程組建模(參見 bbr 建模)&#xff0c;算是 bbr 算法終極意義上的一個總結&#xff0c;最后也順帶了對 aimd 的描述&#xff0c;算是我最近比較滿意的一篇分享了。那么接下來的問題&#xff0c;脫離出具體算法&#xff0c;上升到宏觀層面&#xff0c…

git reset hard和soft的使用和區別

在Git中&#xff0c;git reset命令用于撤銷提交、回溯版本和調整工作目錄或暫存區狀態&#xff0c;而不是gitrestore。git reset主要有三種模式&#xff1a;--soft、--mixed&#xff08;默認&#xff09;和--hard。以下是關于--hard和--soft兩種模式的使用方法和區別的詳細解釋…