SelfReg-UNet:解決UNet語義損失,增強特征一致性與減少冗余的優化模型

SelfReg-UNet:解決UNet語義損失,增強特征一致性與減少冗余的優化模型

    • 提出背景
    • 拆解
      • 類比:整理書架
      • 語義一致性正則化
      • 內部特征蒸餾
      • 為什么 UNet 會有語義損失?

?


提出背景

論文:https://arxiv.org/pdf/2406.14896

代碼:https://github.com/ChongQingNoSubway/SelfReg-UNet

  1. UNet架構的核心優勢:UNet通過編碼器和解碼器的結合,有效地將圖像中的語義信息轉化為精細的分割掩模,這對醫學圖像分割至關重要。

  2. 引入視覺變換器(ViT):為了克服傳統卷積神經網絡(CNN)在處理圖像長距離依賴性方面的局限,研究者開始使用ViT。ViT通過自我關注機制提升了模型對遠程信息的處理能力,但在處理局部細節上存在不足。

  3. 混合模型的發展:為了結合CNN和ViT的優點,研究者開發了混合UNet模型,這些模型既能捕獲廣泛的依賴關系,也能關注局部細節,但增加了計算復雜性和模型參數。

  4. 跳躍連接的創新:如Att-Unet和Unet++等變體通過改進跳躍連接來優化信息流,例如引入注意力機制或使用新的連接方式,以期過濾掉不相關的特征并提高分割精度。

  5. 監督不對稱和特征冗余問題:研究發現,現有UNet模型中存在的監督不對稱和特征冗余問題可能導致語義信息的損失。為此,我們提出了語義一致性正則化和內部特征蒸餾策略,旨在通過更精確的監督和特征信息的有效傳遞來解決這些問題。

UNet語義損失主要指在醫學圖像分割任務中,網絡由于訓練或結構限制而未能正確理解或保留圖像中的重要語義信息,導致分割結果與真實情況存在偏差。

具體來說,這種損失通常表現為分割精度低下,錯分和漏分現象,尤其是在圖像中具有相似紋理或密集重疊的結構時更為明顯。

例如,在進行腫瘤分割的任務中,UNet可能因為語義損失而將腫瘤周圍的正常組織錯誤地識別為腫瘤組織(錯分),或者沒有完全覆蓋實際的腫瘤邊界(漏分)。

這種情況往往是由于網絡在編碼過程中丟失了部分重要的局部信息,或者解碼過程中未能正確重建這些關鍵信息導致的。

在這里插入圖片描述
這張圖展示了醫學圖像分割領域中UNet架構的應用和分析。圖中包括三個部分:

  1. UNet架構(圖a):
    • 展示了UNet的整體結構,包括輸入圖像、通過多個編碼器層的處理,中間的瓶頸層,隨后是解碼器層和最終的輸出分割圖像。
    • 這種架構特別強調了編碼器和解碼器之間的跳躍連接,這有助于保留重要的空間信息,以提高分割的準確性。

UNet結構組成:

  • 輸入:展示了一個輸入的醫學圖像示例。
  • 編碼器部分:由四個編碼器塊(E1, E2, E3, E4)構成,每個塊包含兩個CNN/Transformer層。這些塊負責逐步降低圖像的空間分辨率,同時增加特征維度,以提取越來越抽象的特征。
  • 瓶頸部分(B):位于編碼器和解碼器之間,通常是特征提取和變換的核心部分,負責進一步處理特征。
  • 解碼器部分:包括四個解碼器塊(D1, D2, D3, D4),功能與編碼器相反,逐步恢復圖像的空間分辨率并減少特征維度,以重構圖像。
  • 跳躍連接:跳躍連接將編碼器中的特征直接連接到解碼器的相應層,這有助于恢復圖像的精細結構,因為它允許網絡利用淺層特征來精確地分割圖像。
  • 輸出分割:最終的輸出示例,顯示了分割后的圖像,其中不同的顏色代表不同的組織或結構。

雖然每個塊理論上包含兩層,但圖示中只顯示了每個塊的最后一層,以簡化視覺表示。這有助于清晰地理解UNet的高層結構和數據流動方式,而不混淆過多的層級細節。

這樣的結構設計使UNet特別適用于各種圖像分割任務,特別是在醫學圖像處理領域,其中精確的分割至關重要。

  1. 注意力圖(圖b):

    • 展示了在不同編碼器和解碼器層中,使用ViT和CNN結合的UNet模型產生的注意力圖。這些圖顯示了模型在處理輸入圖像時如何聚焦于圖像的關鍵區域。
    • 注意力機制幫助模型更有效地處理圖像中的信息,尤其是在重要的特征上,以提高分割的準確度。
  2. 特征相似性矩陣(圖c):

    • 比較了在淺層(左側矩陣)和較深層(右側矩陣)特征之間的相似性。深層特征展示了更加集中和一致的自相似性,說明模型在深層提取的特征更加專注于主要的圖像內容。
    • 這種分析有助于了解不同層次上特征的表達和重要性,對優化模型結構和改進算法性能至關重要。

總體而言,這張圖說明了UNet模型在處理醫學圖像分割任務時如何聚焦和提取關鍵特征,以及通過不同方法(如ViT和CNN結合使用)改進信息處理。

拆解

這部分論文介紹了UNet在醫學圖像分割中學習特征的方法及其面臨的問題,并提出了兩種解決策略。

類比:整理書架

有一個書架滿載著各種書籍,這些書籍代表不同的數據或特征。你的目標是整理這個書架,使得相關的書籍靠近彼此,而不相關的書籍被適當地隔開。同時,你還想去掉那些重復的或者幾乎不被閱讀的書籍,以便為更有用的書籍騰出空間。

增強特征一致性 對應于將相似主題或內容的書籍放在一起。在UNet中,這意味著保證網絡學習到的特征在不同層次和位置上保持一致性,從而確保在圖像分割中能夠正確識別和標記圖像的各個部分。

減少冗余 對應于去除重復的書籍或很少被查看的書籍。在UNet中,這意味著減少不必要的、重復的特征表示,這些表示可能不會為最終的任務(如圖像分割)增加任何額外的信息價值。通過去除這些冗余特征,模型能夠更加高效地運作,同時避免過擬合,并提升處理速度和性能。

通過這種方式,優化后的模型(如SelfReg-UNet)就像是一個被精心整理過的書架,不僅容易找到所需的信息,而且還有效地利用了空間,去除了不必要的元素。

這樣的系統不僅能更快地找到所需信息,還提高了整體的功能性和效率。

改善UNet在處理醫學圖像分割時出現的語義丟失和特征冗余問題。

語義一致性正則化

  1. 語義一致性正則化 (Semantic Consistency Regularization, SCR)
    • 目的: 解決UNet中編碼器和解碼器之間的監督不對稱問題。
    • 方法: 使用具有最多語義信息的特征圖(例如D1層觀察到的)對其他所有層提供額外的監督。
    • 邏輯: 由于解碼器中的D1層對地面真實分割區域有準確的理解,利用這一層的特征來增強其他層的學習,減少語義丟失。
    • 技術細節: 使用平均池化和隨機通道選擇操作對特征進行對齊,并通過L2范數作為距離度量。

內部特征蒸餾

  1. 內部特征蒸餾 (Internal Feature Distillation, IFD)
    • 目的: 解決深層特征中的冗余問題。
    • 方法: 從淺層特征向深層特征傳遞信息,使用Lp范數懲罰來引導更深層特征學習有用的上下文信息。
    • 邏輯: 通過增強深層特征對上下文信息的敏感度,來提高模型的整體性能和精確度。
    • 技術細節: 將通道劃分為上半部和下半部,以此劃分作為邊界來確保淺層和深層具有相同數量的特征。
  • 將SCR和IFD的損失與交叉熵和Dice損失相結合,通過調整平衡參數λ1和λ2來優化模型性能。

這些解決策略形成了一個鏈條,從監督不對稱和特征冗余兩個角度出發,通過SCR和IFD兩種技術相結合來優化UNet模型的性能。

每種策略針對UNet在醫學圖像分割中面臨的具體問題提出了針對性的解決方案,互為補充,共同提升模型的準確性和效率。

在這里插入圖片描述
這張圖展示了論文中提到的兩種操作方法:語義一致性正則化(Semantic Consistency Regularization, SCR)和內部特征蒸餾(Intra-Feature Distillation, IFD)。

這兩種方法都是為了優化UNet在處理醫學圖像分割時的特征表示。具體說明如下:

(a) 語義一致性正則化 (SCR)

  • 操作步驟

    1. 隨機通道選擇:從輸入的特征圖 ( F m ( l ) ) ( F^{(l)}_m ) (Fm(l)?) 中隨機選擇特定通道。
    2. 平均池化:對選擇的特征圖進行空間維度的平均池化,從而減少特征圖的空間維度。
    3. L2-范數:對處理后的特征圖進行L2范數計算,以獲得最終的特征表示 ( F f i n a l ) ( F_{final} ) (Ffinal?)
  • 目的:這一步驟通過隨機選擇通道并進行平均池化,從而提取最具代表性和語義一致的特征,用于增強整個網絡的語義一致性。

(b) 內部特征蒸餾 (IFD)

  • 操作步驟

    1. 通道劃分:將輸入的特征圖 ( F ) 在通道維度上均等分為上半部 ( F t o p ) ( F_{top} ) (Ftop?) 和下半部 ( F b o t t o m ) ( F_{bottom} ) (Fbottom?)
    2. L2-范數:分別對上半部和下半部的特征圖進行L2范數處理,以提取和強化特征。
  • 目的:通過將特征圖分割為兩部分并獨立處理,這種方法旨在減少特征冗余,并通過蒸餾技術從淺層特征向深層特征傳遞有價值的信息,促進模型學習更為精確和有用的特征表示。

這兩種方法都是針對UNet架構中存在的特征冗余和監督不對稱問題提出的解決方案,旨在通過改進特征處理和優化信息流,提高模型對醫學圖像的分割精度和效率。

為什么 UNet 會有語義損失?

UNet架構在處理醫學圖像分割時面臨特征一致性和冗余的兩大問題,主要由以下幾個方面引起:

  1. 網絡深度和特征抽象
  • 深度與抽象:UNet通過其多層編碼器和解碼器結構進行深度特征抽象。在向下采樣過程中,盡管模型可以捕獲廣泛的上下文信息,但同時可能會丟失關鍵的局部信息,如邊緣和紋理細節。這種信息的丟失在編碼器到解碼器的信息重建過程中可能導致不一致性。
  • 信息重建的挑戰:在解碼器階段,模型試圖重建圖像的細節,依賴于編碼器階段提取的特征。如果這些特征已經丟失了必要的信息,解碼器重建的圖像可能與原始圖像在語義上不一致。
  1. 跳躍連接和特征利用
  • 跳躍連接的局限:雖然跳躍連接旨在改善特征一致性,通過將編碼器中的高分辨率特征直接與解碼器中的對應特征相連接,但這種方法也存在局限。如果跳躍連接傳遞的特征本身包含冗余或不相關的信息,那么這些問題將直接影響到最終的分割結果。
  • 特征冗余:隨著網絡深度的增加,許多高級特征可能會開始表現出相似性,尤其是在處理大量相似圖像或圖像區域時。這種高級特征的相似性可能導致特征冗余,即多個通道或特征圖可能包含重復的信息,從而增加了計算負擔且沒有提供額外的洞察力。
  1. 訓練數據和標簽質量
  • 數據和標簽的質量:UNet的性能高度依賴于訓練數據的質量和標簽的準確性。如果訓練數據中存在標簽錯誤或質量不一,可能導致模型學習到錯誤或不一致的特征表示,進而影響模型的泛化能力和實際應用的準確性。
  1. 網絡設計和優化
  • 設計選擇和優化策略:UNet的架構設計和訓練策略,如損失函數的選擇、正則化方法以及優化算法,都會對特征的一致性和冗余有顯著影響。不當的設計選擇可能導致模型對某些特征過度依賴,而忽略了其他重要特征。

解決這些問題通常需要在模型設計時考慮更精細的特征管理策略,例如通過改進的跳躍連接設計、引入注意力機制或使用先進的正則化技術來提高特征的有效性和減少不必要的冗余。

本文來自互聯網用戶投稿,該文觀點僅代表作者本人,不代表本站立場。本站僅提供信息存儲空間服務,不擁有所有權,不承擔相關法律責任。
如若轉載,請注明出處:http://www.pswp.cn/diannao/35194.shtml
繁體地址,請注明出處:http://hk.pswp.cn/diannao/35194.shtml
英文地址,請注明出處:http://en.pswp.cn/diannao/35194.shtml

如若內容造成侵權/違法違規/事實不符,請聯系多彩編程網進行投訴反饋email:809451989@qq.com,一經查實,立即刪除!

相關文章

c++內存管理_復習

new與placement new new: 先調用operator new(大小),而operator new()會調用malloc嘗試分配內存,失敗則調用_callnewh()來釋放內存,直至分配成功 可以設置分配失敗的處理函數:將寫好的處理函數作為參數傳入set_new_han…

Vue3 使用 Vue Router 時,params 傳參失效

前言: 在寫項目的時候,使用了 vue-router 的 params 進行傳參,但是在詳情頁面中一直獲取不到參數。原因:Vue Router 在2022-8-22的那次更新后,使用這種方式在新頁面上無法獲取! 正文: 在列表頁進…

deeplabcut

import pandas as pd import h5py import pickle import json import os # 讀取 CSV 文件 csv_file_path /mnt/data/CollectedData_dlc.csv csv_data pd.read_csv(csv_file_path) # 讀取 H5 文件 h5_file_path /mnt/data/CollectedData_dlc.h5 with h5py.File(h5_file_pat…

LeetCode題練習與總結:只出現一次的數字Ⅱ--137

一、題目描述 給你一個整數數組 nums ,除某個元素僅出現 一次 外,其余每個元素都恰出現 三次 。請你找出并返回那個只出現了一次的元素。 你必須設計并實現線性時間復雜度的算法且使用常數級空間來解決此問題。 示例 1: 輸入:n…

K8S日常運維手冊

Kubernetes(簡稱 K8S)是一種廣泛使用的容器編排平臺,能夠自動化部署、擴展和管理容器化應用。對于運維人員來說,掌握 Kubernetes 的日常運維技能是確保系統穩定運行的關鍵。本文將介紹一些 Kubernetes 日常運維的基本操作與技巧&a…

虛擬機裝入kali linux

VMware 首先需要先安裝VMware Workstation Pro可以根據這篇文章來下載VMware 下載kali linux Installer Images VS Virtual Machines Installer Images(安裝鏡像)Virtual Machines(虛擬機) 直接訪問硬件,定制內核…

Matlab|【防騙帖】考慮時空相關性的風電功率預測誤差建模與分析

目錄 1 主要內容 2 部分程序 3 下載鏈接 1 主要內容 這個程序《考慮時空相關性的風電功率預測誤差建模與分析》畫的圖片非常漂亮,和原文獻基本一致,但是實際上內容并未實現出來,主要就是利用現有的風電預測的數據和結果做了相關的圖&#…

【數據結構】(C語言):鏈表

鏈表: 基本單位是節點。節點至少兩部分:數據,下一個數據的地址。頭指針head,始終指向鏈表的第一個節點。若沒有節點,則headNULL。鏈表在內存中是非連續的。不能使用索引(下標)查找元素。只能從…

解決:Xshell通過SSH協議連接Ubuntu服務器報“服務器發送了一個意外的數據包,received:3,expected:20”

下圖所示: 日志也基本看不出來問題在哪,只是說斷開了連接大概是驗證失敗。有幸在某論壇評論區找到了原因,是因為我的xshell版本太低了而服務器的ssh版本太高,高版本的ssh默認屏蔽了一部分不太安全的算法導致建立連接的時候驗證失敗…

C++ 14新特性個人總結

variable templates 變量模板。這個特性允許模板被用于定義變量,就像之前模板可以用于定義函數或類型一樣。變量模板為模板編程帶來了新的靈活性,特別是在定義泛化的常量和元編程時非常有用。 變量模板的基本語法 變量模板的聲明遵循以下基本語法&am…

解決Vue+Vite打包后Leaflet的marker圖標不顯示的問題

前言 用Leaflet寫關于WebGIS的開發,用Vite或者webpack打包,打包后會找不到圖標,如下所示。 直言的說,筆者去網上搜了搜,其實收到一個比較好是答案。網址如下。 (完美解決~)關于VueLeaflet添加…

eslint 與 prettier 的一些常見的配置項(很詳細)

目錄 1、eslint 常見配置項(語法規范) 2、 prettier 常見的配置項(格式規范) 代碼規范相關內容看小編的該文章,獲取對你有更好的幫助 vsCode代碼格式化(理解eslint、vetur、prettier,實現格式…

IDEA啟動報錯:Abnormal build process termination...

一、問題描述 因為項目需要,同時打開了兩個idea,突然發現一個啟動的時候報錯,有點莫名其妙,剛還好好的,為啥就不能用了,一頓百度找方法,試了各種方法,像重新安裝jdk、重啟系統發現都…

TensorFlow開源項目

歡迎來到 Papicatch的博客 文章目錄 🍉TensorFlow介紹 🍉主要特點和功能 🍈多語言支持 🍈靈活的架構 🍈分布式訓練 🍈跨平臺部署 🍈強大的工具鏈 🍈豐富的社區和生態系統 &a…

c++基本數據類型和計算(一)習題講解

1.【單選題】以下說法正確的是? A. unsigned 類型的值 最大為0xFFFFFFFF B. float類型的值大約有15位精度 C.bool類型占用4個字節 解析: 選項A:unsigned 類型的值 最大為 4個字節,正確。選項B: 因為float類型的值是單精度的浮…

Vue3基礎使用

目錄 一、創建Vue3工程 (一)、cli (二)、vite 二、常用Composition API (一)、setup函數 (二)、ref函數 (三)、reactive函數 (四)、setup注意事項 (五)、計算屬性 (六)、watch (七)、watchEffect函數 (八)、生命周期 1、以配置項的形式使用生命周期鉤子 2、組合式…

kafka-簡單代碼實現生產者消費者

生產者代碼: package com.kafka.test;import org.apache.kafka.clients.producer.KafkaProducer; import org.apache.kafka.clients.producer.ProducerConfig; import org.apache.kafka.clients.producer.ProducerRecord; import org.apache.kafka.common.seriali…

【機器學習-10】 | Scikit-Learn工具包進階指南:Scikit-Learn工具包之支持向量機模塊研究

🎩 歡迎來到技術探索的奇幻世界👨?💻 📜 個人主頁:一倫明悅-CSDN博客 ?🏻 作者簡介: C軟件開發、Python機器學習愛好者 🗣? 互動與支持:💬評論 &…

高考填報志愿攻略,5個步驟選專業和院校

在高考完畢出成績的時候,很多人會陷入迷茫中,好像努力了這么多年,卻不知道怎么規劃好未來。怎么填報志愿合適?在填報志愿方面有幾個內容需要弄清楚,按部就班就能找到方向,一起來了解一下正確的步驟吧。 第…

入局AI手機 蘋果公布Apple Intelligence

日前,蘋果WWDC 2024如期召開。在這持續1個小時44分鐘的開發者大會上,蘋果在前一個小時里更新了iOS、iPadOS、MacOS等操作系統,而且還首次更新了visionOS。余下的時間全部留給了蘋果的“AI大禮包”——Apple Intelligence(蘋果智能…