一、引言:醫學圖像分割的挑戰與機遇 ?
醫學圖像分割是輔助疾病診斷和治療規劃的關鍵技術,但傳統方法常受限于復雜病理特征和微小結構。現有深度學習模型(如CNN和Transformer)雖各有優勢,但CNN難以建模長距離依賴,而Transformer的計算復雜度高且易忽略局部細節。 ?
最新突破:來自北京理工大學的研究團隊提出了一種雙路徑融合模型PGM-UNet,結合CNN的局部感知力與Mamba的全局建模能力,顯著提升了分割精度與效率,相關成果已發表于頂會論文。
二、核心創新:PGM-UNet的三大技術亮點 ?
1. 提示引導的Mamba模塊(PGRM) ?
???- 動態視覺提示:從原始輸入中提取關鍵線索(如病灶邊緣),指導Mamba更精準捕捉全局信息。 ?
???- 即插即用:該模塊可靈活嵌入其他任務,優化信息提取流程。 ?
2. 雙路徑融合架構(LG-Net) ?
???- 并行分支設計:CNN路徑提取局部細節(如血管紋理),Mamba路徑建模全局上下文(如病灶形態)。 ?
???- 注意力融合(MAFM):通過通道注意力機制動態加權局部與全局特征,抑制冗余信息,聚焦關鍵區域。 ?
3. 多尺度信息提取模塊(MIEM) ?
???- 空洞卷積+KAN網絡:利用不同擴張率的卷積捕獲多尺度特征,結合KAN網絡的強非線性表達能力,增強模型對復雜結構的解析力。 ?
三、實驗結果:全面超越SOTA模型 ?
- 皮膚病變分割(ISIC-2017/2018):平均DSC達87.69%,較Mamba模型AC-MambaSeg提升1.16%。 ?
- 血管分割(DIAS/DRIVE):在視網膜血管分割中,敏感度(Sen)提升0.77%,精準捕捉毛細血管網絡。 ?
- 泛化性能:在跨數據集測試(ISIC-2018→PH2)中,DSC仍保持92.01%,展現強魯棒性。 ?
四、技術價值與未來展望 ?
- 臨床意義:為皮膚病、血管疾病等提供高精度自動化診斷工具,降低人工標注成本。 ?
- 局限與改進:當前模型對毛發遮擋(如皮膚圖像)和密集毛細血管的細節處理仍有提升空間,未來計劃引入更高效注意力機制。 ?
- 擴展應用:研究團隊計劃基于提示學習開發“全能型”醫學分割模型,適配多模態數據與跨設備場景。
五、結語:AI賦能精準醫療的新里程碑 ?
PGM-UNet通過創新的雙路徑設計和提示學習,為醫學圖像分割樹立了新標桿。其高效性與精準性不僅推動學術進展,更為臨床落地提供了可靠工具。未來,隨著模型優化與多任務擴展,AI輔助診斷的邊界將進一步拓寬。
論文地址:https://arxiv.org/abs/2503.19589