1. 注意力機制的理論基礎
1.1 空間注意力機制
空間注意力機制模擬人類視覺系統,能夠關注圖像中的顯著區域。其核心思想是根據特征圖的空間位置生成權重圖,突出重要區域并抑制無關信息。常見的實現方式是通過沿通道維度的池化操作獲取空間統計信息,然后通過卷積層生成空間注意力圖。
1.2 頻率注意力機制
頻率注意力是相對較新的概念,它通過在頻率域中分析特征來捕獲全局上下文信息。與空間注意力不同,頻率注意力利用傅里葉變換將特征映射到頻率域,在頻域中進行特征選擇和信息增強,最后通過逆變換恢復回空間域。
1.3 注意力融合策略
單一類型的注意力機制往往只能捕獲特定類型的信息。將空間和頻率注意力相結合,可以同時利用空間域的位置敏感性和頻率域的全局上下文感知能力,形成互補優勢。
2. FS-UNet架構設計與實現
2.1 整體架構概述
我們提出的FS-UNet基于經典U-Net架構,在其跳躍連接和解碼器部分融入了頻率-空間注意力融合模塊(FSATFusion)。該架構保持了U-Net的編碼器-解碼器結構,但在每個雙卷積塊后加入了注意力模塊,使網絡能夠自適應地重新校準特征響應。