CBAM 是一種能夠集成到任何卷積神經網絡架構中的注意力模塊。它的核心目標是通過學習的方式,自動獲取特征圖在通道和空間維度上的重要性,進而對特征圖進行自適應調整,增強重要特征,抑制不重要特征,提升模型的特征表達能力和性能。簡單來說,它就像是給模型裝上了 “智能眼鏡”,讓模型能夠更精準地看到圖像中關鍵的部分
CBAM 由兩個主要部分組成:通道注意力模塊(Channel Attention Module)和空間注意力模塊(Spatial Attention Module)。這兩個模塊順序連接,共同作用于輸入的特征圖。
SE 通道注意力的局限:僅關注 “哪些通道重要”,未考慮 “重要信息在空間中的位置”。
CBAM 的突破:
通道注意力(Channel Attention):分析 “哪些通道的特征更關鍵”(如圖像中的顏色、紋理通道)。
空間注意力(Spatial Attention):定位 “關鍵特征在圖像中的具體位置”(如物體所在區域)。
二者結合:讓模型同時學會 “關注什么” 和 “關注哪里”,提升特征表達能力。