注意力機制(Attention
Mechanism)是深度學習中的一種方法,在圖像處理領域,尤其是在卷積神經網絡(CNN)和視覺Transformer等架構中。圖像數據具有局部相關性,注意力機制可以幫助模型聚焦于圖像中更重要的區域,從而提升處理效果。
SENet(Squeeze-and-Excitation
Network)是一種用于提高卷積神經網絡(CNN)性能的結構,通過引入注意力機制,使得網絡能夠自適應地重新標定各個通道的重要性。SENet通過“壓縮”和“激勵”操作(Squeeze-and-Excitation)來優化特征圖的通道間依賴關系,從而提升網絡的表現。
目錄
- 1.SENet
- 2.在YOLOv8模型源碼修改添加SENet注意力模塊
-
- __init__.py
- block.py
- yolov8.yaml
- 模型訓練
1.SENet
核心思想:SENet的關鍵創新是通道注意力機制,通過以下兩個步驟對特征圖進行處理:
-
- Squeeze(壓縮):
對輸入的特征圖進行全局平均池化(Global Average Pooling),將每個通道的空間信息壓縮成一個單一的標量。
這一操作可以捕捉到每個通道的全局信息,使得每個通道在不同空間位置的特征都能被匯聚到一個值。
- Squeeze(壓縮):
-
- Excitation(激勵):
對壓縮后的全局特征進行一系列的操作,生成一個權重向量,來表示每個通道的重要性。
- Excitation(激勵):