在復雜視覺環境中,如低光照、霧天或遠距離拍攝等場景下,圖像質量下降導致目標模糊,使得傳統目標檢測模型難以實現高精度識別。YOLO系列作為主流單階段檢測框架,在速度和精度方面表現出色,但在模糊和小目標場景中仍存在性能瓶頸。本文提出一種面向 YOLOv12 的創新性改進方法,引入 ICCV 2023 提出的空間自適應特征調制模塊(
SAFM
) ,替代傳統上采樣操作,通過多尺度特征表示 與動態空間調制機制 ,有效增強非局部特征交互能力,顯著提升模型在模糊和小目標場景下的檢測精度。
1. 研究背景
在YOLOv12架構中,上采樣過程通常依賴雙線性插值或轉置卷積操作,這些方法雖然計算高效,但難以恢復圖像的高頻細節,尤其在模糊或小目標區域容易產生偽影或誤檢。
SAFM
模塊通過以下機制彌補這一缺陷:
- 利用非局部特征交互增強上下文感知;
- 引入動態空間調制實現像素級增強;
- 多尺度融合提高魯棒性與泛化能力;
- 結構設計兼顧效率與性能平衡。
因此,我們將SAFM
模塊嵌入