【導讀】
隨著無人機技術的發展,從交通監控到農業測繪,各類任務中對“空中視角下的小目標檢測”需求激增。然而,由于無人機拍攝視角多變、目標尺寸微小、環境光照復雜等因素,傳統檢測模型常常出現“漏檢”“誤檢”問題。
LAM-YOLO?的提出正是為了解決這些關鍵難題——它不僅提升了檢測準確率,還保持了優秀的實時性能,是?YOLOv8?在無人機檢測場景下的重磅升級。
目錄
一、LAM-YOLO?背景
二、LAM-YOLO 模型結構詳解
Lighting-Occlusion Attention Module (LAM)
Involution Block
SIB-IoU Loss
多尺度輔助檢測頭
三、實驗結果詳解
模型對比實驗
消融實驗
分類精度提升分析
結論
一、LAM-YOLO?背景
無人機應用日益廣泛,但由于拍攝視角多變、目標尺寸微小、環境光照處于府處的原因,導致當前大多數目標檢測模型對小目標、重疊、遮擋目標無能不力。
-
目標尺寸小且尺度差異大:圖像中既有遠處行人,也有近處車輛,尺寸跨度大。
-
目標遮擋與密集分布:小目標往往被建筑、樹木、光照遮擋,易被漏檢。
-
環境復雜:光照變化強烈,如陽光直射或夜間低光,影響模型判別能力。
LAM-YOLO?就是針對這些特點設計的專用檢測模型,它基于高效的?YOLOv8?架構,通過應對性地引入光照-遮擋注意力(LAM)模塊、重構性?Involution?特征融合單元、有益的框回歸損失?SIB-IoU?,并增加多規格小目標檢測頭,從而全面推動小目標檢測效果和重要特征的抽取能力。
揭示人類觀覺中光照和注意力之間的關系,將人類的非觀覺效應精神繪裝到模型設計中,是該模型最大的特色。
二、LAM-YOLO 模型結構詳解
LAM-YOLO?構建在?YOLOv8?基礎上,但進行三大方向的結構升級,包括注意力增強模塊、特征融合方式、損失函數設計,并額外引入兩個小目標檢測頭,全面提升小目標檢測精度。
-
Lighting-Occlusion Attention Module (LAM)
LAM 模塊是模型核心創新,它結合了通道注意力和帶窗自注意力,重點抽取遮擋和光照處理下小目標的閃爍特征。
LAM 模塊包括:
-
淺層特征提取(Conv3x3)
-
RHAG 混合注意力組,包括?Vision-Aware Attention Block (VAB)?和?Overlapping Light Attention Block (OLAB)
-
重構單元:通過?pixel shuffle?接入高分辨率特征
LAM 模塊是唯一展現所謂“云間選擇注意力”的組件,能夠動態調整網絡對光照處理特征的敏感度。
-
Involution Block
傳統卷積在空間特征對齊上存在信息損失,特別是在FPN階段。LAM-YOLO引入Involution模塊(可逆卷積),用以:
-
針對每個像素動態生成不同卷積核
-
實現特征圖各尺度間的“位置感知”卷積處理
-
增強局部特征細節與全局上下文之間的橋接能力
公式設計上,每個像素根據其位置和通道生成局部卷積核,通過自適應調整不同區域的處理策略。
-
SIB-IoU Loss
為提高小目標回歸精度,作者設計了融合式的?Soft Inner-section Bounding-box IoU (SIB-IoU),其融合了:
-
考慮了相對地址距離、形狀絕對誤差、角度損失
-
引入多個縮放系數的輔助框,并通過?Inner-IoU?維持經驗系統的放大和收縮擴展能力
-
有效提升較低 IoU 樣本的回歸精度和訓練收斂速度
最終損失函數為:
效果:對低IoU樣本提供更強梯度信號,加速訓練收斂速度,提升最終精度。
-
多尺度輔助檢測頭
LAM-YOLO 在原?YOLOv8?的基礎上新增兩個分辨率為?320×320(P1)和?160×160(P2)的檢測頭,主要針對遠距離極小目標。這種設計顯著降低了低分辨率下的漏檢率。
三、實驗結果詳解
-
模型對比實驗
在?VisDrone2019?數據集上,LAM-YOLO?與主流方法的對比如下:
-
LAM-YOLO mAP@0.5 = 48.8%,比?YOLOv9?提升 1.1%;
-
mAP@0.5:0.95 = 29.9%,比?Cascade R-CNN?高 0.3%,超越大部分?two-stage?方法;
-
在多元環境下同樣表現出艱強的實際通用性
-
消融實驗
各模塊貢獻總結:
-
小目標檢測頭提升最大(+3.4%);
-
LAM模塊貢獻約+1.1%;
-
Involution略優于傳統卷積;
-
損失函數替換(CIoU→SIB-IoU)提升 0.7%。
-
分類精度提升分析
顯然,LAM-YOLO在“人/車/摩托”等小目標上效果顯著提升。
結論
LAM-YOLO 的提出,為復雜環境下的無人機小目標檢測提供了全新解決方案:
-
強化注意力機制適應復雜光照與遮擋;
-
利用?Involution?彌補多尺度信息缺失;
-
自定義 SIB-IoU 損失提升訓練效率與精度;
-
增設小目標檢測頭解決“極小目標”問題。
這使得 LAM-YOLO 在精度與實時性之間取得了良好平衡,非常適合部署在實際的無人機巡檢、監控系統中。
未來方向:輕量化部署、跨場景泛化、多模態融合(如紅外+可見光)等,都將是LAM-YOLO繼續拓展的潛力空