無人機圖像中的小目標檢測新利器:深入解析 LAM-YOLO 模型

【導讀】

隨著無人機技術的發展,從交通監控到農業測繪,各類任務中對“空中視角下的小目標檢測”需求激增。然而,由于無人機拍攝視角多變、目標尺寸微小、環境光照復雜等因素,傳統檢測模型常常出現“漏檢”“誤檢”問題

LAM-YOLO?的提出正是為了解決這些關鍵難題——它不僅提升了檢測準確率,還保持了優秀的實時性能,是?YOLOv8?在無人機檢測場景下的重磅升級。

目錄

一、LAM-YOLO?背景

二、LAM-YOLO 模型結構詳解

Lighting-Occlusion Attention Module (LAM)

Involution Block

SIB-IoU Loss

多尺度輔助檢測頭

三、實驗結果詳解

模型對比實驗

消融實驗

分類精度提升分析

結論


一、LAM-YOLO?背景

無人機應用日益廣泛,但由于拍攝視角多變、目標尺寸微小、環境光照處于府處的原因,導致當前大多數目標檢測模型對小目標、重疊、遮擋目標無能不力。

  • 目標尺寸小且尺度差異大:圖像中既有遠處行人,也有近處車輛,尺寸跨度大。

  • 目標遮擋與密集分布:小目標往往被建筑、樹木、光照遮擋,易被漏檢。

  • 環境復雜:光照變化強烈,如陽光直射或夜間低光,影響模型判別能力。

LAM-YOLO?就是針對這些特點設計的專用檢測模型,它基于高效的?YOLOv8?架構,通過應對性地引入光照-遮擋注意力(LAM)模塊、重構性?Involution?特征融合單元、有益的框回歸損失?SIB-IoU?,并增加多規格小目標檢測頭,從而全面推動小目標檢測效果和重要特征的抽取能力。

揭示人類觀覺中光照和注意力之間的關系,將人類的非觀覺效應精神繪裝到模型設計中,是該模型最大的特色。


二、LAM-YOLO 模型結構詳解

圖片

LAM-YOLO?構建在?YOLOv8?基礎上,但進行三大方向的結構升級,包括注意力增強模塊、特征融合方式、損失函數設計,并額外引入兩個小目標檢測頭,全面提升小目標檢測精度。

  • Lighting-Occlusion Attention Module (LAM)

圖片

LAM 模塊是模型核心創新,它結合了通道注意力和帶窗自注意力,重點抽取遮擋和光照處理下小目標的閃爍特征。

LAM 模塊包括:

  • 淺層特征提取(Conv3x3)

  • RHAG 混合注意力組,包括?Vision-Aware Attention Block (VAB)?和?Overlapping Light Attention Block (OLAB)

  • 重構單元:通過?pixel shuffle?接入高分辨率特征

LAM 模塊是唯一展現所謂“云間選擇注意力”的組件,能夠動態調整網絡對光照處理特征的敏感度。

  • Involution Block

image.png

傳統卷積在空間特征對齊上存在信息損失,特別是在FPN階段。LAM-YOLO引入Involution模塊(可逆卷積),用以:

  • 針對每個像素動態生成不同卷積核

  • 實現特征圖各尺度間的“位置感知”卷積處理

  • 增強局部特征細節與全局上下文之間的橋接能力

公式設計上,每個像素根據其位置和通道生成局部卷積核,通過自適應調整不同區域的處理策略。

  • SIB-IoU Loss

為提高小目標回歸精度,作者設計了融合式的?Soft Inner-section Bounding-box IoU (SIB-IoU),其融合了:

  • 考慮了相對地址距離、形狀絕對誤差、角度損失

  • 引入多個縮放系數的輔助框,并通過?Inner-IoU?維持經驗系統的放大和收縮擴展能力

  • 有效提升較低 IoU 樣本的回歸精度和訓練收斂速度

image.png

最終損失函數為:

image.png

效果:對低IoU樣本提供更強梯度信號,加速訓練收斂速度,提升最終精度。

  • 多尺度輔助檢測頭

LAM-YOLO 在原?YOLOv8?的基礎上新增兩個分辨率為?320×320(P1)和?160×160(P2)的檢測頭,主要針對遠距離極小目標。這種設計顯著降低了低分辨率下的漏檢率。


三、實驗結果詳解

  • 模型對比實驗

在?VisDrone2019?數據集上,LAM-YOLO?與主流方法的對比如下:

image.png

image.png

image.png

  • LAM-YOLO mAP@0.5 = 48.8%,比?YOLOv9?提升 1.1%

  • mAP@0.5:0.95 = 29.9%,比?Cascade R-CNN?高 0.3%,超越大部分?two-stage?方法;

  • 在多元環境下同樣表現出艱強的實際通用性

  • 消融實驗

image.png

image.png

各模塊貢獻總結:

  • 小目標檢測頭提升最大(+3.4%)

  • LAM模塊貢獻約+1.1%;

  • Involution略優于傳統卷積;

  • 損失函數替換(CIoU→SIB-IoU)提升 0.7%。

  • 分類精度提升分析

image.png

顯然,LAM-YOLO在“人/車/摩托”等小目標上效果顯著提升。


結論

LAM-YOLO 的提出,為復雜環境下的無人機小目標檢測提供了全新解決方案:

  • 強化注意力機制適應復雜光照與遮擋;

  • 利用?Involution?彌補多尺度信息缺失;

  • 自定義 SIB-IoU 損失提升訓練效率與精度;

  • 增設小目標檢測頭解決“極小目標”問題。

這使得 LAM-YOLO 在精度與實時性之間取得了良好平衡,非常適合部署在實際的無人機巡檢、監控系統中。

未來方向:輕量化部署、跨場景泛化、多模態融合(如紅外+可見光)等,都將是LAM-YOLO繼續拓展的潛力空

本文來自互聯網用戶投稿,該文觀點僅代表作者本人,不代表本站立場。本站僅提供信息存儲空間服務,不擁有所有權,不承擔相關法律責任。
如若轉載,請注明出處:http://www.pswp.cn/news/914809.shtml
繁體地址,請注明出處:http://hk.pswp.cn/news/914809.shtml
英文地址,請注明出處:http://en.pswp.cn/news/914809.shtml

如若內容造成侵權/違法違規/事實不符,請聯系多彩編程網進行投訴反饋email:809451989@qq.com,一經查實,立即刪除!

相關文章

Rust 基礎大綱

Rust 基礎大綱1.Summary安裝教材2 Rust 源1.Summary 安裝 https://www.rust-lang.org/zh-CN/tools/install curl --proto https --tlsv1.2 -sSf https://sh.rustup.rs | sh# 安裝完成后,驗證是否成功 rustc -V cargo -V# 創建項目 cargo new my_project # 編譯項…

PostgreSQL 大數據量(超過50GB)導出方案

1.正常導出導出指定庫./pg_dump -d test_db -p 2360 > /home/softwares/postgresql/test_db.sql導出指定表./pg_dump -p 2360 -U postgres -t test_schema.test_table test_db > /home/softwares/postgresql/m.sql-t參數說明,-t test_schema.test_table test…

終端安全最佳實踐

什么是終端安全?終端安全通過保護組織中的設備的過程,來保護公司網絡免受漏洞和網絡攻擊。主要的任務包括:更新終端補丁、遵循相關安全標準和要求、滿足各種合規性策略設置等等。終端安全和防病毒之間的區別是什么?殺毒軟件可以幫…

【UE4 UE5】UE設置屏幕分辨率 全屏、窗口設置的方法

1.在藍圖中設置如下 設置全屏模式藍圖節點可以選擇全屏或者窗口 2.通過執行控制臺命令設置 注意:"x"是英文字母x w:窗口 f:全屏 3.通過修改項目配置文件設置。 打開 項目路徑\Saved\Config\Windows下的GameUserSettings.ini文件 在文件中進行相應修改 ?…

非控制器(如 Service、工具類)中便捷地獲取當前 HTTP 請求的上下文信息

非控制器(如 Service、工具類)中便捷地獲取當前 HTTP 請求的上下文信息 在 Spring 框架的 Web 開發中,RequestContextHolder 是一個非常實用的工具類,它的主要作用是在非控制器(如 Service、工具類)中便捷地…

Excel處理控件Aspose.Cells教程:使用 Python 在 Excel 中創建甘特圖

時間軸上的任務可視化有助于更好地管理項目。本文將學習如何使用Aspose.Cells for Python 通過 .NET在 Excel 中創建甘特圖。只需幾行代碼,即可將簡單的任務數據轉換為動態清晰的可視化時間軸,非常適合用于報表、儀表板和規劃文檔。 Aspose.Cells官方試…

【RK3568 平臺I2C協議與AGS10驅動開發】

RK3568 平臺I2C協議與AGS10驅動開發一、I2C 總線協議基礎二、I2C 通信過程詳解三、AGS10 傳感器概述四、AGS10驅動開發1. 硬件連接2. 設備樹(DTS)配置3. 內核驅動開發五、調試與驗證六、總結引言在嵌入式系統開發中,傳感器數據采集是常見需求…

arm版本的ubuntu安裝git或者vim等方法

看起來你在基于 ARM 的 Ubuntu 系統上安裝 Vim 時遇到了問題,錯誤提示為“E: 無法定位軟件包 vim”。這通常是因為系統的軟件包列表未更新,或者該軟件包在你檢查的標準軟件源中不可用。以下是通常可以解決這個問題的方法:1. 更新軟件包列表“…

MFC擴展庫BCGControlBar Pro v36.2新版亮點:可視化設計器升級

BCGControlBar庫擁有500多個經過全面設計、測試和充分記錄的MFC擴展類。 我們的組件可以輕松地集成到您的應用程序中,并為您節省數百個開發和調試時間。 BCGControlBar專業版 v36.2已全新發布了,在這個版本中添加了一個新的擴展器控件、改進了網格和報表…

小杰學C(eleven day)——莫道浮云終蔽日,總有云開霧散時。

1.結構體(1)內容定義:1.用戶自定義的數據類型2.可以包含若干不同數據類型(可相同)的成員變量3.這些數據項組合起來反應某一信息格式:struct 結構體名 (用戶自定義的數據類型){數據類型 成員變量1;數據類型 …

海豚遠程控制APP:隨時隨地,輕松掌控手機

在快節奏的現代生活中,我們常常需要在不同設備之間切換,管理手機也變得越來越重要。無論是遠程辦公、遠程學習還是日常生活中對手機的管理,一款高效、便捷的遠程控制軟件都能極大地提升我們的效率。海豚遠程控制APP正是這樣一款功能強大的手機…

Linux/Ubuntu安裝go

Linux/Ubuntu安裝go1. 首先移除舊版本(如有):2. 下載Go 1.23.9安裝包:3. 解壓到系統目錄:4. 設置環境變量(添加到~/.profile或~/.bashrc文件末尾):5.使環境變量生效:6. 驗…

教程:如何快速查詢 A 股實時 K線和5檔盤口

實時行情數據是量化交易策略、看板系統和交易決策系統的重要輸入。本文將以 Infoway API 提供的 WebSocket API 為例,教你如何使用 Python 快速接入并獲取 A 股的實時 K線數據 和 盤口數據。一、準備工作安裝 WebSocket 庫:pip install websockets二、查…

施易德門店管理系統應用案例分析:零售女裝品牌伊芙麗的全球化布局

在零售品牌的全球化進程中,如何應對不同市場的合規要求、實現本地化精細化運營,是企業面臨的重要課題。施易德(Cegid)門店管理系統憑借40年的全球零售數字化服務經驗,為多個品牌的海外拓展提供了支持。其中&#xff0c…

安全初級作業2

一、作業要求 1、xss-labs 1~8關 2、python實現自動化sql布爾育注代碼優化(二分查找) 二、操作過程 (一)xss-labs 1~8關 1、前期準備 (1)打開小皮面板,并啟動Apache和MySQL (2)將 xss-labs…

多模態大語言模型arxiv論文略讀(157)

Automatic Evaluation for Text-to-image Generation: Task-decomposed Framework, Distilled Training, and Meta-evaluation Benchmark ?? 論文標題:Automatic Evaluation for Text-to-image Generation: Task-decomposed Framework, Distilled Training, and M…

面試150——數組字符串

88. 合并兩個有序數組 給你兩個按 非遞減順序 排列的整數數組 nums1 和 nums2,另有兩個整數 m 和 n ,分別表示 nums1 和 nums2 中的元素數目。請你 合并 nums2 到 nums1 中,使合并后的數組同樣按 非遞減順序 排列。倒序比較,避免覆…

深入理解設計模式:命令模式詳解

在軟件開發中,我們經常遇到需要將"請求"或"操作"封裝成對象的情況。比如,GUI中的按鈕點擊、遙控器控制家電、事務系統中的操作回滾等場景。命令模式(Command Pattern)正是為解決這類問題而生的設計模式。本文…

自己寫的 MyHttpServlet 和直接繼承 HttpServlet 的區別

繼承你自己寫的 MyHttpServlet 和直接繼承 HttpServlet 的區別如下:1. 繼承 HttpServlet(官方推薦用法)HttpServlet 是 Java EE 官方提供的 Servlet 基類,已經實現了 Servlet 接口的大部分方法。它內部已經實現了 service() 方法&…

python庫 maya 庫的各種案例的使用詳解(人性化的日期時間處理)

文章目錄 一、Maya庫概述 1.1 maya介紹 1.2 安裝 maya 1.3 注意事項 二、基本使用 2.1 創建 MayaDT 對象 2.2 格式化輸出 2.3 時間運算 三、高級使用 3.1 時區處理 3.2 時間間隔 3.3 網絡時間獲取 四、實際應用示例 4.1 日志時間處理 4.2 會議時間提醒 4.3 國際化時間顯示 5. M…