Strong Baseline: Multi-UAV Tracking via YOLOv12 with BoT-SORT-ReID 2025最新無人機跟蹤

Strong Baseline: Multi-UAV Tracking via YOLOv12 with BoT-SORT-ReID 2025最新無人機跟蹤

自己研一期間的小論文大致上的結構和內容基本上已經完成,到了最后在測試集上測試數據的階段,在跑測試集的時間上就去看一些25年和多目標跟蹤的領域相關的一些內容。掌握一些前言的內容,也可以為之后的實驗和后續的工作提高一些baseline去使用。

熱紅外視頻中多無人機的檢測和跟蹤是一個具有挑戰性的問題,因為目標的對比度低、環境噪聲大、目標尺寸小。

自己所做的論文存在的比較困難的一個地方就是對極小目標的跟蹤上存在困難,檢測器能檢測到,但是提取特征上存在困難。

摘要

文章本身的創新性上感覺參考的價值不大,主要是集中在了從之前使用比較多的YOLOX上轉換到了使用最新的YOLO12的模型來進行替換,整個代碼中yolo12的使用是更有參考價值的。

提出了一個基于YOLOv 12和BoT-SORT的跟蹤框架,而不是依賴于帶有DeepSORT管道的YOLOv5

與傳統的RGB圖像相比,熱紅外視頻具有許多優勢,例如在低光照和惡劣天氣條件下增強了能見度,使其成為安全和監控應用的理想選擇。

在這里插入圖片描述

這里論文中給出的圖片信息應該就是熱紅外視頻的跟蹤方法。

下面的圖像就說明了:從訓練集中的邊界框注釋中裁剪的圖像塊,說明了UAV的不同大小,從幾個像素到個位數像素。我們通過利用最新的YOLOv 12 探測器和BoT-SORT 跟蹤算法構建了一個完整的無人機跟蹤工作流程,其性能優于成熟的YOLOv 5 與DeepSORT的組合。

在這里插入圖片描述

將文章主要的創新點總結如下:

  1. 我們建立了一個基于YOLOv 12和BoT-SORT的多無人機跟蹤工作流程,為基于熱紅外視頻的多無人機跟蹤任務奠定了堅實的基礎。

  2. 我們對各種試驗調整提供了深入的分析,例如輸入圖像大小和跟蹤器緩沖區調整的影響,并從我們強大的基線開始為未來的改進提供了基本考慮。

感覺這個第二個創新點直觀的看上去我自己水平可能是理解不了,自我感覺是稍微有點水沒提出以些實際有效的模塊或者算法提供出來。

我們的方法通過利用最新的探測器和跟蹤器,設置一個新的基準熱紅外視頻為基礎的無人機跟蹤和指導未來的研究在多無人機跟蹤任務的領域。

Methodology方法論

介紹了主要的檢測模型YOLOv 12和跟蹤算法BoT-SORT,然后詳細介紹了我們的訓練和推理策略。

BOT-SORT對于自己來說是十分熟悉的論文其代碼的形式也是很了解用的比較多。對于最新的YOLO12確實是沒了解過。

  1. 首先說明了它這個無人機跟蹤算法的主要的三個任務:

挑戰由三個軌道組成,每個軌道對應于不同的場景。航跡1和航跡2是SOT任務,不同之處在于是否給出了UAV的初始位置。航跡3是一個MOT任務,提供了無人機的初始位置。(Single Object Tracking (SOT))

在這里插入圖片描述

報告了寬度、高度和面積分布,沿著它們的平均值和標準差,為模型超參數調整提供了重要的見解。請注意,與正式發布版本相比,數量可能略有不同,因為我們已刪除了冗余注釋和缺陷案例,如下圖1所示。

在這里插入圖片描述

后面介紹的主要是實驗訓練和驗證以及設置的一些參數條件。

在這里插入圖片描述

YOLOv12 with BoT-SORT-ReID for MOT

YOLOv 12因其卓越的上級性能而被選為所有軌道。

YOLOv 12的核心是采用剩余有效層聚合網絡(R-ELAN),該網絡解決了與注意力機制相關的優化挑戰,特別是在大規模模型中。基于ELAN ,R-ELAN引入了具有自適應縮放的塊級殘差設計以及精細的特征聚合策略,以最小的開銷共同促進有效的特征重用和穩定的梯度傳播。

這里自己沒看過YOLO12的論文不做詳細的解釋。

YOLOv12通過將FlashAttention與空間感知模塊相結合,集成了以注意力為中心的架構,從而在保持低延遲的同時增強了上下文建模。引入7×7大核可分離卷積拓寬了感受野并加強了目標定位,特別是對于中小型目標。該架構針對現代GPU內存層次結構進行了優化,在不影響檢測性能的情況下提高了計算效率并縮短了推理時間。這些創新使YOLOv12能夠平衡速度和準確性,使其非常適合實時應用,大規模檢測任務和跟蹤管道。

對BOT-SORT的簡單介紹

BoT-SORT 將卡爾曼濾波器與相機運動補償(CMC)相結合,以在動態條件下穩定跟蹤。CMC通過仿射變換采用全局運動補償(GMC),使用金字塔Lucas-Kanade光流和離群值拒絕跟蹤的圖像關鍵點。

BoT-SORT-ReID通過集成來自四種不同ReID架構的外觀線索來增強多對象跟蹤。Bag of Tricks(Bagtricks)基線采用ResNet-50骨干,具有批量歸一化,三重損失和交叉熵損失,用于魯棒的特征提取。注意力廣義平均池與加權三重損失(AGW)改進。

此外,在ByteTrack [45]之后,具有20幀間隙的線性tracklet插值減輕了遮擋或注釋錯誤的錯過檢測

在這里插入圖片描述

訓練策略和推理的流程

為了減少YOLOv12檢測器的訓練時間,我們采用了兩階段訓練策略。

  • 第一正常的訓練和表中的是一樣的
  • 隨后,從這個檢查點開始,我們在MOT數據集或更大的輸入圖像分辨率上微調這些模型。

推理工作流程如圖:

在這里插入圖片描述

帶BoT-SORT-SBS-S50的YOLOv 12 n工作流程圖。該工作流程遵循原始的BoT-SORT,但略有修訂:合并丟失的軌跡以補償無信息幀并提高對象連續性。具體地,對于磁道1和磁道2,丟失的目標信息被用于注釋潛在的對象位置,而磁道3保留BoT-SORT原始輸出。

沒有使用線性軌跡插值,因為由于攝像機運動或快速移動的無人機,ID切換頻繁發生,使得插值對于恢復丟失的檢測無效。相反,對于SOT任務,我們采用的策略基于以下假設:每個幀最多包含一架UAV,并遵循以下優先級順序:

(1)報告在線目標中具有最高置信度得分的UAV,(2)如果沒有在線目標可用,則繼續報告先前ID作為后續跟蹤器緩沖幀中的丟失目標,(3)如果沒有先前ID可用,則報告最后已知位置,直到檢測到新的在線目標。

由于在線和丟失目標之間頻繁的重疊和ID切換,這將導致效果不佳,因此該策略對于MOT任務是不可行的。因此,在本例中,我們保留了Track 3的原始輸出。

測試的相關指標和MOT17中的指標計算方式上是保持一致的。
在這里插入圖片描述

最后論文給出的這種應該是類似傳統的消融實驗的結果圖,感覺和其他的一些論文相比較之下缺少和其他一些比較知名算法的對比實驗。
在這里插入圖片描述

提供的預訓練模型如果是在MOT數據集上訓練的其實對于做傳統的MOT任務的要友好一些,但是代碼中給出的替代YOLOX檢測器的代碼結構還是值得作為后續漲點的一種方式。
https://github.
com/wish44165/YOLOv12-BoT-SORT-ReID

本文來自互聯網用戶投稿,該文觀點僅代表作者本人,不代表本站立場。本站僅提供信息存儲空間服務,不擁有所有權,不承擔相關法律責任。
如若轉載,請注明出處:http://www.pswp.cn/news/908762.shtml
繁體地址,請注明出處:http://hk.pswp.cn/news/908762.shtml
英文地址,請注明出處:http://en.pswp.cn/news/908762.shtml

如若內容造成侵權/違法違規/事實不符,請聯系多彩編程網進行投訴反饋email:809451989@qq.com,一經查實,立即刪除!

相關文章

MyBatis中foreach集合用法詳解

在 MyBatis 中&#xff0c;<foreach> 標簽用于遍歷集合&#xff08;Collection、List、Array、Map&#xff09;&#xff0c;常用于構建動態 SQL 語句&#xff08;如 IN 查詢、批量插入等&#xff09;。以下是詳細用法和示例&#xff1a; 核心屬性 屬性描述collection必填…

今日學習:ES8語法 | Spring整合ES | ES場景八股

文章目錄 ES81 ES架構2 ES適用場景3 ES使用3.1對比mysql3.2 索引(Index)3.3 類型(Type)3.4 文檔(Document)3.5 字段(Field)3.6 映射(Mapping) 4 ElasticSearch 基礎功能4.1 分詞器4.2 索引操作4.2.1 創建索引4.2.2 查看所有索引4.2.3 查看單個索引4.2.4 刪除索引 4.3 文檔操作4…

力扣刷題(第五十一天)

靈感來源 - 保持更新&#xff0c;努力學習 - python腳本學習 存在重復元素 II 解題思路 這個問題可以通過哈希表來高效解決。具體思路如下&#xff1a; 使用哈希表記錄元素最后一次出現的位置&#xff1a;遍歷數組&#xff0c;用一個哈希表存儲每個元素的最后一次出現的…

基于 Vue3 + Element Plus 實現的智能題目生成頁面設計思路

在本篇文章中&#xff0c;我將分享一個基于 Vue3 Element Plus 構建的「智能題目生成頁面」的實現思路與設計理念。該頁面作為在線學習平臺的一部分&#xff0c;核心功能是&#xff1a;用戶上傳學習資料&#xff0c;AI 自動為其生成定制化題目。以下將從頁面風格、功能模塊、交…

全面解析各類VPN技術:GRE、IPsec、L2TP、SSL與MPLS VPN對比

目錄 引言 VPN技術概述 GRE VPN 3.1 GRE封裝結構 3.2 GRE的應用場景 GRE over IPsec 4.1 GRE over IPsec封裝結構 4.2 為什么使用GRE over IPsec&#xff1f; IPsec VPN 5.1 IPsec傳輸模式&#xff08;Transport Mode&#xff09; 5.2 IPsec隧道模式&#xff08;Tunne…

《P1801 黑匣子》

題目描述 Black Box 是一種原始的數據庫。它可以儲存一個整數數組&#xff0c;還有一個特別的變量 i。最開始的時候 Black Box 是空的&#xff0e;而 i0。這個 Black Box 要處理一串命令。 命令只有兩種&#xff1a; ADD(x)&#xff1a;把 x 元素放進 Black Box; GET&#x…

Docker、Wsl 打包遷移環境

電腦需要開啟wsl2 可以使用wsl -v 查看當前的版本 wsl -v WSL 版本&#xff1a; 2.2.4.0 內核版本&#xff1a; 5.15.153.1-2 WSLg 版本&#xff1a; 1.0.61 MSRDC 版本&#xff1a; 1.2.5326 Direct3D 版本&#xff1a; 1.611.1-81528511 DXCore 版本&#xff1a; 10.0.2609…

【Nginx】使用 Nginx+Lua 實現基于 IP 的訪問頻率限制

使用 NginxLua 實現基于 IP 的訪問頻率限制 在高并發場景下&#xff0c;限制某個 IP 的訪問頻率是非常重要的&#xff0c;可以有效防止惡意攻擊或錯誤配置導致的服務宕機。以下是一個詳細的實現方案&#xff0c;使用 Nginx 和 Lua 腳本結合 Redis 來實現基于 IP 的訪問頻率限制…

華為OD機考-機房布局

import java.util.*;public class DemoTest5 {public static void main(String[] args) {Scanner in new Scanner(System.in);// 注意 hasNext 和 hasNextLine 的區別while (in.hasNextLine()) { // 注意 while 處理多個 caseSystem.out.println(solve(in.nextLine()));}}priv…

Server - 使用 Docker 配置 PyTorch 研發環境

歡迎關注我的CSDN&#xff1a;https://spike.blog.csdn.net/ 本文地址&#xff1a;https://spike.blog.csdn.net/article/details/148421901 免責聲明&#xff1a;本文來源于個人知識與公開資料&#xff0c;僅用于學術交流&#xff0c;歡迎討論&#xff0c;不支持轉載。 建議使…

HarmonyOS5.0——CodeGenie:鴻蒙生態的AI編程革命?

??CodeGenie&#xff1a;鴻蒙生態的AI編程革命?? 華為推出的 ??CodeGenie?? 是集成于 DevEco Studio 的 AI 輔助編程工具&#xff0c;專為 HarmonyOS 應用開發設計。它通過深度優化 ArkTS 和 C 語言的代碼生成能力&#xff0c;顯著提升開發效率&#xff0c;降低鴻蒙生…

大模型模型部署和暴露接口

創建環境 激活案件 安裝相關依賴 conda create -n fastApi python3.10 conda activate fastApi conda install -c conda-forge fastapi uvicorn transformers pytorch pip install safetensors sentencepiece protobuf 新建文件夾 mkdir App cd App touch main.py 復制代碼…

Redis初入門

Nosql&#xff1a;Not-Only SQL&#xff08;泛指非關系型數據庫&#xff09;&#xff0c;作為關系型數據庫的補充 作用&#xff1a;應對基于海量用戶和海量數據前提下的數據處理問題 redis&#xff1a;C語言開發的一個開源的高性能鍵值對數據庫 特征&#xff1a; 1、數據之…

【原神 × 二叉樹】角色天賦樹、任務分支和圣遺物強化路徑的算法秘密!

【原神 二叉樹】角色天賦樹、任務分支和圣遺物強化路徑的算法秘密! 作者:星之辰 標簽:#原神 #二叉樹 #天賦樹 #任務分支 #圣遺物強化 #算法科普 發布時間:2025年6月 總字數:6000+ 一、引子:提瓦特大陸的“樹型奧秘” 你是否曾留意過《原神》角色面板的天賦樹? 升級技能…

C++信息學競賽中常用函數的一般用法

在C 信息學競賽中&#xff0c;有許多常用函數能大幅提升編程效率。下面為你介紹一些常見函數及其一般用法&#xff1a; 一、比較函數 1、max()//求出a&#xff0c;b的較大值 int a10,b5,c;cmax(a,b);//得出的結果就是c等于10. 2、min()//求出a&#xff0c;b的較小值 int a1…

Linux【3】-----系統框架概述

系統架構 文件系統 linux一定需要掛載操作系統 一切皆文件 三個文件 引導文件 uboot.bin內核鏡像 zImage文件系統鏡像 system.img 設備樹文件&#xff08;屬于內核&#xff09; 應用程序編程 arm中通過軟中斷實現 各程序的構成 文件I/O 5種I/O模型 阻塞非阻塞信號多…

Tensorrt python api 10.11.0筆記

關于Tensorrt的python api文檔閱讀翻譯加總結 文檔源地址 Overview Getting started with TensorRT Installation(安裝) 安裝可參考:官方地址 Samples 關于樣例的內容可參考:樣例地址 Operator Documentation 有關更多信息&#xff08;包括示例&#xff09;&#xff0…

電鍍機的陽極是什么材質?

知識星球&#xff08;星球名&#xff1a;芯片制造與封測技術社區&#xff0c;點擊加入&#xff09;里的學員問&#xff1a;電鍍的陽極有什么講究&#xff1f;什么是可溶性陽極和非可溶性陽極&#xff1f; 什么是可溶性陽極與非可溶性陽極&#xff1f; 可溶性陽極 陽極本身就是…

前段三劍客之JavaScript-02

目錄 簡介 核心 函數 字符串對象 事件 運算符和控制語句 DOM 正則表達式 BOM JSON 簡介 JavaScript由JavaScript語法&#xff0c;DOM和BOM組成 JS中提供了一些輸入輸出語句&#xff1a; alert(); //瀏覽器彈出警示框 console.log(); //控制臺打印 prompt(); //瀏覽器…

Qiskit:量子計算模擬器

參考文獻&#xff1a; IBM Qiskit 官網Qiskit DocumentationQiskit Benchpress packageQiskit Algorithms package量子計算&#xff1a;基本概念常見的幾類矩陣&#xff08;正交矩陣、酉矩陣、正規矩陣等&#xff09;Qiskit 安裝指南-博客園使用Python實現量子電路模擬&#x…