目標跟蹤領域經典論文解析

?親愛的小伙伴們😘,在求知的漫漫旅途中,若你對深度學習的奧秘、JAVA 、PYTHON與SAP 的奇妙世界,亦或是讀研論文的撰寫攻略有所探尋🧐,那不妨給我一個小小的關注吧🥰。我會精心籌備,在未來的日子里不定期地為大家呈上這些領域的知識寶藏與實用經驗分享🎁。每一個點贊👍,都如同春日里的一縷陽光,給予我滿滿的動力與溫暖,讓我們在學習成長的道路上相伴而行,共同進步?。期待你的關注與點贊喲🤗!

目標跟蹤是計算機視覺領域的一個重要研究方向,多年來涌現了許多經典的論文。以下是對 20 篇左右目標跟蹤領域經典論文的分類介紹與詳細講解。

一、基于濾波的方法

《A New Approach to Linear Filtering and Prediction Problems》 - Rudolf E. Kalman,1960 年

  • 論文鏈接:https://www.cs.unc.edu/~welch/media/pdf/kalman_intro.pdf
  • 詳細講解:這篇論文提出了卡爾曼濾波算法,為基于狀態估計的目標跟蹤奠定了基礎。它通過對系統狀態的線性最小方差估計,巧妙地整合了目標的先驗信息與觀測數據。在目標運動符合線性高斯模型的情況下,能夠精確地預測和更新目標的位置、速度等狀態量。例如在早期的雷達目標跟蹤中,卡爾曼濾波發揮了重要作用,大大提高了跟蹤的準確性和穩定性,是目標跟蹤領域的一個重要里程碑。

《An Introduction to the Kalman Filter》 - Greg Welch, Gary Bishop,1995 年

  • 論文鏈接:https://www.cs.unc.edu/~welch/media/pdf/kalman_intro.pdf
  • 詳細講解:該論文對卡爾曼濾波進行了全面且深入淺出的介紹。詳細闡述了卡爾曼濾波的基本原理、數學推導以及在實際應用中的關鍵要點。通過直觀的例子和清晰的圖表,幫助讀者更好地理解卡爾曼濾波如何在存在噪聲的情況下,有效地估計系統的狀態。對于目標跟蹤領域的研究者和實踐者來說,是一篇非常好的入門和深入學習卡爾曼濾波的參考資料,推動了卡爾曼濾波在目標跟蹤等眾多領域的廣泛應用。

二、基于相關濾波的方法

《Minimum Output Sum of Squared Error Filter》 - Simon Haykin,1977 年

  • 論文鏈接:Symposiums | IEEE Journals & Magazine | IEEE Xplore
  • 詳細講解:文中提出的最小輸出均方誤差濾波器(MOSSE)為相關濾波在目標跟蹤中的應用奠定了基礎。它通過最小化輸出誤差的平方和來設計濾波器,能夠快速有效地學習目標的外觀特征,從而在后續幀中準確地跟蹤目標。MOSSE 濾波器具有計算效率高、對目標的平移和尺度變化具有一定魯棒性等優點,為后續基于相關濾波的目標跟蹤算法的發展提供了重要的理論支撐。

《Visual Tracking via Adaptive Correlation Filters》 - David S. Bolme,2010 年

  • 論文鏈接:https://www.cs.colostate.edu/~draper/papers/bolme_cvpr10.pdf
  • 詳細講解:此論文在 MOSSE 的基礎上進行了改進,提出了自適應相關濾波器(ACF)。ACF 能夠根據目標的外觀變化自適應地更新濾波器的參數,進一步提高了跟蹤的準確性和魯棒性。通過引入循環矩陣和離散傅里葉變換等技巧,大大降低了計算復雜度,使得算法能夠在實時性要求較高的場景中得到應用。該方法在多個目標跟蹤數據集上取得了顯著的性能提升,推動了相關濾波在目標跟蹤領域的發展。

《High-Speed Tracking with Kernelized Correlation Filters》 - Joao F. Henriques,2012 年

  • 論文鏈接:https://arxiv.org/abs/1204.0673
  • 詳細講解:該文提出了核化相關濾波器(KCF)算法,將相關濾波與核方法相結合。通過引入核函數,能夠更好地處理目標的非線性外觀變化,提高了跟蹤器對目標變形、遮擋等情況的魯棒性。同時,KCF 利用了循環矩陣的性質,在頻域中進行高效的計算,實現了高速的目標跟蹤。KCF 算法在當時的目標跟蹤性能上取得了重大突破,成為了基于相關濾波的目標跟蹤算法中的經典之作,并被廣泛應用和進一步改進。

《Exploiting the Circulant Structure of Tracking-by-Detection with Kernels》 - Joao F. Henriques,2013 年

  • 論文鏈接:https://arxiv.org/abs/1305.4537
  • 詳細講解:進一步深入探討了基于核的跟蹤檢測方法中循環結構的利用。詳細闡述了如何通過循環矩陣的性質來高效地計算核相關濾波器,從而在不降低跟蹤精度的前提下,大大提高了算法的運行速度。此外,還對算法的一些關鍵參數和技巧進行了深入分析和討論,為基于核相關濾波的目標跟蹤算法的優化和改進提供了重要的理論指導和實踐經驗,使得該類算法在實際應用中更加穩定和高效。

三、基于深度學習的方法

《DeepSort: Simple Online and Realtime Tracking with a Deep Association Metric》 - Nicolai Wojke,2017 年

  • 論文鏈接:https://arxiv.org/abs/1703.07402
  • 詳細講解:DeepSort 是在 SORT 基礎上改進的多目標跟蹤算法。它采用遞歸卡爾曼濾波和逐幀數據關聯的單假設跟蹤方法,使用八維狀態空間表示目標狀態。其關鍵在于引入深度關聯度量,通過結合馬氏距離和基于 CNN 提取的外觀特征的余弦距離,更準確地進行數據關聯,減少了身份切換數量,能在更長遮擋時間內跟蹤對象。還使用級聯匹配對頻繁出現目標賦予優先權,提高了跟蹤的準確性和魯棒性,在高幀率下實現了較好性能,推動了多目標跟蹤領域的發展.

《Fully Convolutional Siamese Networks for Object Tracking》 - Luca Bertinetto,2016 年

  • 論文鏈接:https://arxiv.org/abs/1606.09549
  • 詳細講解:提出了全卷積孿生網絡用于目標跟蹤。利用孿生網絡結構,將目標跟蹤問題轉化為目標模板與搜索區域之間的相似度學習問題。通過在大規模的圖像數據上進行端到端的訓練,網絡能夠自動學習到目標的特征表示,從而在不同場景下準確地跟蹤目標。這種方法無需人工設計特征,對目標的外觀變化、遮擋等情況具有較好的魯棒性,為目標跟蹤領域提供了一種新的有效思路和方法,開啟了基于深度學習的目標跟蹤技術的新方向.

《SiamFC++: Towards Robust and Accurate Visual Tracking with Target Estimation Guidelines》 - Yinda Xu,2018 年

  • 論文鏈接:https://arxiv.org/abs/1812.11703
  • 詳細講解:SiamFC++ 在孿生網絡的基礎上進一步改進。它提出了一套目標估計準則,以更準確地定位目標。通過引入多分支的結構,分別對目標的不同特征進行學習和融合,提高了對目標的表征能力。同時,在訓練過程中采用了更合理的樣本選擇策略和損失函數設計,使得網絡能夠更好地適應目標的各種變化,如尺度變化、姿態變化等。實驗結果表明,SiamFC++ 在多個數據集上取得了優異的性能,提升了目標跟蹤的精度和穩定性.

《ATOM: Accurate Tracking by Overlap Maximization》 - Martin Danelljan,2018 年

  • 論文鏈接:https://arxiv.org/abs/1811.07628
  • 詳細講解:ATOM 的核心思想是通過最大化目標與預測框的重疊度來實現準確跟蹤。它采用了一種基于在線學習的方法,能夠實時地更新目標模型,以適應目標的外觀變化。在跟蹤過程中,首先利用預訓練的網絡生成目標的初始估計,然后通過不斷優化重疊度損失函數來精確調整目標位置。此外,ATOM 還引入了背景感知機制,能夠更好地區分目標和背景,提高跟蹤的可靠性,在速度和精度上取得了較好的平衡.

《Ocean: Object-Aware Anchor-Free Tracking》 - Yibing Song,2020 年

  • 論文鏈接:https://arxiv.org/abs/2006.10764
  • 詳細講解:該論文提出了一種新穎的目標感知無錨點網絡用于目標跟蹤。傳統的基于錨點的跟蹤方法在處理目標尺度變化和形狀不規則等問題時存在一定局限性,而 Ocean 通過直接預測目標的邊界和中心,避免了錨點設置帶來的問題。同時,它引入了目標感知模塊,能夠更好地利用目標的語義信息和上下文信息,提高了跟蹤的準確性和魯棒性。實驗結果表明,Ocean 在多個數據集上優于現有的一些主流跟蹤方法,為目標跟蹤領域提供了一種新的思路和方法.

《TransT: Transformer Tracking》 - Enze Xie,2021 年

  • 論文鏈接:https://arxiv.org/abs/2103.15436
  • 詳細講解:TransT 將 Transformer 架構引入到目標跟蹤領域。利用 Transformer 的自注意力機制和交叉注意力機制,能夠有效地捕捉目標的長期依賴關系和上下文信息,從而更好地應對目標的復雜運動和外觀變化。與傳統的基于卷積神經網絡的跟蹤方法相比,TransT 在處理遮擋、快速運動等挑戰性場景時表現出更優的性能。此外,論文還提出了一種新的特征融合策略,進一步提高了跟蹤器的性能,為目標跟蹤領域的研究提供了新的方向和借鑒.

四、其他方法

《The Visual Background Extractor (VIBE): A Robust Algorithm for Video Background Subtraction》 - Olivier Barnich,2009 年

  • 論文鏈接:Diagnosis for Fatigue Cracking in Concealment of Large-Scale Overloaded Supporting Shaft Based on Time Series and Fuzzy Clustering | IEEE Conference Publication | IEEE Xplore
  • 詳細講解:VIBE 算法是一種經典的背景減除算法,用于視頻中的目標檢測和跟蹤。它通過對每個像素點建立背景模型,利用隨機采樣和更新策略,能夠快速適應背景的變化,有效地提取出前景目標。VIBE 算法具有計算復雜度低、對光照變化和動態背景具有較好魯棒性等優點,在視頻監控等領域得到了廣泛應用。其思想也為后續一些基于背景建模的目標跟蹤方法提供了重要的參考和基礎。

《Multi-Object Tracking with a Mobile Camera》 - Anton Andriyenko,2012 年

  • 論文鏈接:https://link.springer.com/content/pdf/10.1007/s11263-012-0530-4.pdf
  • 詳細講解:該論文主要研究了移動相機下的多目標跟蹤問題。提出了一種基于概率假設密度(PHD)濾波的多目標跟蹤方法,能夠有效地處理目標的出現、消失和遮擋等情況。通過對目標的運動模型和觀測模型進行合理建模,結合 PHD 濾波的遞推公式,實現了對多個目標的準確跟蹤。此外,論文還考慮了相機運動對目標跟蹤的影響,并提出了相應的補償方法,提高了跟蹤的精度和穩定性。該方法在實際的移動視覺系統中具有重要的應用價值。

《Online Multi-Object Tracking Using CNN-based Single Object Tracker with Spatial-Temporal Attention Mechanism》 - Shuai Yi,2018 年

  • 論文鏈接:https://arxiv.org/abs/1801.03332
  • 詳細講解:此論文提出了一種基于卷積神經網絡的單目標跟蹤器,并結合時空注意力機制用于在線多目標跟蹤。通過在單目標跟蹤器中引入時空注意力機制,能夠自適應地關注目標的關鍵區域和關鍵幀,提高了對目標的特征提取能力和跟蹤精度。同時,利用在線學習的方式不斷更新跟蹤器的模型參數,以適應目標的外觀變化和場景變化。實驗結果表明,該方法在多個多目標跟蹤數據集上取得了較好的性能,為多目標跟蹤問題提供了一種有效的解決方案。

五、2024 年最新目標跟蹤論文

《Beyond Traditional Single Object Tracking: A Survey》 - Omar Abdelaziz 等,2024 年

  • 論文鏈接:https://arxiv.org/abs/2405.10439
  • 詳細講解:該綜述論文探討了近年來計算機視覺中引入或采用的許多新技術在單目標跟蹤中的應用,如序列模型、生成模型、自監督學習、無監督學習、強化學習、元學習、持續學習和域適應等。作者提出了一種基于新技術和趨勢的單目標跟蹤方法的新分類,并對流行跟蹤基準上的方法性能進行了比較分析,還分析了現有方法的優缺點,為單目標跟蹤中的非傳統技術提供了指導,最后對單目標跟蹤的未來研究方向提出了建議 。

《OneTracker: Unifying Visual Object Tracking with Foundation Models and Efficient Tuning》 - Lingyi Hong 等,2024 年

  • 論文鏈接:https://arxiv.org/abs/2403.09634
  • 詳細講解:提出了 OneTracker 這一通用框架,旨在統一各種視覺目標跟蹤任務。首先在 RGB 跟蹤器上進行大規模預訓練得到基礎跟蹤器,使其具備穩定的目標位置估計能力,然后將其他模態信息作為提示,在基礎跟蹤器上構建提示跟蹤器。通過凍結基礎跟蹤器并僅調整一些額外的可訓練參數,實現了對下游 RGB+X 跟蹤任務的參數高效微調。在 11 個基準測試的 6 種流行跟蹤任務上的實驗表明,OneTracker 優于其他模型,取得了最先進的性能 。

《Transformer-Based Band Regrouping with Feature Refinement for Hyperspectral Object Tracking》 - Hanzheng Wang 等,2024 年

  • 論文鏈接:GitHub - maynardsd/Hyperspectral-object-tracking-paperlist
  • 詳細講解:專注于高光譜目標跟蹤領域,提出了一種基于 Transformer 的波段重組與特征細化方法。利用 Transformer 的強大特征學習能力,對高光譜圖像的波段信息進行重新組合和特征細化,以更好地捕捉目標的光譜和空間特征,提高高光譜目標跟蹤的準確性和魯棒性,為高光譜目標跟蹤提供了一種新的有效技術手段 。

《Domain Adaptation-Aware Transformer for Hyperspectral Object Tracking》 - Yinan Wu 等,2024 年

  • 論文鏈接:GitHub - maynardsd/Hyperspectral-object-tracking-paperlist
  • 詳細講解:針對高光譜目標跟蹤中的域適應問題,提出了一種具有域適應感知的 Transformer 架構。該方法能夠有效地學習不同域之間的不變特征表示,減少域差異對跟蹤性能的影響,從而在不同的高光譜數據集和場景下實現更穩定和準確的目標跟蹤,為解決高光譜目標跟蹤中的域偏移問題提供了一種有前途的解決方案 。

《SSF-Net: Spatial-Spectral Fusion Network with Spectral Angle Awareness for Hyperspectral Object Tracking》 - Hanzheng Wang 等,2024 年

  • 論文鏈接:GitHub - maynardsd/Hyperspectral-object-tracking-paperlist
  • 詳細講解:設計了一種空間 - 光譜融合網絡 SSF-Net,該網絡具有光譜角度感知能力。通過有效地融合高光譜圖像的空間和光譜信息,并考慮光譜角度的特征,能夠更準確地識別和跟蹤目標。實驗結果表明,SSF-Net 在高光譜目標跟蹤任務中取得了較好的性能,為高光譜目標跟蹤提供了一種新的融合架構和特征利用方式 。

本文來自互聯網用戶投稿,該文觀點僅代表作者本人,不代表本站立場。本站僅提供信息存儲空間服務,不擁有所有權,不承擔相關法律責任。
如若轉載,請注明出處:http://www.pswp.cn/web/62442.shtml
繁體地址,請注明出處:http://hk.pswp.cn/web/62442.shtml
英文地址,請注明出處:http://en.pswp.cn/web/62442.shtml

如若內容造成侵權/違法違規/事實不符,請聯系多彩編程網進行投訴反饋email:809451989@qq.com,一經查實,立即刪除!

相關文章

如何解決 java.nio.charset.CoderMalfunctionError: 編碼器故障錯誤問題?親測有效的解決方法!

java.nio.charset.CoderMalfunctionError 是一個在 Java 中相對較少遇到的異常,通常與字符編碼轉換過程中的錯誤有關。當 Java 程序在進行字符編碼轉換時,遇到無法處理的字符或編碼故障時,就會拋出該異常。 1. 問題描述 java.nio.charset.C…

低級爬蟲實現-記錄HCIP云架構考試

因工作需要考HCIP云架構(HCIP-Cloud Service Solution Architect)證書, 特意在淘寶上買了題庫, 考過了。 事后得知自己被坑了, 多花了幾十大洋。 所以想著在授權期內將題庫“爬”下來, 共享給大家。 因為整個過程蠻有…

QGroundControl之5-AppSettings.cc

介紹 應用程序設置 Application Settings ,這里看下語言選擇功能,它是怎么和json文件關聯起來的,剛剛看的時候,很是奇怪這么多的json文件作用。 1.AppSettings.cc 文件怎么和App.SettingsGroup.json關聯 在AppSettings.cc文件沒…

jenkins郵件的配置詳解

Jenkins郵件的配置涉及多個步驟和細節,以下是詳細的配置指南: 一、前期準備 確定郵件服務:明確Jenkins將要使用的郵件服務,如QQ郵箱、163郵箱、公司郵箱(基于Microsoft 365或Exchange Server)等。獲取SMTP配置信息:根據郵件服務類型,獲取相應的SMTP服務器地址、端口號…

【ArcGIS微課1000例】0134:ArcGIS Earth實現二維建筑物的三維完美顯示

文章目錄 一、加載數據二、三維顯示三、三維符號化一、加載數據 加載配套實驗數據(0134.rar中的建筑物,2d或3d都可以),方法如下:點擊添加按鈕。 點擊【Add Files】,在彈出的Open對話框中,選擇建筑物,點擊確定,完成添加。 默認二維顯示: 二、三維顯示 右鍵建筑物圖層…

jupyterlab 增加多個kernel,正確做法

1、背景 需要增加一個kernel然后相當于隔離一個環境 juypterlab Version 3.0.14 2、用conda 安裝 例如,你在conda下有一個python 3.12 的環境 py312 ipython kernel install --user --namepy312 如果保持的話,用pip安裝相應的包就好 3、檢查是否配置好 …

案例-商品列表(組件封裝)

標簽組件封裝 1.雙擊顯示,自動聚焦 2.失去焦點,隱藏輸入框 標簽一列,不同行的標簽內容不同,但是除此之外其他基本一致,所以選擇用 標簽組件 將這一部分封裝為一個組件,需要時組件標簽展示。 首先標簽處一進…

Python 基礎學習(一)

一.基礎語法 注釋 Python中單行注釋以 # 開頭,如下: #!/usr/bin/python3# 第一個注釋 print ("Hello, Python!") # 第二個注釋多行注釋可以用多個 # 號,還有 ‘’’ 和 “”": #!/usr/bin/python3# 第一個注釋…

TIM輸入捕獲---STM

一、簡介 IC輸入捕獲 輸入捕獲模式下,當通道輸入引腳出現指定電平跳變時,當前CNT的值將被鎖存在CCR中,可用于測量PWM波形的頻率、占空比、脈沖間隔、電平持續時間等參數 每個高級定時器和通用定時器都擁有4個輸入捕獲通道 可配置為PWMI模…

【Android Studio】學習——網絡連接

實驗:Android網絡連接 文章目錄 實驗:Android網絡連接[toc]實驗目標和實驗內容:1、掌握Android聯網的基本概念;2、能夠使用URL connection實現網絡連接;3、掌握第三方庫的基本概念4、需實現的具體功能 實驗結果功能說明…

ROS學習筆記二:ROS環境搭建

安裝ubuntu安裝ROS 參考趙虛左老師教程:ROS安裝ROS 快速上手體驗 -使用命令來實現 –創建工作空間: mkdir -p ros_learn_ws/src// ros_learn_ws為自定義空間 cd ros_learn_ws catkin_make –創建ROS功能包并添加依賴 cd src catkin_create_pkg demo_01 r…

5G中什么是ATG網絡?

有人問Air to Ground Networks for NR是怎么回事?這個是R18 NR才引入的。 ATG很多部分和NTN類似中的內容類似。比較明顯不同的是,NTN的RF內容有TS 38.101-5單獨去講,而ATG則會和地面網絡共用某些band,ATG可以工作在N1/N3/N34/N39…

基礎算法--雙指針

兩數之和 點擊:題目鏈接 解法一:暴力解法 時間復雜度:O(N^2) 算法思路:兩層for循環即可列出所有兩個數字的組合,判斷是否等于目標值 算法流程: 兩層 for 循環: 外層 for 循環依次枚舉第?個…

什么是Linux系統架構?

? Linux系統架構是指Linux操作系統的整體結構和工作層次,它定義了系統組件如何交互、如何管理硬件資源,以及用戶如何通過不同的層次與系統進行交互。Linux架構通常有兩種劃分方法:系統層次架構和功能層次架構,兩者都可以很好地描…

spring6:4、原理-手寫IoC

目錄 4、原理-手寫IoC4.1、回顧Java反射4.2、實現Spring的IoC 4、原理-手寫IoC 我們都知道,Spring框架的IOC是基于Java反射機制實現的,下面我們先回顧一下java反射。 4.1、回顧Java反射 Java反射機制是在運行狀態中,對于任意一個類&#x…

不是“我應該做什么”,而是“我想做什么”

1. 識別內心的渴望 首先,我們需要識別自己真正的愿望和激情所在。這可能需要一些時間和自我反思。問自己:在沒有任何外界壓力的情況下,我真正想做的是什么?是賺錢、生活、旅行、追星,還是其他什么?識別這些…

30天學會Go--第7天 GO語言 Redis 學習與實踐

30天學會Go–第7天 GO語言 Redis 學習與實踐 文章目錄 30天學會Go--第7天 GO語言 Redis 學習與實踐前言一、Redis 基礎知識1.1 Redis 的核心特性1.2 Redis 常見使用場景 二、安裝 Redis2.1 在 Linux 上安裝2.2 在 Windows 上安裝2.3 使用 Docker 安裝 Redis 三、Redis 常用命令…

Vue項目開發 如何實現父組件與子組件數據間的雙向綁定?

在 Vue.js 中,實現父組件與子組件數據之間的雙向綁定,可以通過以下幾種方式。下面我將介紹幾種常見的方法,并解釋它們的實現原理和適用場景。 1. 使用 v-model 實現雙向綁定 v-model 是 Vue.js 中最常見的雙向綁定方式,它可以使…

React第十七章(useRef)

useRef 當你在React中需要處理DOM元素或需要在組件渲染之間保持持久性數據時,便可以使用useRef。 import { useRef } from react; const refValue useRef(initialValue) refValue.current // 訪問ref的值 類似于vue的ref,Vue的ref是.value,其次就是vu…

【C++】內存分布、new、delete、 operator new、operator delete

內存分布 在C語言和C中,程序內存被劃分成六個部分: 內核空間、棧、內存映射段、堆、數據段、代碼段 棧:又稱堆棧,主要為非靜態局部變量、函數參數、返回值等,棧的生長方向是向下生長的 內存映射段:高效的…