Ocean: Object-aware Anchor-free Tracking

領域Object tracking
It aims to infer the location of an arbitrary target in a video sequence, given only its location in the first frame

問題/現象

  1. Anchor-based Siamese trackers have achieved remarkable advancements in accuracy, yet the further improvement is restricted by the lagged tracking robustness.
    Anchor-based Siamese trackers精確度還行但魯棒性不行

  2. In prior Siamese tracking approaches, the classification confidence is estimated by the feature sampled from a fixed regular region in the feature map. This sampled feature depicts a fixed local region of the image, and it is not scalable to the change of object scale. As a result, the classification confidence is not reliable in distinguishing the target object from complex background.
    分類置信度是通過從固定的局部區域得到的特征估計出來的,所以當物體尺度變化的時候它并不會改變。所以當要從復雜的背景區分目標物體時,這個分類器是不可靠的。

  3. regression network in anchor-based methods is only trained on the positive anchor boxes. This mechanism makes it difficult to refine the anchors whose overlap with the target objects are small.

    This will cause tracking failures especially when the classification results are not reliable. The regression network is incapable of rectifying this weak prediction because it is previously unseen in the training set.

    原因是因為anchor-based methods的回歸網絡僅在正樣本(當框和目標物體的重合超過一個標準時,稱這個框為正樣本)上訓練(訓練集中只有分類正確的時候,offset是什么。沒有分類錯誤的樣本)。這使得它很難去refine anchorsanchor和目標物體的重疊很少時(因為這個時候的框為負樣本,previously unseen in the training set.,先前/訓練時沒見過這樣的)。也就是當前面分類錯誤的時候,后面的回歸網絡也沒有修正這個不準確的預測的能力

can we design a bounding-box regressor with the capability of rectifying inaccurate predictions?

YES!
在這里插入圖片描述

這篇文章提出的跟蹤器哈哈:Object-aware Anchor-Free Networks(Ocean)
(對應上述問題123)

  1. consists of two components: an object-aware classification network and a bounding-box regression network.(anchor free的)

  2. The classification is in charge of determining whether a region belongs to foreground or background
    分類器分出前景和背景(分類只采樣距離中心近的點為正樣本)(同時使用了object-aware featureregular-region feature。與之前anchor free方法,如FCOS不同的是增加了一個object-aware feature,且FCOS分類和回歸都是計算所有落在GT內的點;)
    introduce a feature alignment module to learn an object-aware feature from predicted bounding boxes. The object-aware feature can further contribute to the classification of target objects and background.
    同時引進一個特征對齊的模塊來學習 object-aware feature,使得更好的實現背景和目標物體之間的區分,也獲得了一個全局的外觀描述。
    實現:將卷積核的固定采樣位置對齊到預測的回歸box(圖2c)。回歸box是通過bounding-box regression network得來的哦。對于classification map上的每個位置(dx, dy),都有一個對應的回歸預測框M=(mx, my, mw, mh)mx, my表示中心,mw, mh表示寬高。目標就是從候選框M中采樣特征來預測(dx, dy)的分類得分。

  3. regression aims to predict the distances from each pixel within the target objects to the four sides of the groundtruth bounding boxes.
    回歸用來預測目標物體中的每個像素點到真實錨框的四條邊的距離。(訓練時候的樣本是all the pixels in the groundtruth bounding box)

Since each pixel in the groundtruth box is well trained, the regression network is able to localize the target object even when only a small region is identified as the foreground.
就算只有很小一塊區域被分類為前景,由于each pixel in the groundtruth box is well trained,所以該回歸有修正前面不太正確的預測的可能性

(這樣理解:anchor-based一個框是一個樣本,這里一個像素是一個樣本。前面的訓練集是正確的框怎么偏移到groundtruth,后面的是每個像素到框的距離。那么當框和目標物體重疊很小但被預測為正確的框的時候。對于anchor-based,因為實際上它是負樣本,所以沒見過,沒訓練過。但對于anchor free的,即使預測為前景實際也為前景的部分很小,那也還是有實際為前景且被正確預測為前進的像素點存在的,訓練的時候見過,所以有糾正預測的可能)

在這里插入圖片描述

  • 回歸的時候所有位于groundtruth box內的像素都被標注為正樣本
  • 對于Regular-region classification,靠近目標中心點的一小部分區域內的像素為正樣本
  • 對于Object-aware classificationthe IoU of predicted box and groundtruth box被用作標簽。

more details are provided in this paper:Ocean: Object-aware Anchor-free Tracking

補充(超簡版):

  • anchor-based methodsVSanchor free methods
    • anchor-based :
      • 相比于anchor free,它使用預定義的anchor框來匹配真實的目標框
      • 過程:生成 anchor boxes,判斷每個 anchor box foreground還是background(二分類),對anchor box進行微調(這部分就是前文提到的refine),使得 positive anchor 和真實框(Ground Truth Box)更加接近(使用regression
    • anchor free:
      • Different from anchor-based methods which estimate the offsets of anchor boxes, anchor-free mechanisms predict the location of objects in a direct way.
      • 基于角點的/中心點的/全卷積的
  • 目標跟蹤VS目標檢測
    • 目標檢測是事先針對特定目標的,比如人頭檢測、動物檢測,目標跟蹤則是對于任意目標的跟蹤,即事先是不知道跟蹤的具體目標的。(但是檢測器也可以根據人們需要檢測的目標進行初始化,這樣好像又有點像跟蹤器了->基于檢測的目標跟蹤。而且感覺基于檢測的的目標跟蹤有點 殺雞用牛刀 了吧,因為根本不需進行目標識別,不需要每一幀都去檢測,就只是目標跟蹤就好了)
    • 理想的跟蹤器應該不需要每一幀都暴力檢測目標所在的位置,而是可以充分利用幀間信息,目標周圍的環境信息,甚至根據周邊環境推測得到的三維信息等,更加高效的確定目標所在的位置
    • 再想象一個場景:一個被設計用來檢測行人的目標檢測器,如果將其應用到馬路場景上,檢測器將會檢測到馬路上的大量行人。如果只想跟蹤某個行人,那么檢測器的結果并不是人們想要的。但這時跟蹤器就完全不一樣了,給跟蹤器指定初始跟蹤行人后,它將可以在后續的過程中只跟蹤指定的行人

本文來自互聯網用戶投稿,該文觀點僅代表作者本人,不代表本站立場。本站僅提供信息存儲空間服務,不擁有所有權,不承擔相關法律責任。
如若轉載,請注明出處:http://www.pswp.cn/pingmian/81301.shtml
繁體地址,請注明出處:http://hk.pswp.cn/pingmian/81301.shtml
英文地址,請注明出處:http://en.pswp.cn/pingmian/81301.shtml

如若內容造成侵權/違法違規/事實不符,請聯系多彩編程網進行投訴反饋email:809451989@qq.com,一經查實,立即刪除!

相關文章

[Java] 方法和數組

目錄 1. 方法 1.2 什么是方法 1.2 方法的定義 1.3 方法的調用 1.4 方法的重載 1.5 遞歸 2. 一維數組 2.1 什么是數組 2.2 數組的創建 2.3 數組的初始化 2.4 遍歷數組 2.5 引用數據類型 2.6 關于null 2.7 數組轉字符串 2.8 數組元素的查找 2.9 數組的排序 2.10…

全局異常處理:如何優雅地統一管理業務異常

在軟件開發中,異常處理是保證系統健壯性的重要環節。一個良好的異常處理機制不僅能提高代碼的可維護性,還能為使用者提供清晰的錯誤反饋。本文將介紹如何通過全局異常處理和業務異常統一處理來編寫更加優雅的代碼。 一、傳統異常處理的痛點 1.1 典型問…

PHP 編程:現代 Web 開發的基石與演進

引言 PHP(Hypertext Preprocessor)自1995年誕生以來,已成為全球最流行的服務器端腳本語言之一。盡管近年來Node.js、Python等語言在特定領域嶄露頭角,但PHP仍占據著超過78%的網站市場份額(W3Techs數據)。本…

MCU程序加密保護(一)閃存讀寫保護法 加密與解密

MCU(微控制器單元)的加密方法可以從硬件、軟件和通信協議三個層面來理解。以下是常見的MCU加密手段,按類型分類說明: 針對目前 STM32 系列微控制器在程序加密保護方面手段單一、保護效果有限的問題,本文介紹并分析了四…

汽車裝配又又又升級,ethernetip轉profinet進階躍遷指南

1. 場景描述:汽車裝配線中,使用EtherNet/IP協議的機器人與使用PROFINET協議的PLC進行數據交互。 2. 連接設備:EtherNet/IP機器人控制器(如ABB、FANUC)與PROFINET PLC(如西門子S7-1500)。 3. 連…

RFID系統:技術解析與應用全景

一、技術架構與運行邏輯 RFID(Radio Frequency Identification)系統通過無線電波實現非接觸式數據交互,其核心由三部分組成: 電子標簽(Tag): 無源標簽:依賴讀寫器電磁場供電&…

25、DeepSeek-R1論文筆記

DeepSeek-R1論文筆記 1、研究背景與核心目標2、核心模型與技術路線3、蒸餾技術與小模型優化4、訓練過程簡介5、COT思維鏈(Chain of Thought)6、強化學習算法(GRPO)7、冷啟動**1. 冷啟動的目的****2. 冷啟動的實現步驟****3. 冷啟動…

開源項目實戰學習之YOLO11:12.2 ultralytics-models-sam-decoders.py源碼分析

?? 點擊關注不迷路 ?? 點擊關注不迷路 ?? 另外,前些天發現了一個巨牛的AI人工智能學習網站,通俗易懂,風趣幽默,忍不住分享一下給大家。感興趣的可以點擊相關跳轉鏈接。 點擊跳轉到網站。 ultralytics-models-sam 1.sam-modules-decoders.pyblocks.py: 定義模型中的各…

Raft 協議:分布式一致性算法的核心思想

引言 在分布式系統中,數據一致性是核心挑戰。Raft 協議作為一種易于理解的一致性算法,被廣泛應用于 etcd、Consul 等系統中。 一、Raft 核心概念 1.1 角色與任期(Term) ? 領導者(Leader):處…

基于DWT的音頻水印算法

基于離散小波變換(DWT)的音頻水印算法是一種結合信號處理與信息隱藏的技術,旨在將版權信息或標識隱蔽地嵌入音頻信號中,同時保證不可感知性和魯棒性。以下是該算法的核心步驟及關鍵技術點: ?1. 算法基本原理? ?DWT…

低空經濟發展現狀與前景

低空經濟發展現狀與前景 一、低空經濟的定義與范疇 低空經濟是以民用有人駕駛和無人駕駛航空器為主體,以載人、載貨及其他作業等多場景低空飛行活動為牽引,輻射帶動商業活動或公共服務領域融合發展的一種綜合性新經濟形態。其涵蓋的低空空域通常為距離…

售前工作.工作流程和工具

第一部分 售前解決方案及技術建議書的制作 售前解決方案編寫的標準操作步驟SOP: 售前解決方案寫作方法_嗶哩嗶哩_bilibili 第二部分 投標過程關鍵活動--商務標技術方案 1. 按項目管理--售前銷售項目立項 銷售活動和銷售線索的跟蹤流程和工具 1)拿到標書&#xff…

DeerFlow試用

github拉取代碼 配置.env和conf.yaml 注意設置大模型的url和模型名稱、api_key 先啟動根目錄下的server,端口如果有沖突直接在default變量賦值時修改; 再啟動前端,先build再run dev; 根據前端完成時的地址訪問界面&#xff1…

python + streamlink 下載 vimeo 短視頻

1. 起因, 目的: 看到一個視頻,很喜歡,想下載。https://player.vimeo.com/video/937787642 2. 先看效果 能下載。 3. 過程: 因為我自己沒頭緒。先看一下別人的例子, 問一下 ai 或是 google問了幾個來回,原來是流式…

JavaScript【6】事件

1.概述: 在 JavaScript 中,事件(Event)是瀏覽器或 DOM(文檔對象模型)與 JavaScript 代碼之間交互的一種機制。它代表了在瀏覽器環境中發生的特定行為或者動作,比如用戶點擊鼠標、敲擊鍵盤、頁面…

【Java ee初階】HTTP(2)

一、HTTP的方法 方法 說明 支持的HTTP協議版本 GET 獲取資源 1.0、1.1 POST 傳輸實體主體 1.0、1.1 PUT 傳輸文件 1.0、1.1 HEAD 獲得報文首部 1.0、1.1 DELETE 刪除文件 1.0、1.1 OPTIONS 詢問支持的方法 1.1 TRACE 追蹤路徑 1.1 CONNECT 要求用隧道…

文件名是 ?E:\20250512_191204.mp4, EV軟件錄屏,未保存直接關機損壞, 如何修復?

去github上下載untrunc 工具就能修復 https://github.com/anthwlock/untrunc/releases 如果訪問不了 本機的 hosts文件設置 140.82.112.3 github.com 199.232.69.194 github.global.ssl.fastly.net 就能訪問了 實在不行,從這里下載,傳上去了 https://do…

騰訊 CodeBuddy 殺入 AI 編程賽道,能否撼動海外工具霸主地位?

在 AI 編程助手領域,海外的 Cursor 等工具風頭正勁,如今騰訊帶著 CodeBuddy 隆重登場,國產 AI 編程助手能否借其之力崛起?讓我們一探究竟。 官網: 騰訊云代碼助手 CodeBuddy - AI 時代的智能編程伙伴 實戰安裝教程 …

PySide6 GUI 學習筆記——常用類及控件使用方法(常用類顏色常量QColorConstants)

文章目錄 一、概述二、顏色常量表標準 Qt 顏色SVG 顏色(部分) 三、Python 代碼示例四、代碼說明五、版本兼容性六、延伸閱讀 一、概述 QColorConstants 是 Qt for Python 提供的一個預定義顏色常量集合,包含標準Qt顏色和SVG規范顏色。這些常…

MATLAB 自然語言處理入門教程

文章目錄 前言環境配置一、MATLAB NLP 工具箱概述二、核心功能與 API1. 文本數據準備2. 特征提取3. 文本分類(傳統機器學習)4. 深度學習文本分類(LSTM) 三、實戰案例:情感分析四、高級應用1. 命名實體識別(…