SiamBAN論文學習

SiameseBAN

  • 論文來源
  • 論文背景
    • 主要貢獻
  • 論文分析
    • 網絡框架
    • 創新點一:Box Adaptive Head
    • 創新點二:Ground-truth
    • 創新點三:Anchor Free
  • 論文流程
    • 訓練部分:
    • 跟蹤部分
  • 論文翻譯
    • Abstract
    • 1. Introduction
    • 2. Related Works
    • 2.1. Siamese Network Based Visual Trackers
    • 2.2. Anchor-free Object Detectors
    • 3. SiamBAN Framework
    • 3.1. Siamese Network Backbone
    • 3.2. Box Adaptive Head
    • 3.3. Multi-level Prediction
    • 3.4. Ground-truth and Loss
    • 3.5. Training and Inference
    • 4. Experiments
    • 4.1. Implementation Details
    • 4.2. Comparison with State-of-the-art Trackers
    • 4.3. Ablation Study
    • 5. Conclusions

論文來源

論文來源:http://xxx.itp.ac.cn/pdf/2003.06761v2.pdf
開源項目:https://github.com/hqucv/siamban

參考文獻:
SiamBAN詳細分析,一看就懂!
[閱讀筆記][CVPR2020][SiamBAN] Siamese Box Adaptive Network for Visua

論文背景

SiamBAN是今年CVPR中效果最好的跟蹤器之一,研究它的原理更加能夠很好的幫助我們掌握目前跟蹤器發展的趨勢。
SIamBAN,按照意思分析是孿生自適應框。“孿生”,說明該跟蹤使用了Siamese網絡架構;而“自適應框”,則是該跟蹤器采用了anchor-free的策略,不預先設定anchor框的尺寸,使得框擁有更大強大的自由度。
通過分析論文和代碼,我認為SiamBAN就是一個優化版的SiamRPN++,最大的創新點在于anchor-free的引用,去掉了預定義的anchor,從而使得模型整體的參數下降,使得速度得到進一步的提升。
對于SiamBAN的原理分析,我準備采用三個方面:網絡框架、訓練、跟蹤。

主要貢獻

  1. 新的框架:SiamBAN,實現使用深度卷積神經網絡的end-to-end的離線訓練
  2. anchor-free的架構,no-prior box的設計避免了與候選框相關的超參數,使跟蹤器更加靈活和通用。
  3. 不僅達到了最先進的效果,并且在多個數據集達到40FPS(VOT2018,VOT2019,OTB100,NFS,UAV123,和 LaSOT)。

論文分析

網絡框架

與SIamRPN++相似,或者說網絡框架基本相同。不過不同點在于SiamBAN中引入了空洞卷積的原理,經過實驗證明,空洞卷積能夠增大感受野,提升跟蹤性能。
SIamBAN的網絡框架如下圖所示:
在這里插入圖片描述

創新點一:Box Adaptive Head

對于每一個分類圖P cls w×h×2或回歸圖P reg w×h×4上的每個位置,我們可以將其映射到輸入搜索patch。例如,與搜索片上的位置相對應的位置(i,j)為[?wim2?+(i-?w 2?)×s,他2?+(j?h 2?)× s](表示為(pi,pj)。wim和他代表輸入搜索補丁的寬度和高度,s代表網絡的總跨度),它是位置(i,j )。對于回歸,基于錨的跟蹤器[21、52、20]將位置(pi,pj)作為錨框的中心,然后回歸位置(pi,pj),寬度aw和高度ah。也就是說,對于位置(i,j),回歸可以調整其所有偏移值,但是分類仍然在原始位置執行,這可能導致分類和回歸中的不一致性。因此,我們不調整位置(pi,pj),僅計算其到邊界框的偏移值。另外,由于我們的回歸目標是正實數,因此我們在回歸模塊的最后一級應用exp(x)將任何實數映射到(0,+∞)。

大概的理解是anchor-base的方法中對于特征圖上的每一個位置(i,j),將其映射到搜索patch上為(pi,pj),回歸分支中將這個位置作為anchor的中心去預測偏移量,這時候回歸出來的結果已經改變了其中心位置,而分類分支依然在原始的中心位置進行,可能會導致分類和回歸的不一致。

創新點二:Ground-truth

在這里插入圖片描述
如果位置(pi,pj)落在橢圓E2內,則用正號標記,如果它落在橢圓E1以外,則為其分配負號,并且落在橢圓之間。 E2和E1,請忽略它。
在這里插入圖片描述

創新點三:Anchor Free

在這里插入圖片描述

論文流程

訓練部分:

  1. 將搜索補丁和模板補丁輸入對應的網絡分支,在第4、5個卷積模塊中添加空洞卷積,膨脹因子分別設置為2和4。
  2. 分別取出搜索分支和模板分支中第3、4、5卷積模塊的卷積結果。為了減少計算量,作者只選取了模板分支卷積結果的7 × 7 區域。因為當輸入補丁的尺寸為127 × 127,輸出的特征圖的尺寸為15 × 15,這時候選取[4:11]的區域,完全可以代表模板中選定的物體。
  3. 將相對應的卷積結果進行互相關操作。比如,搜索分支第3卷積模塊的卷積結果應該與模板分支第3卷積模塊的卷積結果進行互相關,其中模板分支的卷積結果作為卷積核。那么,最后獲得了三份互相關的特征圖。
  4. 將這三份互相關特征圖合并為一張。SiamBAN在代碼中使用的方法是取平均,即一個位置的三個值相加除以三。最后得到了一份互相關特征圖。
  5. 實際上,當運行到第4步的時候,就可以發現其實網絡運行就可以結束了。但是作者為了能夠減少計算量, 將互相關圖的維度減少到256.(neck)

跟蹤部分

  1. 輸入跟蹤視頻
  2. 劃定需要跟蹤的目標
  3. 跟蹤器初始化(第一幀的處理)
    1. 截取模板補丁(方法與SiamRPN相同)
    2. 將模板補丁輸入網絡,得到第3、4、5層的卷積結果,并且對卷積結果進行處理(降維和模板特征圖截取7x7區域)
  4. 進行跟蹤
    1. 截取搜索補丁(方法與SiamRPN相同)
    2. 將搜索補丁輸入網絡,得到第3、4、5層的卷積結果
    3. 與模板補丁的三個卷積結果進行相關卷積,并且將得到的三個互相關特征圖進行加權平均,得到分類特征圖和偏差坐標圖。
    4. 利用上述公式(回歸訓練中),將得到的偏差坐標圖轉換成多個預測框
    5. 施加平移懲罰和尺度懲罰,從多個預測框中獲得最佳跟蹤框,從而實現跟蹤。

論文翻譯

Abstract

在這里插入圖片描述

1. Introduction

在這里插入圖片描述

2. Related Works

在這里插入圖片描述

2.1. Siamese Network Based Visual Trackers

在這里插入圖片描述

2.2. Anchor-free Object Detectors

在這里插入圖片描述

3. SiamBAN Framework

在這里插入圖片描述

3.1. Siamese Network Backbone

在這里插入圖片描述

3.2. Box Adaptive Head

在這里插入圖片描述

3.3. Multi-level Prediction

在這里插入圖片描述

3.4. Ground-truth and Loss

在這里插入圖片描述

3.5. Training and Inference

在這里插入圖片描述

4. Experiments

4.1. Implementation Details

在這里插入圖片描述

4.2. Comparison with State-of-the-art Trackers

在這里插入圖片描述

4.3. Ablation Study

在這里插入圖片描述

5. Conclusions

在這里插入圖片描述

本文來自互聯網用戶投稿,該文觀點僅代表作者本人,不代表本站立場。本站僅提供信息存儲空間服務,不擁有所有權,不承擔相關法律責任。
如若轉載,請注明出處:http://www.pswp.cn/news/389236.shtml
繁體地址,請注明出處:http://hk.pswp.cn/news/389236.shtml
英文地址,請注明出處:http://en.pswp.cn/news/389236.shtml

如若內容造成侵權/違法違規/事實不符,請聯系多彩編程網進行投訴反饋email:809451989@qq.com,一經查實,立即刪除!

相關文章

簡單入門Javascript正則表達式

我們已經會熟練使用js字符串類型了,例如你想知道一個變量是否等于一個字符串,可能可能這樣判斷 if(ahello,world){... } 復制代碼但是往往我們有時候對一些字符串判斷顯得力不從心,例如判斷一個文件的類型是否為js類型,可能有下面…

實現klib_使用klib加速數據清理和預處理

實現klibTL;DRThe klib package provides a number of very easily applicable functions with sensible default values that can be used on virtually any DataFrame to assess data quality, gain insight, perform cleaning operations and visualizations which results …

MMDetection修改代碼無效

最近在打比賽,使用MMDetection框架,但是無論是Yolo修改類別還是更改head,代碼運行后發現運行的是修改之前的代碼。。。也就是說修改代碼無效。。。 問題解決辦法: MMDetection在首次運行后會把一部分運行核心放在anaconda的環境…

docker etcd

etcd是CoreOS團隊于2013年6月發起的開源項目,它的目標是構建一個高可用的分布式鍵值(key-value)數據庫,用于配置共享和服務發現 etcd內部采用raft協議作為一致性算法,etcd基于Go語言實現。 etcd作為服務發現系統,有以下的特點&…

SpringBoot簡要

2019獨角獸企業重金招聘Python工程師標準>>> 簡化Spring應用開發的一個框架;      整個Spring技術棧的一個大整合;      J2EE開發的一站式解決方案;      自動配置:針對很多Spring應用程序常見的應用功能&…

發送郵件 的類 C# .net

/// <summary> /// 發送郵件 /// </summary> /// <param name"SendTo">發送人的地址</param> /// <param name"MyEmail">我的Email地址</param> /// <param name"SendTit…

簡明易懂的c#入門指南_統計假設檢驗的簡明指南

簡明易懂的c#入門指南介紹 (Introduction) One of the main applications of frequentist statistics is the comparison of sample means and variances between one or more groups, known as statistical hypothesis testing. A statistic is a summarized/compressed proba…

計算機科學期刊_成為數據科學家的五種科學期刊

計算機科學期刊The field of data science is advancing at an incredible pace. New scientific articles are published daily. As a student, I try to stay up-to-date with the scientific literature that is published. In this blog post, I created a list of scienti…

Torch.distributed.elastic 關于 pytorch 不穩定

錯誤日志&#xff1a; Epoch: [229] Total time: 0:17:21 Test: [ 0/49] eta: 0:05:00 loss: 1.7994 (1.7994) acc1: 78.0822 (78.0822) acc5: 95.2055 (95.2055) time: 6.1368 data: 5.9411 max mem: 10624 WARNING:torch.distributed.elastic.agent.server.api:Rec…

0x22 迭代加深

poj2248 真是個新套路。還有套路剪枝...大到小和判重 #include<cstdio> #include<iostream> #include<cstring> #include<cstdlib> #include<algorithm> #include<cmath> #include<bitset> using namespace std;int n,D,x[110];bool…

云原生全球最大峰會之一KubeCon首登中國 Kubernetes將如何再演進?

雷鋒網消息&#xff0c;11月14日&#xff0c;由CNCF發起的云原生領域全球最大的峰會之一KubeConCloudNativeCon首次登陸中國&#xff0c;中國已經成為云原生領域一股強大力量&#xff0c;并且還在不斷成長。 毫無疑問&#xff0c;Kubernetes已經成為容器編排事實標準&#xff…

分布分析和分組分析_如何通過群組分析對用戶進行分組并獲得可行的見解

分布分析和分組分析數據分析 (DATA ANALYSIS) Being a regular at a restaurant is great.乙 eing定期在餐廳是偉大的。 When I started university, my dad told me I should find a restaurant I really liked and eat there every month with some friends. Becoming a reg…

python 工具箱_Python交易工具箱:通過指標子圖增強圖表

python 工具箱交易工具箱 (trading-toolbox) After a several months-long hiatus, I can finally resume posting to the Trading Toolbox Series. We started this series by learning how to plot indicators (specifically: moving averages) on the top of a price chart.…

PDA端的數據庫一般采用的是sqlce數據庫

PDA端的數據庫一般采用的是sqlce數據庫,這樣與PC端的sql2000中的數據同步就變成了一個問題,如在PDA端處理,PDA端的內存,CPU等都是一個制約因素,其次他們的一個連接穩定及其間的數據傳輸也是一個難點.本例中通過在PC端的轉化后再復制到PDA上面,這樣,上面所有的問題都得到了一個有…

bzoj 1016 [JSOI2008]最小生成樹計數——matrix tree(相同權值的邊為階段縮點)(碼力)...

題目&#xff1a;https://www.lydsy.com/JudgeOnline/problem.php?id1016 就是縮點&#xff0c;每次相同權值的邊構成的聯通塊求一下matrix tree。注意gauss里的編號應該是從1到...的連續的。 學習了一個TJ。用了vector。自己曾寫過一個只能過樣例的。都放上來吧。 路徑壓縮的…

區塊鏈的模型結構

關于區塊鏈的模型結構問題&#xff0c;行業內已經談論千萬遍了&#xff0c;基本上已經成為一種定義式的問題了。總體上來看&#xff0c;區塊鏈的基礎架構可以分為六層&#xff0c;包括數據層、網絡層、共識層、激勵層、合約層、應用層。每一層分別完成一項核心的功能&#xff0…

數據科學家 數據工程師_數據科學家應該對數據進行版本控制的4個理由

數據科學家 數據工程師While working in a software project it is very common and, in fact, a standard to start right away versioning code, and the benefits are already pretty obvious for the software community: it tracks every modification of the code in a p…

JDK 下載相關資料

所有版本JDK下載地址&#xff1a; http://www.oracle.com/technetwork/java/archive-139210.html 下載賬戶密碼&#xff1a; 2696671285qq.com Oracle123 轉載于:https://www.cnblogs.com/bg7c/p/9277729.html

商米

2019獨角獸企業重金招聘Python工程師標準>>> 今天看了一下商米的官網&#xff0c;發現他家的東西還真的是不錯。有錢了&#xff0c;想去體驗一下。 如果我妹妹還有開便利店的話&#xff0c;我會推薦他用這個。小巧便捷&#xff0c;非常方便。 轉載于:https://my.osc…

C#生成安裝文件后自動附加數據庫的思路跟算法

using System; using System.Collections.Generic; using System.Windows.Forms; using System.Data.SqlClient; using System.Data; using System.ServiceProcess; namespace AdminZJC.DataBaseControl { /// <summary> /// 數據庫操作控制類 /// </summary> …