SiameseRPN詳解

SiameseRPN

  • 論文來源
  • 論文背景
    • 一,簡介
    • 二,研究動機
    • 三、相關工作
  • 論文理論
    • 注意:
    • 網絡結構:
    • 1.Siamese Network
    • 2.RPN
    • 3.LOSS計算
    • 4.Tracking
  • 論文的優缺點分析
    • 一、Siamese-RPN的貢獻/優點:
    • 二、Siamese-RPN的缺點:
  • 代碼流程
    • 一、訓練部分:
    • 二、跟蹤部分
  • 論文翻譯
    • 學術詞語知識
    • Abstract
    • 1. Introduction
    • 2. Related Works
    • 2.1. Trackers based on Siamese network structure
    • 2.2. RPN in detection
    • 2.3. One-shot learning
    • 3. Siamese-RPN framework
    • 3.1. Siamese feature extraction subnetwork
    • 3.2. Region proposal subnetwork
    • 3.3. Training phase: End-to-end train Siamese-RPN
    • 4. Tracking as one-shot detection
    • 4.1. Formulation
    • 4.2. Inference phase: Perform one-shot detection
    • 4.3. Proposal selection
    • 5. Experiments
    • 5.1. Implementation details
    • 5.2. Result on VOT2015
    • 5.3. Result on VOT2016
    • 5.4. Result on VOT2017 real-time experiment
    • 5.5. Result on OTB2015
    • 5.6. Discussion
    • 6. Conclusion

論文來源

論文鏈接:這里
本文參考:
論文閱讀:Siam-RPN
【SOT】Siamese RPN論文解讀和代碼解析
[深度學習] [目標跟蹤] Siamese-RPN論文閱讀筆記
【論文筆記】目標跟蹤算法之Siamese-RPN
論文閱讀,目標跟蹤 SiameseRPN

論文背景

一,簡介

這篇文章是在SiamFC的基礎上改進的,其特征提取網絡跟SiamFC一模一樣,不同的是引入了目標檢測領域的區域推薦網絡(RPN),通過RPN網絡的回歸避免多尺度測試,一方面提升了速度,另一方面可以得到更加準確的目標框。另一個強大的地方在于,該算法可以利用稀疏標注的數據進行訓練,如Youtube-BB,該數據集不是每一幀都有標注,而是隔幾十幀標注一幀,這樣極大地擴充了訓練數據,大家都知道跟蹤屆的數據是非常寶貴的。要訓練一個好的模型,數據量大是關鍵啊。

二,研究動機

作者將流行的跟蹤算法分為兩類,一類是基于相關濾波類并進行在線更新的跟蹤算法,另一類是使用深度特征拋棄在線更新的跟蹤算法,前者嚴重限制了跟蹤速度,后者沒有使用域特定信息(即某個特定的跟蹤視頻的信息)。

作者提出的網絡分為模板支和檢測支。訓練過程中,在相關特征圖上執行proposal extraction、沒有預定義好的類別信息;在跟蹤過程中使用one-shot檢測框架和meta-learning。其中,兩個原因使得跟蹤算法效果很好:大量數據訓練;RPN結構使得跟蹤尺度和比例都非常好。

三、相關工作

相關濾波類的跟蹤算法:GOTURN、Re3、Siamese-FC、CFNet。后兩個沒有做回歸去調整候選框位置,并且需要多尺度測試,破壞了模型的優雅性。

RPN網絡:RPN網絡廣泛應用在目標檢測任務中,從RCNN到Faster-RCNN,RPN網絡產生proposals代替了原始的selective search方法,提高了檢測速度,后來FPN改進了RPN網絡,提高了對微小物體的檢測能力,以及后來的PRN的改進版本的使用,像SSD、YOLO等都是非常高效的檢測器。

One-shot learning:貝葉斯方法和meta-learning方法。后者用新的神經網絡估計目標網絡前向傳播的梯度。(However, the performance of Learnet is not competitive the modern DCF based methods, e.g.CCOT in multiple benchmarks )

論文理論

注意:

特別注意:RPN首次是從Faster RCNN中引入過來的
如果對其中某些參數不明白,可以參考一文讀懂Faster RCNN

網絡結構:

  1. Siamese Network
  2. RPN
  3. LOSS計算
  4. Tracking

1.Siamese Network

在這里插入圖片描述
Siamese網絡用來提取特征。
該孿生網絡接受兩個輸入,一個叫做template frame(模板幀),是從視頻第一幀中人為框出來(可以理解為原圖中裁剪的一個區域)的物體位置;另一個輸入叫做detection frame(檢測幀),是被檢測的視頻段除了第一幀之外的其他幀。該Siamese(AlexNet)網絡將這兩個圖像分別映射為6x6x256大小的特征圖z 和22x22x256大小的特征圖 x。

2.RPN

在這里插入圖片描述
在這里插入圖片描述
1、在RPN子網絡中需要將z的輸出通過不同卷積核resize成4×4×2k×256和4×4×4k×256的尺寸,這里k表示k個anchor,anchor的概念在Faster R-CNN中介紹。本文使用一種尺度的anchor,用五種不同的比例,所以這篇文章中k為5;
2、其中2k中兩個通道分別表示這個anchor是正樣本和負樣本的概率,4k表示anchor和ground-truth之間的差別;

3.LOSS計算

SiameseRPN使用的損失函數與faster rcnn的損失函數一樣。在分類上使用了softmax,回歸bounding box使用了smooth L1損失。這里只簡單介紹回歸的損失。
首先來看看什么是smooth L1損失函數。
借用一下知乎尹博的圖
在這里插入圖片描述
從圖中可以看到,在遠離坐標原點處,圖像和L 1 L1L1 損失很接近,而在坐標原點附近,轉折十分平滑,不像L 1 L1L1損失那樣有個尖角,因此叫做smooth L 1 L1L1損失。
smoothL 1 L1L1損失函數的數學表達式為:
在這里插入圖片描述
在這里插入圖片描述
(偷偷說一下,代碼中的權重為5)

4.Tracking

1.One-shot跟蹤:
one-shot檢測:
該篇文章是第一次將one-shot策略用在跟蹤任務中,這篇文章是講如何實現one-shot learning的。最核心的思想方法就是通過離線訓練的方法得到一個了learner net(文章里簡稱為learnet),然后通過在線的方式動態生成一個pupil net的參數,而且learnet只需要一張樣本就可以生成pupil net的網絡參數。Pupil net可以為分類器或者其他任務。為了簡單起見,參數為動態生成的只有其中一層或者兩層,如圖所示,*代表有參數的層,紅色的代表參數由learnet動態生成的。
在這里插入圖片描述
在這里插入圖片描述
在這里插入圖片描述
在這里插入圖片描述
2.proposals選擇策略:
在這里插入圖片描述

論文的優缺點分析

一、Siamese-RPN的貢獻/優點:

  1. 提出siamese region proposal network(Siamese-RPN)用于解決目標跟蹤問題。該網絡可利用“圖片對”進行端到端地離線訓練;

  2. 該模型可將在線跟蹤任務轉換為one-shot檢測任務,而不是使用低效費時的多尺度測試(multi-scale test);

  3. 該模型將SiameseFC和Faster R-CNN巧妙結合起來,讓RPN的計算變成并行,大大降低了運行時間,在保證準確率的同時,達到了較高的速度。

二、Siamese-RPN的缺點:

  1. 使用第一幀作為模板匹配,對目標巨大變化不具有魯棒性;

  2. 與SiameseFC相比,這篇文章的方法需要對輸入圖片resize,丟失一些信息。

代碼流程

一、訓練部分:

9.在這里插入圖片描述
9.9日更新:新推兩篇文章在這方面講的也非常好!
RPN的功能實現(流程與理解)
RPN的深度理解(實現層面)

二、跟蹤部分

在這里插入圖片描述

論文翻譯

學術詞語知識

對于文章的一些學術詞語:
one-short Learning:
參考什么是One-shot Learning 、Zero-shot Learning?
meta-learning:
參考:什么是meta-learning?
affine transformation:
參考:仿射變換(Affine Transformation)
ground truth:
參考:機器學習里經常出現ground truth這個詞,能否準確解釋一下?
還有我找到了一個比較好的關于卷積公式的解釋:
在這里插入圖片描述

Abstract

在這里插入圖片描述

1. Introduction

在這里插入圖片描述

2. Related Works

在這里插入圖片描述

2.1. Trackers based on Siamese network structure

在這里插入圖片描述

2.2. RPN in detection

在這里插入圖片描述

2.3. One-shot learning

在這里插入圖片描述

3. Siamese-RPN framework

在這里插入圖片描述

3.1. Siamese feature extraction subnetwork

在這里插入圖片描述

3.2. Region proposal subnetwork

在這里插入圖片描述

3.3. Training phase: End-to-end train Siamese-RPN

在這里插入圖片描述

4. Tracking as one-shot detection

在這里插入圖片描述

4.1. Formulation

在這里插入圖片描述

4.2. Inference phase: Perform one-shot detection

在這里插入圖片描述

4.3. Proposal selection

在這里插入圖片描述

5. Experiments

在這里插入圖片描述

5.1. Implementation details

在這里插入圖片描述

5.2. Result on VOT2015

在這里插入圖片描述

5.3. Result on VOT2016

在這里插入圖片描述

5.4. Result on VOT2017 real-time experiment

在這里插入圖片描述

5.5. Result on OTB2015

在這里插入圖片描述

5.6. Discussion

在這里插入圖片描述

6. Conclusion

在這里插入圖片描述

本文來自互聯網用戶投稿,該文觀點僅代表作者本人,不代表本站立場。本站僅提供信息存儲空間服務,不擁有所有權,不承擔相關法律責任。
如若轉載,請注明出處:http://www.pswp.cn/news/389247.shtml
繁體地址,請注明出處:http://hk.pswp.cn/news/389247.shtml
英文地址,請注明出處:http://en.pswp.cn/news/389247.shtml

如若內容造成侵權/違法違規/事實不符,請聯系多彩編程網進行投訴反饋email:809451989@qq.com,一經查實,立即刪除!

相關文章

數據可視化 信息可視化_可視化數據操作數據可視化與紀錄片的共同點

數據可視化 信息可視化Data visualization is a great way to celebrate our favorite pieces of art as well as reveal connections and ideas that were previously invisible. More importantly, it’s a fun way to connect things we love — visualizing data and kicki…

python 圖表_使用Streamlit-Python將動畫圖表添加到儀表板

python 圖表介紹 (Introduction) I have been thinking of trying out Streamlit for a while. So last weekend, I spent some time tinkering with it. If you have never heard of this tool before, it provides a very friendly way to create custom interactive Data we…

Python--day26--復習

轉載于:https://www.cnblogs.com/xudj/p/9953293.html

sockets C#

Microsoft.Net Framework為應用程序訪問Internet提供了分層的、可擴展的以及受管轄的網絡服務,其名字空間System.Net和System.Net.Sockets包含豐富的類可以開發多種網絡應用程序。.Net類采用的分層結構允許應用程序在不同的控制級別上訪問網絡,開發人員可…

667. Beautiful Arrangement II

找規律 1&#xff0c;2&#xff0c;... , n 亂序排列&#xff0c;相鄰數據的絕對差最多有n-1種 比如1&#xff0c;2&#xff0c;3&#xff0c;4&#xff0c;5對應于 1 5 2 4 3 class Solution { public:vector<int> constructArray(int n, int k) {vector<int> re…

SiameseRPN++分析

SiamRPN論文來源論文背景什么是目標跟蹤什么是孿生網絡結構Siamese的局限解決的問題論文分析創新點一&#xff1a;空間感知策略創新點二&#xff1a;ResNet-50深層網絡創新點三&#xff1a;多層特征融合創新點四&#xff1a;深層互相關代碼分析整體代碼簡述&#xff08;1&#…

MySQL:Innodb page clean 線程 (二) :解析

一、數據結構和入口函數 1、數據結構 ● page_cleaner_t&#xff1a;整個Innodb只有一個&#xff0c;包含整個page clean線程相關信息。其中包含了一個page_cleaner_slot_t的指針。變量名含義mutex用于保護整個page_cleaner_t結構體和page_cleaner_slot_t結構體&#xff0c;當…

Lockdown Wheelie項目

“It’s Strava for wheelies,” my lockdown project, combining hyper-local exercise with data analytics to track and guide improvement. Practising wheelies is a great way to stay positive; after all, it’s looking up, moving forward.我的鎖定項目“將Strava運…

api地理編碼_通過地理編碼API使您的數據更有意義

api地理編碼Motivation動機 In my second semester of my Master’s degree, I was working on a dataset which had all the records of the road accident in Victoria, Australia (2013-19). I was very curious to know, which national highways are the most dangerous …

js進階 12-5 jquery中表單事件如何使用

js進階 12-5 jquery中表單事件如何使用 一、總結 一句話總結&#xff1a;表單事件如何使用&#xff1a;可元素添加事件監聽&#xff0c;然后監聽元素&#xff0c;和javase里面一樣。 1、表單獲取焦點和失去焦點事件有哪兩組&#xff1f; 注意是blur/focus和focus in/out&#x…

SiamBAN論文學習

SiameseBAN論文來源論文背景主要貢獻論文分析網絡框架創新點一&#xff1a;Box Adaptive Head創新點二&#xff1a;Ground-truth創新點三&#xff1a;Anchor Free論文流程訓練部分&#xff1a;跟蹤部分論文翻譯Abstract1. Introduction2. Related Works2.1. Siamese Network Ba…

簡單入門Javascript正則表達式

我們已經會熟練使用js字符串類型了&#xff0c;例如你想知道一個變量是否等于一個字符串&#xff0c;可能可能這樣判斷 if(ahello,world){... } 復制代碼但是往往我們有時候對一些字符串判斷顯得力不從心&#xff0c;例如判斷一個文件的類型是否為js類型&#xff0c;可能有下面…

實現klib_使用klib加速數據清理和預處理

實現klibTL;DRThe klib package provides a number of very easily applicable functions with sensible default values that can be used on virtually any DataFrame to assess data quality, gain insight, perform cleaning operations and visualizations which results …

MMDetection修改代碼無效

最近在打比賽&#xff0c;使用MMDetection框架&#xff0c;但是無論是Yolo修改類別還是更改head&#xff0c;代碼運行后發現運行的是修改之前的代碼。。。也就是說修改代碼無效。。。 問題解決辦法&#xff1a; MMDetection在首次運行后會把一部分運行核心放在anaconda的環境…

docker etcd

etcd是CoreOS團隊于2013年6月發起的開源項目&#xff0c;它的目標是構建一個高可用的分布式鍵值(key-value)數據庫&#xff0c;用于配置共享和服務發現 etcd內部采用raft協議作為一致性算法&#xff0c;etcd基于Go語言實現。 etcd作為服務發現系統&#xff0c;有以下的特點&…

SpringBoot簡要

2019獨角獸企業重金招聘Python工程師標準>>> 簡化Spring應用開發的一個框架&#xff1b;      整個Spring技術棧的一個大整合&#xff1b;      J2EE開發的一站式解決方案&#xff1b;      自動配置&#xff1a;針對很多Spring應用程序常見的應用功能&…

發送郵件 的類 C# .net

/// <summary> /// 發送郵件 /// </summary> /// <param name"SendTo">發送人的地址</param> /// <param name"MyEmail">我的Email地址</param> /// <param name"SendTit…

簡明易懂的c#入門指南_統計假設檢驗的簡明指南

簡明易懂的c#入門指南介紹 (Introduction) One of the main applications of frequentist statistics is the comparison of sample means and variances between one or more groups, known as statistical hypothesis testing. A statistic is a summarized/compressed proba…

計算機科學期刊_成為數據科學家的五種科學期刊

計算機科學期刊The field of data science is advancing at an incredible pace. New scientific articles are published daily. As a student, I try to stay up-to-date with the scientific literature that is published. In this blog post, I created a list of scienti…

Torch.distributed.elastic 關于 pytorch 不穩定

錯誤日志&#xff1a; Epoch: [229] Total time: 0:17:21 Test: [ 0/49] eta: 0:05:00 loss: 1.7994 (1.7994) acc1: 78.0822 (78.0822) acc5: 95.2055 (95.2055) time: 6.1368 data: 5.9411 max mem: 10624 WARNING:torch.distributed.elastic.agent.server.api:Rec…