探索目標檢測：邊界框與錨框的奧秘

筆者在2022年開始學習目標檢測的時候，對各種框的概念那是相當混淆，比如：

中文名詞：邊界框、錨框、真實框、預測框等
英文名詞：BoundingBox、AnchorBox、Ground Truth等

同一個英文名詞比如BoundingBox翻譯成中文也有多個叫法。下面注重區分這些概念。

目標檢測需要識別圖片中多個物體的位置與類別。

為了方便模型訓練，我們人為地將圖片中物體的位置與種類標注出來，這就是真實邊界框Ground Truth。

邊界框Bounding Box則更多的是一種泛指，它可以指代各個類型的框。

標注文件中每行表示一個物體，一般是：圖片文件名、物體類別、邊緣框。

請添加圖片描述

模型對其「預測框」進行微調，使其接近Ground Truth Bounding Box。
如下圖對紅色的BBox回歸，使其接近綠色的GT Box。

請添加圖片描述

錨框Anchor是算法自動生成出的，GT BBox是人為的標注框。

目前定位精準的目標檢測算法還是基于錨框的，即Anchor-based。

1）要么設定好錨框的尺寸：

  anchors:- [10,13, 16,30, 33,23]  # P3/8- [30,61, 62,45, 59,119]  # P4/16- [116,90, 156,198, 373,326]  # P5/32

2）要么通過k-means自動生成錨框，比如yolov5默認通過k-means自動生成錨框尺寸

3）作為超參數學習。我還沒見過，估計這會產生額外的計算量

主流的目標檢測算法大多基于錨框Anchor Box，每一個錨框都是一個訓練樣本。

對于每個錨框，要么標注成背景（負樣本），要么關聯上一個真實邊界框（正樣本）。

一張圖片可能會產生上萬個錨框，其中絕大多數都是背景，即大量的負樣本，與之相比，正樣本可能只有幾十個。

請添加圖片描述

圖. 錨框的標注

與BBox關聯的錨框作為正樣本，其他的作為背景就是負樣本。

PS：Anchor的概念最早出現在Faster RCNN提出的RPN網絡，RPN網絡的Anchor啟發了后面的SSD和Yolov2算法。

召回：將所有“可能的正確結果”返回給排序

排序：會將所有召回的結果進行排序，將最靠前的結果作為最終答案

如果這篇文章對您有些許幫助，請幫忙點個贊👍或收個藏📃。您的支持是我繼續創作的動力💪！

不要害怕，不要著急。保持每日的前進??與積極的內心??，命運總在曲折中饋贈最好的禮物。

本文來自互聯網用戶投稿，該文觀點僅代表作者本人，不代表本站立場。本站僅提供信息存儲空間服務，不擁有所有權，不承擔相關法律責任。
如若轉載，請注明出處：http://www.pswp.cn/news/903567.shtml
繁體地址，請注明出處：http://hk.pswp.cn/news/903567.shtml
英文地址，請注明出處：http://en.pswp.cn/news/903567.shtml

如若內容造成侵權/違法違規/事實不符，請聯系多彩編程網進行投訴反饋email:809451989@qq.com，一經查實，立即刪除！