文章目錄
- 錨框
- 目標檢測常用算法
- RCNN
- Fast RCNN
- Faster RCNN
- SSD 單發多框檢測
- YOLO
錨框
- 一類目標檢測算法:以圖像的每個像素為中心生成不同形狀的錨框,并賦予標號,每個錨框作為一個樣本進行訓練。
- 在預測時,使用NMS來去掉冗余的預測。
目標檢測常用算法
RCNN
-
對輸入圖像使用選擇性搜索來選取多個高質量的提議區域 (Uijlings et al., 2013)。這些提議區域通常是在多個尺度下選取的,并具有不同的形狀和大小。每個提議區域都將被標注類別和真實邊界框;
-
選擇一個預訓練的卷積神經網絡,并將其在輸出層之前截斷。將每個提議區域變形為網絡需要的輸入尺寸,并通過前向傳播輸出抽取的提議區域特征;
-
將每個提議區域的特征連同其標注的類別作為一個樣本。訓練多個支持向量機對目標分類,其中每個支持向量機用來判斷樣本是否屬于某一個類別;
-
將每個提議區域的特征連同其標注的邊界框作為一個樣本,訓練線性回歸模型來預測真實邊界框。
Fast RCNN
- 與R-CNN相比,Fast R-CNN用來提取特征的卷積神經網絡的輸入是整個圖像,而不是各個提議區域。此外,這個網絡通常會參與訓練。
- 假設選擇性搜索生成了n個提議區域。這些形狀各異的提議區域在卷積神經網絡的輸出上分別標出了形狀各異的興趣區域。然后,這些感興趣的區域需要進一步抽取出形狀相同的特征,以便于連結后輸出。為了實現這一目標,Fast R-CNN引入了興趣區域匯聚層(RoI pooling):將卷積神經網絡的輸出和提議區域作為輸入,輸出連結后的各個提議區域抽取的特征
- 將特征圖展平(reshape)為向量,通過一系列全連接層和 softmax得到預測結果。
Faster RCNN
- 將圖像輸入網絡得到相應的特征圖。
- 使用RPN網絡生成候選框,將RPN生成的候選框投影到特征圖上獲得ROI區域的特征矩陣。
- 將每個ROI區域的特征矩陣通過 ROI pooling 層縮放到7x7大小的特征圖,接著將特征圖展平為vector,之后通過一系列全連接層得到預測結果。
RCNN系列
https://www.xjx100.cn/news/384810.html?action=onClick
SSD 單發多框檢測
https://blog.csdn.net/weixin_44791964/article/details/104981486
https://blog.csdn.net/m0_56175815/article/details/130627738
YOLO
- SSD中錨框大量重疊,浪費計算。
- YOLO將圖片均勻分成SxS個錨框
- 每個錨框預測B個預測框