Faster R-CNN是作者Ross Girshick繼Fast R-CNN后的又一力作。同樣使用VGG16作推理速度在GPU上達到5fps(包括候選區域的生成),準確率為網絡的backbone,也有進一步的提升。在2015年的ILSVRC以及COCO競賽中獲得多個項目的第一名。
算法流程
?右邊這部分和Fast-RCNN是一樣的
最后傳到目標分類器和邊界框回歸器
????????對于一張1000x600x3的圖像,大約有60x40x9(20k)個anchor,忽略跨越邊界的anchor以后,剩下約6k個anchor。對于RPN生成的候選框之間存在大量重疊,基于候選框的cls得分,采用非極大值抑制,IoU設為0.7,這樣每張圖片只剩2k個候選框。
? ? ? ? (anchor和proposal不是同一個東西,我們是利用RPN生成的邊界框回歸參數將anchor調整到候選框的。)