目標檢測是一種基于目標幾何和統計特征的圖像分割,最新的進展一般是通過R-CNN(基于區域的卷積神經網絡)來實現的,其中最重要的方法之一是Faster R-CNN。
1.?總體結構
Faster R-CNN的基本結構如下圖所示,其基礎是深度全卷積網絡(ZF或者VGG-16)。在深度全卷積網絡輸出的特征圖(Feature Map)上,增加了區域提議網絡(RPN,Region Proposal Network),該網絡的主要任務是提出Proposals。根據提出的這些Proposals對特征圖進行裁剪,當然對不同區域裁剪以后的尺寸是不一致的,因此需要進行RoI池化(RoI Pooling),轉換成統一的尺寸,最終得到每個區域的分類。
?