3.Fast RCNN模型
相比于R-CNN,Fast RCNN模型主要在以下三個方面進行了改進:
- 提高訓練和預測速度
R-CNN首先從測試圖中提取2000個候選區域,然后將這2000個候選區域分別輸入到預訓練好的CNN中提取特征。由于候選區域有大量的重疊,這種提取特征的方法,就會重復的計算重疊區域的特征。在Fast-RCNN中,將整張圖輸入到CNN中提取特征,將候選區域映射到特征圖上,這樣就避免了對圖像區域進行重復處理,提高效率減少時間。 - 不需要額外的空間保存CNN網絡提取的特征向量
RCNN中需要將提取到的特征保存下來,用于為每個類訓練單獨的SVM分類器和邊框回歸器。在Fast-RCNN中,將類別判斷和邊框回歸統一使用CNN實現,不需要額外的空間存儲特征。 - 不再直接對候選區域進行縮放
RCNN中需要將候選區域進行縮放送入CNN中進行特征提取,在Fast-RCNN中使用ROIpooling的方法進行尺寸的調整。