主要參考文章:1,從編程實現角度學習Faster R-CNN(附極簡實現)
經常是做到一半發現收斂情況不理想,然后又回去看看這篇文章的細節。
另外兩篇:
2,Faster R-CNN學習總結? ? ? 這個主要是解釋了18, 36是怎么算的
3,目標檢測中region proposal的作用?
主要研究了兩個版本的 pytorch 代碼,第一篇文章作者的實現,以及其提及的最簡實現
兩個實現我都深入看了并且修改了。
Faster R-CNN是兩階段檢測:rpn + fast rcnn。rpn最前面是個feature_extractor,可以自己選擇用哪一個。
rpn在voc2007訓練集的2501個樣本上跑了40個epoch,cls loss到大概0.10,reg loss到0.05的樣子,
和陳云那個誤差圖在四五十epoch的時候誤差基本上是一樣的,我就當它收斂了。
反正就是要提取圖片的特征,最后我用了squeezeNet 1.0,也還是能收斂的。
?
2018年3月12日11:04:28
兩個用于學習Faster R-CNN的例子:
https://github.com/necroen/examples