faster rcnn在自己的數據集上訓練

本文是一個總結，參考了網上的眾多資料，匯集而成，以供自己后續參考。

一般說來，訓練自己的數據，有兩種方法：第一種就是將自己的數據集完全改造成VOC2007的形式，然后放到py-faster-rcnn/data 目錄下，然后相應地改變相應模型的參數，比如種類等。 data目錄下存放的數據如下：

VOCdevkit2007└── VOC2007├── Annotations│   └── *.xml│├── ImageSets│?? └── Main│       ├── train.txt│       └── test.txt└── JPEGImages└── *.jpg

這樣做最省事。

第二種，基本上也是改造成VOC2007的形式，然后放到py-faster-rcnn/data?目錄下，但是允許Annotations不按照xml的形式。可以是自己的形式

YOUR_DATASET_devkit└── data├── Annotations│   └── *.txt│├── ImageSets│       ├── train.txt│       └── test.txt└── JPEGImages└── *.jpg or *.png

關于第二種，可以參考如下文章：

1.?deboc/py-faster-rcnn? 這個代碼是py-faster rcnn的拷貝，實現了二分類模型。里面的data組織如下：

INRIA_Person_devkit/
|-- data/|-- Annotations/|-- *.txt (Annotation files)|-- Images/|-- *.png (Image files)|-- ImageSets/|-- train.txt

按照教程： https://github.com/deboc/py-faster-rcnn/blob/master/help/Readme.md?可以訓練行人檢測。

另外《Fast RCNN 訓練自己數據集 (2修改數據讀取接口)》?也實現了自己的數據讀取。

下面重點說一下第一種。

具體的細節可以參考：?http://blog.csdn.net/Gavin__Zhou/article/details/52052915

需要注意的是根據文章<解決faster-rcnn中訓練時assert（boxes[:,2]>=boxes[:,0]）.all()的問題>? ?我們對lib/datasets/imdb.py，append_flipped_images()函數修改如下：

 def append_flipped_images(self):num_images = self.num_imageswidths = self._get_widths()for i in xrange(num_images):boxes = self.roidb[i]['boxes'].copy()oldx1 = boxes[:, 0].copy()oldx2 = boxes[:, 2].copy()boxes[:, 0] = widths[i] - oldx2 - 1boxes[:, 2] = widths[i] - oldx1 - 1for b in range(len(boxes)):if boxes[b][2]< boxes[b][0]:boxes[b][0] = 0assert (boxes[:, 2] >= boxes[:, 0]).all()entry = {'boxes' : boxes,'gt_overlaps' : self.roidb[i]['gt_overlaps'],'gt_classes' : self.roidb[i]['gt_classes'],'flipped' : True}self.roidb.append(entry)self._image_index = self._image_index * 2

我們說一說其他的，

關于數據標注： ?強烈推薦工具：labelImg ：https://github.com/tzutalin/labelImg?這是個圖形化界面操作，可以很方便地標注boundingbox,且生成xml格式。
VOC2007數據集地址：?https://pjreddie.com/projects/pascal-voc-dataset-mirror/
圖片重命名像VOC2007那樣：?http://blog.csdn.net/sinat_30071459/article/details/50723212??
根據XML文件生成test.txt（測試集），train.txt（訓練集），val.txt（驗證集），trainval.txt（訓練和驗證集），trainval大概是整個數據集的50%，test也大概是整個數據集的50%；train大概是trainval的50%，val大概是trainval的50%。將這四個txt放在ImageSets\Main中，參考：http://blog.csdn.net/sinat_30071459/article/details/50723212??
另外你不想手動地更改那些參數，可以使用這個：https://github.com/Microos/py-faster-rcnn-data-interface-generator

其他參考文檔：

1.?使用Faster-Rcnn進行目標檢測(實踐篇)

2.?Faster rcnn 安裝、訓練、測試、調試

3.?matlab訓練樣本集的制作

4. ?制作自己的數據集用于faster-rcnn訓練

5.?將數據集做成VOC2007格式用于Faster-RCNN訓練? ?（很重要）

6. Faster-RCNN+ZF用自己的數據集訓練模型(Python版本)

7.?Training'R CNNs'of'various'velocities ? ?訓練faster rcnn的官方文檔1

8.?訓練faster rcnn的官方文檔2

9.?Faster-RCNN+ZF用自己的數據集訓練模型(Matlab版本)

10. Py-faster-rcnn實現自己的數據train和demo??（很重要）

本文來自互聯網用戶投稿，該文觀點僅代表作者本人，不代表本站立場。本站僅提供信息存儲空間服務，不擁有所有權，不承擔相關法律責任。
如若轉載，請注明出處：http://www.pswp.cn/news/258627.shtml
繁體地址，請注明出處：http://hk.pswp.cn/news/258627.shtml
英文地址，請注明出處：http://en.pswp.cn/news/258627.shtml

如若內容造成侵權/違法違規/事實不符，請聯系多彩編程網進行投訴反饋email:809451989@qq.com，一經查實，立即刪除！