PaddleDetection支持的數據格式
- 目前#PaddleDetection支持43種數據格式:coco voc widerface。在這里我們主要說明一下如何使用自定義COCO進行目標檢測、實例分割;如何使用自定義VOC數據集進行目標檢測。
- 在PaddleDetection新的版本中,我們將數據配置抽離了出來,用戶在自定義數據集進行訓練的時候,只需要關注在configs/datasets文件中的數據配置文件即可。
1 使用自定義VOC數據集進行目標檢測訓練
- 當用戶使用VOC數據集進行的,只需要對voc.yml進行修改即可實現正常訓練。
- 我們提供了一個自定義的VOC數據集,并整理成如圖如下圖所示的形式。用戶在voc.yml文件中修改路徑即可。
- dataset_dir: 表示數據集的路徑(該路徑下保存數據集、標注文件、標簽以及訓練驗證數據集說明txt文件)
- anno_path: 表示訓練/驗證數據集的說明txt文件路徑 (該處填寫相對于dataset_dir的相對路徑)
- label_list: 表示label的txt文件路徑(該處填寫相對于dataset_dir的相對路徑)
- 在TestDataset的配置中,對于的主要是label_list的路徑,確保在測試過程中,有正確的標簽
2 使用自定義coco數據集進行目標檢測訓練
-
當用戶使用COOC數據集進行目標檢測的時候,只需要對cooc_detection.yml進行修改即可實現正常訓練。
-
我們提供了一個自定義的COCO數據集,并整理成如圖如下圖所示的形式。用戶在cooc_detection.yml文件中修改路徑即可。
- image_dir: 表示訓練/驗證圖片的路徑
- anno_path: 表示訓練/驗證圖片的標注文件的路徑
- dataset_dir: 表示數據集的路徑(該路徑下保存數據集、標簽)
- 在TestDataset的配置中,對于的主要是引入標簽,這里會抽取val.json文件中標簽,確保在測試過程中,有正確的標簽
3 使用自定義COCO數據集進行實例分割訓練
-
當用戶使用COCO數據集進行實例分割的時候,只需要對cooc_instance.yml進行修改即可實現正常訓練,基本何目標檢測的coco數據集格式基本一致
-
我們提供了一個自定義的COCO數據集,并整理成如圖如下圖所示的形式。用戶在cooc_instance.yml文件中修改路徑即可。
- image_dir: 表示訓練/驗證圖片的路徑
- anno_path: 表示訓練/驗證圖片的標注文件的路徑
- dataset_dir: 表示數據集的路徑(該路徑下保存數據集、標簽)
- 在TestDataset的配置中,對于的主要是引入標簽,這里會抽取val.json文件中標簽,確保在測試過程中,有正確的標簽