用PaddleDetection套件訓練自己的數據集，PP-YOLO-SOD訓練全流程

文章目錄

官方資料
ppyoloe+ 訓練全流程
- 環境配置與套件準備
- 數據集準備與VOC格式ppdet的要求
- 標簽列表txt文件生成腳本
- 數據集配置
- 預訓練權重
- 模型配置
- ppyoloe訓練命令
- ppyoloe評估命令
- ppyoloe推理命令與可視化結果
ppyoloe-SOD 訓練全流程
- 預訓練權重
- 模型配置
- ppyoloe訓練命令

官方資料

PaddlePaddle框架官方文檔：https://www.paddlepaddle.org.cn/
在這里插入圖片描述

論文：PP-YOLOE: An evolved version of YOLO
PaddleDection套件：pp-yoloe-sod-高精度小目標檢測模型
在這里插入圖片描述
小目標檢測模型說明：PP-YOLOE-SOD 小目標檢測模型(PP-YOLOE Small Object Detection)

PP-YOLOE-SOD預訓練權重：模型庫
在這里插入圖片描述

ppyoloe+ 訓練全流程

環境配置與套件準備

pip install paddlepaddle-gpu==3.0.0b1 -i https://www.paddlepaddle.org.cn/packages/stable/cu118/

# 進入套件
cd PaddleDetection-release-2.8.1# 初始化
python setup.py install# 安裝依賴
pip install -r requirements.txt

pip install visualdl -i https://mirror.baidu.com/pypi/simple

直接運行以下命令安裝 libgomp1

apt-get update && apt-get install -y libgomp1

數據集準備與VOC格式ppdet的要求

VOC格式數據集，訓練集、驗證集、測試集劃分好，本別一個文件夾。
在這里插入圖片描述
以訓練集為例，需要含這四個：

圖片文件夾：JPEGImages
標簽文件夾：Annotations
類別列表文件：label_list.txt
標簽列表文件：train_list.txt

標簽列表txt文件生成腳本

import osdef generate_list_file(voc_root, output_list_path):"""生成VOC數據集的列表文件，每行格式為：JPEGImages/圖像名 Annotations/標注名參數:voc_root: VOC數據集根目錄（包含JPEGImages和Annotations文件夾）output_list_path: 輸出的列表文件路徑（如train_list.txt）"""# 檢查輸入目錄是否存在jpeg_dir = os.path.join(voc_root, "JPEGImages")anno_dir = os.path.join(voc_root, "Annotations")if not os.path.exists(jpeg_dir):raise ValueError(f"JPEGImages目錄不存在：{jpeg_dir}")if not os.path.exists(anno_dir):raise ValueError(f"Annotations目錄不存在：{anno_dir}")# 獲取所有圖像文件（僅保留常見圖像格式）image_extensions = ('.jpg', '.jpeg', '.png', '.bmp', '.JPG', '.JPEG', '.PNG', '.BMP')image_files = [f for f in os.listdir(jpeg_dir) if f.endswith(image_extensions)]if not image_files:print(f"警告：在 {jpeg_dir} 中未找到任何圖像文件")return# 寫入列表文件with open(output_list_path, 'w') as f:count = 0for img_file in image_files:# 圖像文件名（不含擴展名）img_name = os.path.splitext(img_file)[0]# 對應的標注文件名稱anno_file = f"{img_name}.xml"# 檢查標注文件是否存在anno_path = os.path.join(anno_dir, anno_file)if not os.path.exists(anno_path):print(f"警告：未找到 {img_file} 對應的標注文件 {anno_file}，已跳過")continue# 按要求格式寫入（相對路徑）line = f"JPEGImages/{img_file} Annotations/{anno_file}\n"f.write(line)count += 1print(f"已生成 {output_list_path}，包含 {count} 對有效圖像和標注")if __name__ == "__main__":# 配置你的數據集路徑train_voc_root = "/mnt/Virgil/PaddleDetetion/DUT-datasets/DUT-Anti-UAV-train-VOC"val_voc_root = "/mnt/Virgil/PaddleDetetion/DUT-datasets/DUT-Anti-UAV-val-VOC"# 輸出列表文件路徑（可根據需要修改，建議放在數據集根目錄）train_list_path = os.path.join(train_voc_root, "train_list.txt")val_list_path = os.path.join(val_voc_root, "val_list.txt")# 生成訓練集列表print("開始處理訓練集...")generate_list_file(train_voc_root, train_list_path)# 生成驗證集列表print("\n開始處理驗證集...")generate_list_file(val_voc_root, val_list_path)

數據集配置

PaddleDetection套件的所有配置文件都在PaddleDetection-release-2.8.1/configs目錄下，數據集的配置文件在PaddleDetection-release-2.8.1/configs/datasets
在這里插入圖片描述 voc.yml是官方的VOC數據集的配置文件，自己新建一個DUT-drone_voc.yaml配置文件

后面的模型配置文件中需要修改為../datasets/DUT-drone_voc.yaml

metric: VOC
map_type: 11point
num_classes: 1TrainDataset:name: VOCDataSet  # 使用框架默認的VOC數據集類dataset_dir: /mnt/Virgil/PaddleDetetion/DUT-datasets/DUT-Anti-UAV-train-VOC  # 絕對路徑anno_path: train_list.txtlabel_list: label_list.txtdata_fields: ['image', 'gt_bbox', 'gt_class', 'difficult']EvalDataset:name: VOCDataSetdataset_dir: /mnt/Virgil/PaddleDetetion/DUT-datasets/DUT-Anti-UAV-val-VOCanno_path: val_list.txtlabel_list: label_list.txtdata_fields: ['image', 'gt_bbox', 'gt_class', 'difficult']TestDataset:name: ImageFolderimage_dir: /mnt/Virgil/PaddleDetetion/DUT-datasets/DUT-Anti-UAV-val-VOC/JPEGImagesanno_path: /mnt/Virgil/PaddleDetetion/DUT-datasets/DUT-Anti-UAV-val-VOC/label_list.txt

預訓練權重

模型庫地址：https://github.com/PaddlePaddle/PaddleDetection/tree/release/2.8.1/configs/smalldet
模型庫含有的：

VisDrone模型
COCO模型
切圖模型
拼圖模型

我下載的是PP-YOLOE+_l的模型
在這里插入圖片描述

隨后在模型配置文件中指定路徑

pretrain_weights: /mnt/Virgil/PaddleDetetion/ppyoloe_plus_crn_l_80e_coco.pdparams

模型配置

模型的配置文件在PaddleDetection-release-2.8.1/configs/ppyoloe中

在這里插入圖片描述 PaddleDetection-release-2.8.1/configs/ppyoloe/ppyoloe_plus_crn_l_80e_coco.yml是官方的模型配置文件，自己新建一個DUT_ppyoloe_plus_crn_l_80e_coco.yml

_BASE_: ['../datasets/DUT-drone_voc.yaml','../runtime.yml','./_base_/optimizer_80e.yml','./_base_/ppyoloe_plus_crn.yml','./_base_/ppyoloe_plus_reader.yml',
]log_iter: 100
epoch: 100
snapshot_epoch: 5weights: output/ppyoloe_plus_crn_l_80e_coco/model_final
#pretrain_weights: https://bj.bcebos.com/v1/paddledet/models/pretrained/ppyoloe_crn_l_obj365_pretrained.pdparams
pretrain_weights: /mnt/Virgil/PaddleDetetion/ppyoloe_plus_crn_l_80e_coco.pdparamsdepth_mult: 1.0
width_mult: 1.0TrainReader:batch_size: 8

ppyoloe訓練命令

參考飛漿官方乒乓球識別比賽的命令：

python tools/train.py -c configs/picodet/ppq.yml \--use_vdl=true \--vdl_log_dir=/home/aistudio/work/vdl_dir \--eval \-o save_dir=/home/aistudio/work/model

cd /mnt/Virgil/PaddleDetetion/PaddleDetection-release-2.8.1

python -u tools/train.py -c configs/ppyoloe/DUT_ppyoloe_plus_crn_l_80e_coco.yml \--use_vdl=true \--vdl_log_dir=vdl_dir/scalar \--eval

ppyoloe評估命令

參考飛漿官方乒乓球識別比賽的命令：

python tools/eval.py -c configs/picodet/ppq.yml \-o weights=/home/aistudio/work/model/ppq/best_model.pdparams \# --classwise \

ppyoloe推理命令與可視化結果

參考飛漿官方乒乓球識別比賽的命令：

cd PaddleDetection-2.5.0
!python tools/infer.py -c configs/picodet/ppq.yml \--infer_img=/home/aistudio/work/dataset/val/JPEGImages/game_1_frame_012375.png \-o weights=/home/aistudio/work/model/ppq/best_model.pdopt \--output_dir=/home/aistudio/work/img

參考飛漿官方乒乓球識別比賽的可視化：

import matplotlib.pyplot as plt
import cv2# 讀取圖像
image_path = "/home/aistudio/work/img/game_1_frame_012375.png"
image = cv2.imread(image_path)# 檢查圖像是否成功加載
if image is None:print(f"Failed to load image: {image_path}")
else:# 轉換 BGR 到 RGBimage = cv2.cvtColor(image, cv2.COLOR_BGR2RGB)# 顯示圖像plt.imshow(image)plt.axis("off")  # 關閉坐標軸plt.show()

ppyoloe-SOD 訓練全流程

預訓練權重

模型庫地址：https://github.com/PaddlePaddle/PaddleDetection/tree/release/2.8.1/configs/smalldet

我下載的是PP-YOLOE+_SOD-l的模型
在這里插入圖片描述

隨后在模型配置文件中指定路徑

pretrain_weights: /mnt/Virgil/PaddleDetetion/ppyoloe_plus_sod_crn_l_80e_visdrone.pdparams

模型配置

模型的配置文件在PaddleDetection-release-2.8.1/configs/smalldet中

在這里插入圖片描述

PaddleDetection-release-2.8.1/configs/smalldet/ppyoloe_plus_sod_crn_l_80e_coco.yml是官方的模型配置文件，自己新建一個DUT_ppyoloe_plus_sod_crn_l_80e_coco.yml

修改數據集目錄為：../datasets/DUT-drone_voc.yaml

_BASE_: ['../datasets/DUT-drone_voc.yaml','../runtime.yml','../ppyoloe/_base_/optimizer_80e.yml','../ppyoloe/_base_/ppyoloe_plus_crn.yml','../ppyoloe/_base_/ppyoloe_plus_reader.yml',
]log_iter: 100
epoch: 100
snapshot_epoch: 5
weights: output/ppyoloe_plus_sod_crn_l_80e_coco/model_final#pretrain_weights: https://bj.bcebos.com/v1/paddledet/models/pretrained/ppyoloe_crn_l_obj365_pretrained.pdparams
pretrain_weights: /mnt/Virgil/PaddleDetetion/ppyoloe_plus_sod_crn_l_80e_visdrone.pdparamsdepth_mult: 1.0
width_mult: 1.0CustomCSPPAN:num_layers: 4use_trans: TruePPYOLOEHead:reg_range: [-2, 17]static_assigner_epoch: -1assigner:name: TaskAlignedAssigner_CRcenter_radius: 1nms:name: MultiClassNMSnms_top_k: 1000keep_top_k: 300score_threshold: 0.01nms_threshold: 0.7TrainReader:batch_size: 2

ppyoloe訓練命令

cd /mnt/Virgil/PaddleDetetion/PaddleDetection-release-2.8.1

python -u tools/train.py -c configs/smalldet/DUT_ppyoloe_plus_sod_crn_l_80e_coco.yml \--use_vdl=true \--vdl_log_dir=vdl_dir/scalar \--eval