yolov5代碼詳解--3.python代碼腳本

三、val.py

? val.py的主要作用是對訓練好的模型進行驗證（或評估）。具體來說，它用于在指定的驗證集上評估模型的性能，計算各項評估指標，并輸出結果。val.py通常在模型訓練完成后運行，用于驗證模型的檢測精度、召回率、平均精度（mAP）等指標，以確保模型的泛化能力。

參數作用總結

data: 數據集的配置文件路徑，通常為.yaml文件，定義了數據集的信息。可以調整以支持不同的數據集。

weights: 預訓練模型的路徑，可以選擇不同的YOLOv5版本的權重文件。不同權重適應不同的任務，選擇適當的權重文件。

batch_size: 每次推理的圖像批處理大小，通常根據顯存大小進行調整。較大的批次有助于加速推理，但需要更大的顯存。

imgsz: 圖像尺寸，影響推理速度和準確性。較大的圖像尺寸通常會提高準確度，但會降低推理速度。

conf_thres: 置信度閾值，設置為較低的值（如0.001）可以提高檢測到目標的概率，但可能會導致較多誤檢。可以根據需要調整。

iou_thres: NMS（非極大值抑制）的IoU閾值，控制預測框合并的嚴格度。較高的值會導致更多的框被抑制，減少重疊。

max_det: 每張圖片的最大檢測數。設置過高的值可能會導致不必要的計算，過低則可能漏檢目標。

task: 任務類型，可以是訓練、驗證、測試、速度評估等。調整此參數來執行不同類型的任務。

device: 設備選擇，指定使用的硬件設備（如cuda:0）或cpu。

single_cls: 如果數據集只包含單一類別物體，可以設置為True來簡化模型訓練與推理。

save_txt: 是否保存預測結果為txt文件。如果需要后續處理或分析，設置為True。

save_json: 是否保存為COCO格式的JSON文件，適用于COCO評估。

# YOLOv5 🚀 by Ultralytics, GPL-3.0 license
"""
Validate a trained YOLOv5 detection model on a detection datasetUsage:$ python val.py --weights yolov5s.pt --data coco128.yaml --img 640
"""
# 引入必要的庫
import argparse  # 用于命令行參數解析
import json  # 用于JSON文件的讀寫
import os  # 用于操作系統功能（路徑、目錄等）
import sys  # 用于系統操作，主要是調整模塊路徑
from pathlib import Path  # 用于路徑操作import numpy as np  # 用于處理數值運算
import torch  # 用于深度學習模型的運算
from tqdm import tqdm  # 用于顯示進度條# 配置文件路徑及根目錄
FILE = Path(__file__).resolve()
ROOT = FILE.parents[0]  # 獲取YOLOv5的根目錄路徑
if str(ROOT) not in sys.path:sys.path.append(str(ROOT))  # 將根目錄添加到系統路徑中
ROOT = Path(os.path.relpath(ROOT, Path.cwd()))  # 相對路徑# 導入自定義模塊
from models.common import DetectMultiBackend  # YOLOv5模型推理處理
from utils.callbacks import Callbacks  # 回調函數，用于在各個階段執行額外的操作
from utils.dataloaders import create_dataloader  # 數據加載器
from utils.general import (LOGGER, TQDM_BAR_FORMAT, Profile, check_dataset, check_img_size, check_requirements,check_yaml, coco80_to_coco91_class, colorstr, increment_path, non_max_suppression,print_args, scale_boxes, xywh2xyxy, xyxy2xywh)  # 各種常用工具函數
from utils.metrics import ConfusionMatrix, ap_per_class, box_iou  # 性能評估函數
from utils.plots import output_to_target, plot_images, plot_val_study  # 可視化函數
from utils.torch_utils import select_device, smart_inference_mode  # 深度學習設備選擇與推理模式# 保存預測框為文本格式
def save_one_txt(predn, save_conf, shape, file):gn = torch.tensor(shape)[[1, 0, 1, 0]]  # normalization gain whwhfor *xyxy, conf, cls in predn.tolist():xywh = (xyxy2xywh(torch.tensor(xyxy).view(1, 4)) / gn).view(-1).tolist()  # normalized xywhline = (cls, *xywh, conf) if save_conf else (cls, *xywh)  # label formatwith open(file, 'a') as f:f.write(('%g ' * len(line)).rstrip() % line + '\n')# 保存預測框為COCO格式的JSON
def save_one_json(predn, jdict, path, class_map):image_id = int(path.stem) if path.stem.isnumeric() else path.stembox = xyxy2xywh(predn[:, :4])  # xywhbox[:, :2] -= box[:, 2:] / 2  # xy center to top-left cornerfor p, b in zip(predn.tolist(), box.tolist()):jdict.append({'image_id': image_id,'category_id': class_map[int(p[5])],'bbox': [round(x, 3) for x in b],'score': round(p[4], 5)})# 處理檢測結果與真實標簽的匹配
def process_batch(detections, labels, iouv):correct = np.zeros((detections.shape[0], iouv.shape[0])).astype(bool)  # 初始化正確矩陣iou = box_iou(labels[:, 1:], detections[:, :4])  # 計算預測框與真實框的IoUcorrect_class = labels[:, 0:1] == detections[:, 5]  # 類別匹配for i in range(len(iouv)):  # 遍歷各個IoU閾值x = torch.where((iou >= iouv[i]) & correct_class)  # IoU > 閾值且類別匹配if x[0].shape[0]:matches = torch.cat((torch.stack(x, 1), iou[x[0], x[1]][:, None]), 1).cpu().numpy()  # [label, detect, iou]if x[0].shape[0] > 1:matches = matches[matches[:, 2].argsort()[::-1]]  # 排序IoUmatches = matches[np.unique(matches[:, 1], return_index=True)[1]]  # 去除重復的檢測matches = matches[np.unique(matches[:, 0], return_index=True)[1]]  # 去除重復的標簽correct[matches[:, 1].astype(int), i] = Truereturn torch.tensor(correct, dtype=torch.bool, device=iouv.device)# 主運行函數
@smart_inference_mode()  # 用于智能推理模式，自動控制GPU/CPU切換
def run(data,  # 數據集配置文件weights=None,  # 訓練好的模型路徑batch_size=32,  # 批處理大小imgsz=640,  # 輸入圖像的大小conf_thres=0.001,  # 置信度閾值iou_thres=0.6,  # IoU閾值，用于非極大值抑制max_det=300,  # 每張圖片的最大檢測框數量task='val',  # 任務類型：val、train、test等device='',  # 使用的設備，'cpu' 或 'cuda' workers=8,  # 數據加載的最大工作線程數single_cls=False,  # 是否使用單類數據集augment=False,  # 是否進行增強推理verbose=False,  # 是否輸出詳細的每類信息save_txt=False,  # 是否保存檢測結果為txt文件save_hybrid=False,  # 是否保存混合標簽和預測框結果save_conf=False,  # 是否保存置信度save_json=False,  # 是否保存為COCO格式的JSON文件project=ROOT / 'runs/val',  # 保存結果的目錄路徑name='exp',  # 保存結果的文件夾名稱exist_ok=False,  # 如果結果目錄已存在，是否覆蓋half=True,  # 是否使用FP16半精度推理dnn=False,  # 是否使用OpenCV DNN進行ONNX推理model=None,  # 模型對象dataloader=None,  # 數據加載器save_dir=Path(''),  # 保存路徑plots=True,  # 是否繪制可視化圖像callbacks=Callbacks(),  # 回調函數compute_loss=None,  # 計算損失的函數
):# 初始化或加載模型training = model is not None  # 是否為訓練模式if training:  # 訓練模式device, pt, jit, engine = next(model.parameters()).device, True, False, False  # 獲取設備信息half &= device.type != 'cpu'  # 只有在GPU上支持半精度model.half() if half else model.float()  # 根據是否啟用FP16選擇浮點精度else:  # 推理模式device = select_device(device, batch_size=batch_size)  # 選擇推理設備# 創建保存目錄save_dir = increment_path(Path(project) / name, exist_ok=exist_ok)  # 如果目錄已存在，增加一個后綴(save_dir / 'labels' if save_txt else save_dir).mkdir(parents=True, exist_ok=True)  # 創建labels目錄# 加載模型model = DetectMultiBackend(weights, device=device, dnn=dnn, data=data, fp16=half)  # 加載預訓練模型stride, pt, jit, engine = model.stride, model.pt, model.jit, model.engine  # 獲取模型的步幅等信息imgsz = check_img_size(imgsz, s=stride)  # 校驗圖像大小half = model.fp16  # 是否使用FP16if engine:batch_size = model.batch_sizeelse:device = model.deviceif not (pt or jit):batch_size = 1  # 默認單圖推理LOGGER.info(f'Forcing --batch-size 1 square inference (1,3,{imgsz},{imgsz}) for non-PyTorch models')# 數據集檢查data = check_dataset(data)  # 校驗數據集# 配置模型為評估模式model.eval()cuda = device.type != 'cpu'  # 是否使用CUDAis_coco = isinstance(data.get('val'), str) and data['val'].endswith(f'coco{os.sep}val2017.txt')  # 是否為COCO數據集nc = 1 if single_cls else int(data['nc'])  # 數據集類別數iouv = torch.linspace(0.5, 0.95, 10, device=device)  # IOU閾值列表# 加載數據集if not training:if pt and not single_cls:  # 檢查權重文件是否與數據集類別匹配ncm = model.model.ncassert ncm == nc, f'{weights} ({ncm} classes) trained on different --data than what you passed ({nc} ' \f'classes). Pass correct combination of --weights and --data that are trained together.'model.warmup(imgsz=(1 if pt else batch_size, 3, imgsz, imgsz))  # 模型預熱task = task if task in ('train', 'val', 'test') else 'val'  # 選擇任務類型：train/val/testdataloader = create_dataloader(data[task], imgsz, batch_size, stride, single_cls, workers=workers)[0]  # 創建數據加載器# 運行檢測seen = 0confusion_matrix = ConfusionMatrix(nc=nc)  # 混淆矩陣names = model.names if hasattr(model, 'names') else model.module.names  # 類別名稱class_map = coco80_to_coco91_class() if is_coco else list(range(1000))  # 如果是COCO數據集，映射類別ID# 輸出格式配置s = ('%22s' + '%11s' * 6) % ('Class', 'Images', 'Instances', 'P', 'R', 'mAP50', 'mAP50-95')tp, fp, p, r, f1, mp, mr, map50, ap50, map = 0.0, 0.0, 0.0, 0.0, 0.0, 0.0, 0.0, 0.0, 0.0, 0.0dt = Profile(), Profile(), Profile()  # 初始化性能分析loss = torch.zeros(3, device=device)  # 初始化損失jdict, stats, ap, ap_class = [], [], [], []  # 初始化統計數據# 進度條顯示pbar = tqdm(dataloader, desc=s, bar_format=TQDM_BAR_FORMAT)  # 進度條for batch_i, (im, targets, paths, shapes) in enumerate(pbar):# 處理每個批次的圖像及其標簽callbacks.run('on_val_batch_start')  # 調用回調函數with dt[0]:if cuda:im = im.to(device, non_blocking=True)  # 將輸入數據傳輸到GPUtargets = targets.to(device)  # 標簽數據傳輸到GPUim = im.half() if half else im.float()  # 數據轉換為半精度或單精度im /= 255  # 將圖像的像素值歸一化到0-1之間nb, _, height, width = im.shape  # 獲取批次大小和圖像的高寬# 推理過程with dt[1]:preds, train_out = model(im) if compute_loss else (model(im, augment=augment), None)# 計算損失（訓練時使用）if compute_loss:loss += compute_loss(train_out, targets)[1]  # 計算并累計損失# 非極大值抑制（NMS）處理targets[:, 2:] *= torch.tensor((width, height, width, height), device=device)  # 轉換標簽為像素lb = [targets[targets[:, 0] == i, 1:] for i in range(nb)] if save_hybrid else []  # 混合標簽with dt[2]:preds = non_max_suppression(preds, conf_thres, iou_thres, labels=lb, multi_label=True, agnostic=single_cls, max_det=max_det)# 計算每個檢測結果for si, pred in enumerate(preds):labels = targets[targets[:, 0] == si, 1:]  # 獲取標簽nl, npr = labels.shape[0], pred.shape[0]  # 標簽和預測框的數量path, shape = Path(paths[si]), shapes[si][0]  # 圖像路徑和大小correct = torch.zeros(npr, niou, dtype=torch.bool, device=device)  # 初始化正確矩陣seen += 1if npr == 0:if nl:stats.append((correct, *torch.zeros((2, 0), device=device), labels[:, 0]))if plots:confusion_matrix.process_batch(detections=None, labels=labels[:, 0])continue# 預測框后處理if single_cls:pred[:, 5] = 0  # 如果是單類檢測，設定類別為0predn = pred.clone()scale_boxes(im[si].shape[1:], predn[:, :4], shape, shapes[si][1])  # 還原預測框到原始尺寸# 評估if nl:tbox = xywh2xyxy(labels[:, 1:5])  # 真實標簽的坐標轉換scale_boxes(im[si].shape[1:], tbox, shape, shapes[si][1])  # 恢復真實框的尺寸labelsn = torch.cat((labels[:, 0:1], tbox), 1)  # 合并類別和坐標信息correct = process_batch(predn, labelsn, iouv)  # 計算正確匹配if plots:confusion_matrix.process_batch(predn, labelsn)  # 更新混淆矩陣stats.append((correct, pred[:, 4], pred[:, 5], labels[:, 0]))  # 統計信息# 保存結果if save_txt:save_one_txt(predn, save_conf, shape, file=save_dir / 'labels' / f'{path.stem}.txt')  # 保存txt格式結果if save_json:save_one_json(predn, jdict, path, class_map)  # 保存JSON格式結果callbacks.run('on_val_image_end', pred, predn, path, names, im[si])  # 結束回調# 繪制圖像if plots and batch_i < 3:plot_images(im, targets, paths, save_dir / f'val_batch{batch_i}_labels.jpg', names)  # 繪制標簽圖plot_images(im, output_to_target(preds), paths, save_dir / f'val_batch{batch_i}_pred.jpg', names)  # 繪制預測圖callbacks.run('on_val_batch_end', batch_i, im, targets, paths, shapes, preds)  # 結束回調# 計算并打印指標stats = [torch.cat(x, 0).cpu().numpy() for x in zip(*stats)]  # 轉換為numpy格式if len(stats) and stats[0].any():tp, fp, p, r, f1, ap, ap_class = ap_per_class(*stats, plot=plots, save_dir=save_dir, names=names)ap50, ap = ap[:, 0], ap.mean(1)  # 計算mAP@0.5和mAP@0.5:0.95mp, mr, map50, map = p.mean(), r.mean(), ap50.mean(), ap.mean()  # 計算平均精度和召回率nt = np.bincount(stats[3].astype(int), minlength=nc)  # 每個類別的目標數量# 打印結果pf = '%22s' + '%11i' * 2 + '%11.3g' * 4  # 輸出格式LOGGER.info(pf % ('all', seen, nt.sum(), mp, mr, map50, map))if nt.sum() == 0:LOGGER.warning(f'WARNING ?? no labels found in {task} set, can not compute metrics without labels')# 打印每個類別的結果if (verbose or (nc < 50 and not training)) and nc > 1 and len(stats):for i, c in enumerate(ap_class):LOGGER.info(pf % (names[c], seen, nt[c], p[i], r[i], ap50[i], ap[i]))# 計算推理速度t = tuple(x.t / seen * 1E3 for x in dt)  # 每張圖的推理時間if not training:shape = (batch_size, 3, imgsz, imgsz)LOGGER.info(f'Speed: %.1fms pre-process, %.1fms inference, %.1fms NMS per image at shape {shape}' % t)# 繪制混淆矩陣if plots:confusion_matrix.plot(save_dir=save_dir, names=list(names.values()))callbacks.run('on_val_end', nt, tp, fp, p, r, f1, ap, ap50, ap_class, confusion_matrix)# 保存JSON文件if save_json and len(jdict):w = Path(weights[0] if isinstance(weights, list) else weights).stem if weights is not None else ''  # 權重文件名anno_json = str(Path(data.get('path', '../coco')) / 'annotations/instances_val2017.json')  # COCO標注文件pred_json = str(save_dir / f"{w}_predictions.json")  # 保存預測結果的JSON文件LOGGER.info(f'\nEvaluating pycocotools mAP... saving {pred_json}...')with open(pred_json, 'w') as f:json.dump(jdict, f)# 使用pycocotools進行mAP評估try:check_requirements('pycocotools')from pycocotools.coco import COCOfrom pycocotools.cocoeval import COCOevalanno = COCO(anno_json)  # 初始化COCO APIpred = anno.loadRes(pred_json)  # 加載預測結果eval = COCOeval(anno, pred, 'bbox')  # 評估eval.evaluate()eval.accumulate()eval.summarize()map, map50 = eval.stats[:2]  # 更新結果（mAP@0.5:0.95, mAP@0.5）except Exception as e:LOGGER.info(f'pycocotools unable to run: {e}')# 返回結果model.float()  # 恢復模型為訓練模式if not training:s = f"\n{len(list(save_dir.glob('labels/*.txt')))} labels saved to {save_dir / 'labels'}" if save_txt else ''LOGGER.info(f"Results saved to {colorstr('bold', save_dir)}{s}")maps = np.zeros(nc) + mapfor i, c in enumerate(ap_class):maps[c] = ap[i]return (mp, mr, map50, map, *(loss.cpu() / len(dataloader)).tolist()), maps, tdef parse_opt():# 創建一個命令行參數解析器parser = argparse.ArgumentParser()# 添加參數用于指定數據集配置文件的路徑parser.add_argument('--data', type=str, default=ROOT / 'data/coco128.yaml', help='dataset.yaml path')# 添加參數用于指定模型的路徑，支持多個模型路徑parser.add_argument('--weights', nargs='+', type=str, default=ROOT / 'yolov5s.pt', help='model path(s)')# 添加參數用于指定批處理大小parser.add_argument('--batch-size', type=int, default=32, help='batch size')# 添加參數用于指定推理圖像的尺寸（像素）parser.add_argument('--imgsz', '--img', '--img-size', type=int, default=640, help='inference size (pixels)')# 添加參數用于指定置信度閾值parser.add_argument('--conf-thres', type=float, default=0.001, help='confidence threshold')# 添加參數用于指定NMS的IoU閾值parser.add_argument('--iou-thres', type=float, default=0.6, help='NMS IoU threshold')# 添加參數用于指定每張圖片的最大檢測框數parser.add_argument('--max-det', type=int, default=300, help='maximum detections per image')# 添加參數用于指定任務類型（train, val, test, speed, study）parser.add_argument('--task', default='val', help='train, val, test, speed or study')# 添加參數用于指定運行設備（例如CUDA設備，CPU等）parser.add_argument('--device', default='', help='cuda device, i.e. 0 or 0,1,2,3 or cpu')# 添加參數用于指定數據加載器的最大工作線程數parser.add_argument('--workers', type=int, default=8, help='max dataloader workers (per RANK in DDP mode)')# 添加參數用于指定是否將數據集視為單類數據集parser.add_argument('--single-cls', action='store_true', help='treat as single-class dataset')# 添加參數用于指定是否進行增強推理parser.add_argument('--augment', action='store_true', help='augmented inference')# 添加參數用于指定是否輸出每個類別的mAP信息parser.add_argument('--verbose', action='store_true', help='report mAP by class')# 添加參數用于指定是否保存結果為文本文件（txt格式）parser.add_argument('--save-txt', action='store_true', help='save results to *.txt')# 添加參數用于指定是否保存混合標簽和預測結果（txt格式）parser.add_argument('--save-hybrid', action='store_true', help='save label+prediction hybrid results to *.txt')# 添加參數用于指定是否保存置信度parser.add_argument('--save-conf', action='store_true', help='save confidences in --save-txt labels')# 添加參數用于指定是否保存為COCO格式的JSON文件parser.add_argument('--save-json', action='store_true', help='save a COCO-JSON results file')# 添加參數用于指定保存路徑的根目錄parser.add_argument('--project', default=ROOT / 'runs/val', help='save to project/name')# 添加參數用于指定保存路徑的子目錄parser.add_argument('--name', default='exp', help='save to project/name')# 添加參數用于指定是否允許存在重復的項目名parser.add_argument('--exist-ok', action='store_true', help='existing project/name ok, do not increment')# 添加參數用于指定是否使用FP16進行推理（半精度）parser.add_argument('--half', action='store_true', help='use FP16 half-precision inference')# 添加參數用于指定是否使用OpenCV DNN進行ONNX推理parser.add_argument('--dnn', action='store_true', help='use OpenCV DNN for ONNX inference')# 解析命令行參數opt = parser.parse_args()# 檢查數據集配置文件是否有效（例如是否符合YAML格式）opt.data = check_yaml(opt.data)# 如果數據集是COCO格式，則保存JSON文件opt.save_json |= opt.data.endswith('coco.yaml')# 如果保存混合結果，則也保存文本文件opt.save_txt |= opt.save_hybrid# 打印所有解析到的參數print_args(vars(opt))# 返回解析后的參數return optdef main(opt):# 檢查依賴項，排除tensorboard和thop庫check_requirements(exclude=('tensorboard', 'thop'))# 如果任務是訓練、驗證或測試，正常運行if opt.task in ('train', 'val', 'test'):# 如果置信度閾值大于0.001，發出警告if opt.conf_thres > 0.001:LOGGER.info(f'WARNING ?? confidence threshold {opt.conf_thres} > 0.001 produces invalid results')# 如果保存混合結果，發出警告if opt.save_hybrid:LOGGER.info('WARNING ?? --save-hybrid will return high mAP from hybrid labels, not from predictions alone')# 執行主運行函數（驗證）run(**vars(opt))else:# 如果任務是speed（速度評估），則調整參數并進行評估weights = opt.weights if isinstance(opt.weights, list) else [opt.weights]  # 確保權重是一個列表opt.half = torch.cuda.is_available() and opt.device != 'cpu'  # 如果使用GPU且支持，啟用FP16if opt.task == 'speed':  # 速度基準測試# 調整conf_thres、iou_thres和save_json，進行速度測試opt.conf_thres, opt.iou_thres, opt.save_json = 0.25, 0.45, Falsefor opt.weights in weights:run(**vars(opt), plots=False)  # 不顯示圖像，僅進行速度評估# 如果任務是study（速度與mAP的比較），則進行實驗elif opt.task == 'study':  # 速度與mAP基準測試for opt.weights in weights:# 生成文件名用于保存實驗結果f = f'study_{Path(opt.data).stem}_{Path(opt.weights).stem}.txt'x, y = list(range(256, 1536 + 128, 128)), []  # x軸為圖像尺寸，y軸為對應結果for opt.imgsz in x:  # 調整圖像尺寸進行實驗LOGGER.info(f'\nRunning {f} --imgsz {opt.imgsz}...')r, _, t = run(**vars(opt), plots=False)y.append(r + t)  # 結果與時間np.savetxt(f, y, fmt='%10.4g')  # 保存實驗結果到文本文件os.system('zip -r study.zip study_*.txt')  # 打包所有實驗結果plot_val_study(x=x)  # 繪制實驗結果圖# 程序入口，執行parse_opt()和main()函數
if __name__ == "__main__":opt = parse_opt()  # 解析命令行參數main(opt)  # 執行主函數