以下是 YOLO (You Only Look Once) 系列模型從 V1 到 V11 的詳細介紹和項目地址(截至2024年7月)。YOLO 是目標檢測領域的里程碑模型,以其 實時性 和 高精度 著稱,廣泛應用于自動駕駛、安防監控、工業檢測等領域。
YOLOv1 (2016)
📌 論文: You Only Look Once: Unified, Real-Time Object Detection
📌 代碼: Darknet (C 實現)
📌 特點:
- 首個 單階段(one-stage) 目標檢測模型,直接回歸邊界框和類別。
- 使用 全卷積網絡(FCN),速度快但精度較低。
- 輸入分辨率 448×448,在 Pascal VOC 上 mAP 63.4。
YOLOv2 (YOLO9000, 2017)
📌 論文: YOLO9000: Better, Faster, Stronger
📌 代碼: Darknet
📌 特點:
- 引入 Batch Normalization,提升訓練穩定性。
- 使用 Anchor Boxes 提高定位精度。
- 提出 Darknet-19 骨干網絡,比 V1 更快更準。
- 支持 多尺度訓練(Multi-Scale Training),輸入分辨率可調。
- 在 Pascal VOC 上 mAP 78.6,可檢測 9000+ 類別(YOLO9000)。
YOLOv3 (2018)
📌 論文: YOLOv3: An Incremental Improvement
📌 代碼: Darknet
📌 特點:
- 采用 Darknet-53 骨干網絡(帶殘差連接)。
- 引入 多尺度預測(FPN-like),提升小目標檢測能力。
- 使用 Binary Cross-Entropy (BCE) Loss 替代 Softmax 分類。
- 在 COCO 上 mAP 33.0,速度 65 FPS(Titan X)。
YOLOv4 (2020)
📌 論文: YOLOv4: Optimal Speed and Accuracy of Object Detection
📌 代碼: Darknet
📌 特點:
- 引入 CSPDarknet53 骨干網絡,提升特征提取能力。
- 采用 PANet + SPP 增強多尺度特征融合。
- 使用 Mosaic Data Augmentation 和 CIoU Loss 提升訓練效果。
- 在 COCO 上 mAP 43.5,速度 62 FPS(Tesla V100)。
YOLOv5 (2020)
📌 論文: 無官方論文(Ultralytics 團隊開發)
📌 代碼: Ultralytics YOLOv5 (PyTorch)
📌 特點:
- PyTorch 實現,更易部署和訓練。
- 引入 Focus 模塊 減少計算量。
- 支持 Auto Learning Rate & Batch Size。
- 提供 多個預訓練模型(YOLOv5s, m, l, x)。
- 在 COCO 上 mAP 50.7(YOLOv5x)。
YOLOv6 (2022)
📌 論文: YOLOv6: A Single-Stage Object Detection Framework for Industrial Applications
📌 代碼: Meituan YOLOv6
📌 特點:
- 由 美團(Meituan) 團隊開發,面向工業應用。
- 采用 EfficientRep 骨干網絡 和 RepVGG 風格 結構。
- 引入 Anchor-Free + SimOTA 標簽分配策略。
- 在 COCO 上 mAP 52.8(YOLOv6-L)。
YOLOv7 (2022)
📌 論文: YOLOv7: Trainable Bag-of-Freebies Sets New State-of-the-Art for Real-Time Object Detectors
📌 代碼: WongKinYiu YOLOv7
📌 特點:
- 提出 Extended Efficient Layer Aggregation Network (E-ELAN)。
- 引入 Model Scaling & Compound Scaling 優化推理速度。
- 支持 輔助訓練頭(Auxiliary Head) 提升小目標檢測。
- 在 COCO 上 mAP 56.8(YOLOv7-E6E)。
YOLOv8 (2023)
📌 論文: 無官方論文(Ultralytics 團隊開發)
📌 代碼: Ultralytics YOLOv8
📌 特點:
- 支持 目標檢測 + 實例分割 + 姿態估計。
- 采用 Anchor-Free + Distribution Focal Loss。
- 提供 CLI & Python API,易于部署。
- 在 COCO 上 mAP 53.9(YOLOv8x)。
YOLOv9 (2024)
📌 論文: YOLOv9: Learning What You Want to Learn Using Programmable Gradient Information
📌 代碼: WongKinYiu YOLOv9
📌 特點:
- 提出 PGI (Programmable Gradient Information) 解決信息丟失問題。
- 采用 GELAN (Generalized Efficient Layer Aggregation Network) 骨干。
- 在 COCO 上 mAP 63.0(YOLOv9-E),SOTA 性能。
YOLOv10 (2024)
📌 論文: YOLOv10: Real-Time End-to-End Object Detection
📌 代碼: THU-MIG YOLOv10
📌 特點:
- 由 清華 MIG 團隊 提出,無 NMS(Non-Maximum Suppression)。
- 采用 Consistent Dual Assignments 提升端到端訓練。
- 在 COCO 上 mAP 56.8(YOLOv10-X),速度更快。
YOLOv11 (2024)
📌 論文: 尚未正式發布(社區改進版)
📌 代碼: 社區實現
📌 特點:
- 目前 非官方版本,部分改進包括:
- 更輕量級設計(適合移動端)。
- 改進的注意力機制(如 EMA、SimAM)。
- 結合 Diffusion 模型 進行數據增強。
總結
版本 | 年份 | 骨干網絡 | 關鍵改進 | mAP (COCO) | 項目地址 |
---|---|---|---|---|---|
YOLOv1 | 2016 | Darknet | 單階段檢測 | 63.4 (VOC) | Darknet |
YOLOv2 | 2017 | Darknet-19 | Anchor Boxes | 78.6 (VOC) | Darknet |
YOLOv3 | 2018 | Darknet-53 | 多尺度預測 | 33.0 | Darknet |
YOLOv4 | 2020 | CSPDarknet53 | PANet + SPP | 43.5 | Darknet |
YOLOv5 | 2020 | CSPNet | PyTorch 實現 | 50.7 | Ultralytics |
YOLOv6 | 2022 | EfficientRep | Anchor-Free | 52.8 | Meituan |
YOLOv7 | 2022 | E-ELAN | 輔助訓練頭 | 56.8 | WongKinYiu |
YOLOv8 | 2023 | CSPDarknet | 多任務支持 | 53.9 | Ultralytics |
YOLOv9 | 2024 | GELAN | PGI 機制 | 63.0 | WongKinYiu |
YOLOv10 | 2024 | CSPNet | 無 NMS | 56.8 | THU-MIG |
YOLOv11 | 2024 | 社區改進 | 輕量化 | - | 社區 |
如何選擇 YOLO 版本?
- 工業部署 → YOLOv5 / YOLOv8(PyTorch 生態友好)
- 最高精度 → YOLOv9 / YOLOv10
- 移動端/嵌入式 → YOLOv5s / YOLOv8n
- 學術研究 → YOLOv7 / YOLOv9
YOLO 系列仍在快速發展,建議關注 Ultralytics、Meituan、WongKinYiu 等團隊的最新研究! 🚀