YOLOV13最近發布了,速速來看。
論文標題:YOLOv13:融合超圖增強的自適應視覺感知的實時目標檢測
論文鏈接:https://arxiv.org/pdf/2506.17733
代碼鏈接:https://github.com/iMoonLab/yolov13
話不多說,直接上摘要!
中文摘要
YOLO 系列模型因其卓越的精度與計算效率,一直在實時目標檢測領域占據主導地位。然而,YOLOv11 及更早版本所采用的卷積架構,以及 YOLOv12 引入的基于區域的自注意力機制,都僅限于局部信息聚合與兩兩相關性建模,難以捕捉全局的多對多高階關聯,這在復雜場景下限制了檢測性能。
為了解決上述問題,我們提出了一種全新且輕量的目標檢測器 —— YOLOv13。我們引入了一種基于超圖的自適應相關性增強機制(HyperACE),該機制能夠自適應地挖掘潛在的高階關系,突破了傳統方法僅能進行兩兩建模的限制。借助超圖計算,HyperACE 實現了高效的跨位置、跨尺度的全局特征融合與增強。
在此基礎上,我們進一步提出了一個基于 HyperACE 的全流程聚合與分發范式(FullPAD),通過將增強后的相關性特征分發至整個網絡流程,實現了細粒度信息流動與特征協同建模。
此外,我們采用深度可分離卷積替代傳統的大卷積核操作,并設計了一系列模塊,在大幅減少參數量和計算復雜度的同時,保持甚至提升了性能。
我們在廣泛使用的 MS COCO 基準數據集上進行了大量實驗證明,YOLOv13 在保持輕量的前提下,取得了當前最先進的性能。具體而言,YOLOv13-N 相較于 YOLOv11-N 提高了 3.0% 的 mAP,較YOLOv12-N提高了1.5%。YOLOv13 的代碼與模型已開源,歡迎訪問:https://github.com/iMoonLab/yolov13
貢獻點
- 我們提出了 YOLOv13,一款性能卓越的端到端實時目標檢測器。YOLOv13 通過自適應超圖挖掘潛在的高階相關性,在高階關系的引導下實現高效的信息聚合與分發,從而達到精準且魯棒的目標檢測。
-
我們提出了 HyperACE 機制,基于自適應超圖計算捕捉復雜場景中的潛在高階相關性,并在相關性引導下完成特征增強。我們提出了 FullPAD 范式,在整個網絡流程中實現多尺度特征的聚合與分發,提升信息流動性與表示協同能力。我們設計了一系列基于 深度可分離卷積 的輕量化模塊,用以替代傳統的大卷積核結構,在大幅減少參數量與計算開銷的同時保持出色性能。
-
我們在 MS COCO 基準數據集上進行了大量實驗,結果表明 YOLOv13 在保持輕量化的同時,達到了當前最先進的檢測性能。
模型架構



?實驗結果
這里僅展示部分論文實驗數據,在 MS COCO 數據集上與其他先進實時目標檢測器的定量對比。
?與其他實時目標檢測器的泛化能力對比。所有模型均在 MS COCO 數據集上訓練,并在 PASCAL VOC 2007 數據集上進行測試。
總結
YOLOv13作為最新發布的實時目標檢測模型,通過引入基于超圖的自適應相關性增強機制,顯著提升了模型對復雜場景中多尺度、多層次特征的融合能力。同時,采用輕量化的深度可分離卷積模塊,有效降低了參數量和計算復雜度,使得模型在保持高精度的同時更加高效。大量基于MSCOCO數據集的實驗驗證表明,YOLOv13在保持輕量化的前提下,實現了當前領先的檢測性能,展現出極強的實用價值和推廣潛力。