YOLO 型號之所以聞名遐邇,主要有兩個原因:其速度和準確性令人印象深刻,而且能夠快速、可靠地檢測圖像中的物體。上回我解釋了Yolo v1, 今天從Yolov2開始。
YOLOv2:更好、更快、更強
2017 年 7 月一個悶熱的星期二下午,雷德蒙(Joseph Redmon, Yolo創始人)再次走上舞臺。
在演講中,雷德蒙分享了題為《YOLO9000:更好、更快、更強》(YOLO9000: Better, Faster, Stronger )的論文,并介紹了一個能夠識別超過9000個類別的物體檢測系統。這個名為 YOLOv2 的模型在 PASCAL VOC2007 數據集上的平均精確度(AP)達到了令人印象深刻的 78.6%,超過了其前身 YOLOv1,后者僅為 63.4%。這些發現彰顯了 YOLOv2 在物體檢測和識別方面的先進能力,為計算機視覺領域的未來發展鋪平了道路。
該系統在多個方面進行了改進。
這些改進包括對卷積層進行批量歸一化,以提高收斂性并減少過度擬合。增加了高分辨率分類器,從而提高了高分辨率輸入的性能。架構改為完全卷積層,包括一個名為 DarkNet 的骨干層,其中包含 19 個卷積層和 5 個最大池化層,現在使用錨框預測邊界框。