實踐航拍小目標檢測,基于YOLOv8全系列【n/s/m/l/x】參數模型開發構建無人機航拍場景下的小目標檢測識別分析系統

關于無人機相關的場景在我們之前的博文也有一些比較早期的實踐,感興趣的話可以自行移步閱讀即可:

《deepLabV3Plus實現無人機航拍目標分割識別系統》

《基于目標檢測的無人機航拍場景下小目標檢測實踐》

《助力環保河道水質監測,基于yolov5全系列模型【n/s/m/l/x】開發構建不同參數量級的無人機航拍河道污染漂浮物船只目標檢測識別系統,集成GradCAM對模型檢測識別能力進行分析》

《基于YOLO開發構建紅外場景下無人機航拍車輛實例分割檢測識別分析系統》

《基于輕量級YOLO模型開發構建大疆無人機檢測系統》

《基于輕量級YOLOv5n/s/m三款模型開發構建基于無人機視角的高空紅外目標檢測識別分析系統,對比測試分析性能》

《基于目標檢測實現遙感場景下的車輛檢測計數》

《共建共創共享》

《助力森林火情煙霧檢測預警,基于YOLOv5全系列模型[n/s/m/l/x]開發構建無人機航拍場景下的森林火情檢測識別系統》

《UAV 無人機檢測實踐分析》

《助力森林火情預警檢測,基于YOLOv7-tiny、YOLOv7和YOLOv7x開發構建無人機航拍場景下的森林火情檢測是別預警系統》

?《無人機助力電力設備螺母缺銷智能檢測識別,python基于YOLOv5開發構建電力設備螺母缺銷小目標檢測識別系統》

《無人機助力電力設備螺母缺銷智能檢測識別,python基于YOLOv7開發構建電力設備螺母缺銷小目標檢測識別系統》

前面因為時間、資源等因素的限制我們沒有辦法對YOLOv8全系列不同參數的模型進行全面的對比分析,僅僅開發了最為輕量級的n系列的模型,感興趣的話可以自行移步閱讀即可:?

《實踐航拍小目標檢測,基于輕量級YOLOv8n開發構建無人機航拍場景下的小目標檢測識別分析系統》

本文的內容則是圍繞開發YOLOv8全系列五款不同參數量級的模型來進行整體的對比分析。

首先看下實例效果:

簡單看下實例數據集:

如果對YOLOv8開發構建自己的目標檢測項目有疑問的可以看下面的文章,如下所示:

《基于YOLOv8開發構建目標檢測模型超詳細教程【以焊縫質量檢測數據場景為例》

非常詳細的開發實踐教程。本文這里就不再展開了,因為從YOLOv8開始變成了一個安裝包的形式,整體跟v5和v7的使用差異還是比較大的。

非常詳細的開發實踐教程。本文這里就不再展開了,因為從YOLOv8開始變成了一個安裝包的形式,整體跟v5和v7的使用差異還是比較大的。

YOLOv8核心特性和改動如下:
1、提供了一個全新的SOTA模型(state-of-the-art model),包括 P5 640 和 P6 1280 分辨率的目標檢測網絡和基于YOLACT的實例分割模型。和 YOLOv5 一樣,基于縮放系數也提供了 N/S/M/L/X 尺度的不同大小模型,用于滿足不同場景需求
2、骨干網絡和 Neck 部分可能參考了 YOLOv7 ELAN 設計思想,將 YOLOv5 的 C3 結構換成了梯度流更豐富的 C2f 結構,并對不同尺度模型調整了不同的通道數,屬于對模型結構精心微調,不再是一套參數應用所有模型,大幅提升了模型性能。
3、Head 部分相比 YOLOv5 改動較大,換成了目前主流的解耦頭結構,將分類和檢測頭分離,同時也從Anchor-Based 換成了 Anchor-Free
4、Loss 計算方面采用了TaskAlignedAssigner正樣本分配策略,并引入了Distribution Focal Loss
5、訓練的數據增強部分引入了 YOLOX 中的最后 10 epoch 關閉 Mosiac 增強的操作,可以有效地提升精度

YOLOv8官方項目地址在這里,如下所示:

目前已經收獲超過1.7w的star量了。官方提供的預訓練模型如下所示:

是基于Open Image V7數據集構建的,可以根據自己的需求進行選擇使用即可。

YOLOv8的定位不僅僅是目標檢測,而是性能強大全面的工具庫,故而在任務類型上同時支持:姿態估計、檢測、分類、分割、跟蹤多種類型,可以根據自己的需要進行選擇使用,這里就不再詳細展開了。

簡單的實例實現如下所示:

from ultralytics import YOLO# yolov8n
model = YOLO('yolov8n.yaml').load('yolov8n.pt')  # build from YAML and transfer weights
model.train(data='data/self.yaml', epochs=100, imgsz=640)# yolov8s
model = YOLO('yolov8s.yaml').load('yolov8s.pt')  # build from YAML and transfer weights
model.train(data='data/self.yaml', epochs=100, imgsz=640)# yolov8m
model = YOLO('yolov8m.yaml').load('yolov8m.pt')  # build from YAML and transfer weights
model.train(data='data/self.yaml', epochs=100, imgsz=640)# yolov8l
model = YOLO('yolov8l.yaml').load('yolov8l.pt')  # build from YAML and transfer weights
model.train(data='data/self.yaml', epochs=100, imgsz=640)# yolov8x
model = YOLO('yolov8x.yaml').load('yolov8x.pt')  # build from YAML and transfer weights
model.train(data='data/self.yaml', epochs=100, imgsz=640)

這里給出yolov8的模型文件如下:

# Ultralytics YOLO 🚀, AGPL-3.0 license
# YOLOv8 object detection model with P3-P5 outputs. For Usage examples see https://docs.ultralytics.com/tasks/detect# Parameters
nc: 10  # number of classes
scales: # model compound scaling constants, i.e. 'model=yolov8n.yaml' will call yolov8.yaml with scale 'n'# [depth, width, max_channels]n: [0.33, 0.25, 1024]  # YOLOv8n summary: 225 layers,  3157200 parameters,  3157184 gradients,   8.9 GFLOPss: [0.33, 0.50, 1024]  # YOLOv8s summary: 225 layers, 11166560 parameters, 11166544 gradients,  28.8 GFLOPsm: [0.67, 0.75, 768]   # YOLOv8m summary: 295 layers, 25902640 parameters, 25902624 gradients,  79.3 GFLOPsl: [1.00, 1.00, 512]   # YOLOv8l summary: 365 layers, 43691520 parameters, 43691504 gradients, 165.7 GFLOPsx: [1.00, 1.25, 512]   # YOLOv8x summary: 365 layers, 68229648 parameters, 68229632 gradients, 258.5 GFLOPs# YOLOv8.0n backbone
backbone:# [from, repeats, module, args]- [-1, 1, Conv, [64, 3, 2]]  # 0-P1/2- [-1, 1, Conv, [128, 3, 2]]  # 1-P2/4- [-1, 3, C2f, [128, True]]- [-1, 1, Conv, [256, 3, 2]]  # 3-P3/8- [-1, 6, C2f, [256, True]]- [-1, 1, Conv, [512, 3, 2]]  # 5-P4/16- [-1, 6, C2f, [512, True]]- [-1, 1, Conv, [1024, 3, 2]]  # 7-P5/32- [-1, 3, C2f, [1024, True]]- [-1, 1, SPPF, [1024, 5]]  # 9# YOLOv8.0n head
head:- [-1, 1, nn.Upsample, [None, 2, 'nearest']]- [[-1, 6], 1, Concat, [1]]  # cat backbone P4- [-1, 3, C2f, [512]]  # 12- [-1, 1, nn.Upsample, [None, 2, 'nearest']]- [[-1, 4], 1, Concat, [1]]  # cat backbone P3- [-1, 3, C2f, [256]]  # 15 (P3/8-small)- [-1, 1, Conv, [256, 3, 2]]- [[-1, 12], 1, Concat, [1]]  # cat head P4- [-1, 3, C2f, [512]]  # 18 (P4/16-medium)- [-1, 1, Conv, [512, 3, 2]]- [[-1, 9], 1, Concat, [1]]  # cat head P5- [-1, 3, C2f, [1024]]  # 21 (P5/32-large)- [[15, 18, 21], 1, Detect, [nc]]  # Detect(P3, P4, P5)

實驗階段保持著完全相同的參數設置,開發完成五款不同參數量級的模型來進行綜合全面的對比分析,等待訓練完成后我們來詳細看下結果。

【Precision曲線】
精確率曲線(Precision-Recall Curve)是一種用于評估二分類模型在不同閾值下的精確率性能的可視化工具。它通過繪制不同閾值下的精確率和召回率之間的關系圖來幫助我們了解模型在不同閾值下的表現。
精確率(Precision)是指被正確預測為正例的樣本數占所有預測為正例的樣本數的比例。召回率(Recall)是指被正確預測為正例的樣本數占所有實際為正例的樣本數的比例。
繪制精確率曲線的步驟如下:
使用不同的閾值將預測概率轉換為二進制類別標簽。通常,當預測概率大于閾值時,樣本被分類為正例,否則分類為負例。
對于每個閾值,計算相應的精確率和召回率。
將每個閾值下的精確率和召回率繪制在同一個圖表上,形成精確率曲線。
根據精確率曲線的形狀和變化趨勢,可以選擇適當的閾值以達到所需的性能要求。
通過觀察精確率曲線,我們可以根據需求確定最佳的閾值,以平衡精確率和召回率。較高的精確率意味著較少的誤報,而較高的召回率則表示較少的漏報。根據具體的業務需求和成本權衡,可以在曲線上選擇合適的操作點或閾值。
精確率曲線通常與召回率曲線(Recall Curve)一起使用,以提供更全面的分類器性能分析,并幫助評估和比較不同模型的性能。

【Recall曲線】
召回率曲線(Recall Curve)是一種用于評估二分類模型在不同閾值下的召回率性能的可視化工具。它通過繪制不同閾值下的召回率和對應的精確率之間的關系圖來幫助我們了解模型在不同閾值下的表現。
召回率(Recall)是指被正確預測為正例的樣本數占所有實際為正例的樣本數的比例。召回率也被稱為靈敏度(Sensitivity)或真正例率(True Positive Rate)。
繪制召回率曲線的步驟如下:
使用不同的閾值將預測概率轉換為二進制類別標簽。通常,當預測概率大于閾值時,樣本被分類為正例,否則分類為負例。
對于每個閾值,計算相應的召回率和對應的精確率。
將每個閾值下的召回率和精確率繪制在同一個圖表上,形成召回率曲線。
根據召回率曲線的形狀和變化趨勢,可以選擇適當的閾值以達到所需的性能要求。
通過觀察召回率曲線,我們可以根據需求確定最佳的閾值,以平衡召回率和精確率。較高的召回率表示較少的漏報,而較高的精確率意味著較少的誤報。根據具體的業務需求和成本權衡,可以在曲線上選擇合適的操作點或閾值。

【loss】

【F1值曲線】
F1值曲線是一種用于評估二分類模型在不同閾值下的性能的可視化工具。它通過繪制不同閾值下的精確率(Precision)、召回率(Recall)和F1分數的關系圖來幫助我們理解模型的整體性能。
F1分數是精確率和召回率的調和平均值,它綜合考慮了兩者的性能指標。F1值曲線可以幫助我們確定在不同精確率和召回率之間找到一個平衡點,以選擇最佳的閾值。
繪制F1值曲線的步驟如下:
使用不同的閾值將預測概率轉換為二進制類別標簽。通常,當預測概率大于閾值時,樣本被分類為正例,否則分類為負例。
對于每個閾值,計算相應的精確率、召回率和F1分數。
將每個閾值下的精確率、召回率和F1分數繪制在同一個圖表上,形成F1值曲線。
根據F1值曲線的形狀和變化趨勢,可以選擇適當的閾值以達到所需的性能要求。
F1值曲線通常與接收者操作特征曲線(ROC曲線)一起使用,以幫助評估和比較不同模型的性能。它們提供了更全面的分類器性能分析,可以根據具體應用場景來選擇合適的模型和閾值設置。

【mAP0.5】
mAP0.5,也被稱為mAP@0.5或AP50,指的是當Intersection over Union(IoU)閾值為0.5時的平均精度(mean Average Precision)。IoU是一個用于衡量預測邊界框與真實邊界框之間重疊程度的指標,其值范圍在0到1之間。當IoU值為0.5時,意味著預測框與真實框至少有50%的重疊部分。
在計算mAP0.5時,首先會為每個類別計算所有圖片的AP(Average Precision),然后將所有類別的AP值求平均,得到mAP0.5。AP是Precision-Recall Curve曲線下面的面積,這個面積越大,說明AP的值越大,類別的檢測精度就越高。
mAP0.5主要關注模型在IoU閾值為0.5時的性能,當mAP0.5的值很高時,說明算法能夠準確檢測到物體的位置,并且將其與真實標注框的IoU值超過了閾值0.5。

【mAP0.5:0.95】
mAP0.5:0.95,也被稱為mAP@[0.5:0.95]或AP@[0.5:0.95],表示在IoU閾值從0.5到0.95變化時,取各個閾值對應的mAP的平均值。具體來說,它會在IoU閾值從0.5開始,以0.05為步長,逐步增加到0.95,并在每個閾值下計算mAP,然后將這些mAP值求平均。
這個指標考慮了多個IoU閾值下的平均精度,從而更全面、更準確地評估模型性能。當mAP0.5:0.95的值很高時,說明算法在不同閾值下的檢測結果均非常準確,覆蓋面廣,可以適應不同的場景和應用需求。
對于一些需求比較高的場合,比如安全監控等領域,需要保證高的準確率和召回率,這時mAP0.5:0.95可能更適合作為模型的評價標準。
綜上所述,mAP0.5和mAP0.5:0.95都是用于評估目標檢測模型性能的重要指標,但它們的關注點有所不同。mAP0.5主要關注模型在IoU閾值為0.5時的性能,而mAP0.5:0.95則考慮了多個IoU閾值下的平均精度,從而更全面、更準確地評估模型性能。

綜合實驗對比結果來看:五款不同參數量級的模型效果層次分明,不難看出n系列的模型效果最差,被其他幾款模型拉開了明顯的差距,s系列的模型性能次之,優于n系列的模型但是與其他3款模型依舊有明顯的差距,m系列模型效果居中不過依舊落后于l和x系列的模型,l系列的模型稍落后于x系列的模型,x系列的模型效果最優,結合參數量考慮最終線上考慮使用l系列的模型來作為最終的推理模型。

接下來看下l系列的模型詳情:
【離線推理實例】

【Batch實例】

【訓練可視化】

【PR曲線】

感興趣的話也都可以試試看!

如果自己不具備開發訓練的資源條件或者是沒有時間自己去訓練的話這里我提供出來對應的訓練結果可供自行按需索取。

單個模型的訓練結果默認YOLOv8s

全系列五個模型的訓練結果總集

本文來自互聯網用戶投稿,該文觀點僅代表作者本人,不代表本站立場。本站僅提供信息存儲空間服務,不擁有所有權,不承擔相關法律責任。
如若轉載,請注明出處:http://www.pswp.cn/news/715531.shtml
繁體地址,請注明出處:http://hk.pswp.cn/news/715531.shtml
英文地址,請注明出處:http://en.pswp.cn/news/715531.shtml

如若內容造成侵權/違法違規/事實不符,請聯系多彩編程網進行投訴反饋email:809451989@qq.com,一經查實,立即刪除!

相關文章

使用 llama.cpp 在本地部署 AI 大模型的一次嘗試

對于剛剛落下帷幕的2023年,人們曾經給予其高度評價——AIGC元年。隨著 ChatGPT 的火爆出圈,大語言模型、AI 生成內容、多模態、提示詞、量化…等等名詞開始相繼頻頻出現在人們的視野當中,而在這場足以引發第四次工業革命的技術浪潮里,人們對于人工智能的態度,正從一開始的…

JVM(5)

垃圾回收相關 垃圾收集器 警告:純八股文! 如果說上面我們講的收集算法是內存回收的方法論,那么垃圾收集器就是內存回收的具體體現. 垃圾收集器的作用:垃圾收集器是為了保證程序能夠正常,持久運行的一種技術,它是將程序中不用的死亡對象也就是垃圾對象進行清除,從而保證新的…

第四十五天| 322. 零錢兌換、279.完全平方數

Leetcode 322. 零錢兌換 題目鏈接:322 零錢兌換 題干:給你一個整數數組 coins ,表示不同面額的硬幣;以及一個整數 amount ,表示總金額。計算并返回可以湊成總金額所需的 最少的硬幣個數 。如果沒有任何一種硬幣組合能…

AI大語言模型【成像光譜遙感技術】ChatGPT應用指南

遙感技術主要通過衛星和飛機從遠處觀察和測量我們的環境,是理解和監測地球物理、化學和生物系統的基石。ChatGPT是由OpenAI開發的最先進的語言模型,在理解和生成人類語言方面表現出了非凡的能力。本文重點介紹ChatGPT在遙感中的應用,人工智能…

vscode + git

寫在前面: origin分支: 當我們在使用git clone的時候,git會自動地將這個遠程的repo命名為origin,拉取它所有的數據之后,創建一個指向它master的指針,命名為origin/master,之后會在本地創建一個…

C#單向鏈表實現:用泛型類在當前位置插入新數據的方法Insert()

一、涉及到的知識點 1.ListNode<T>類 ListNode<T>是一個泛型類&#xff0c;用于表示鏈表中的一個節點。Value和Next屬性是ListNode<T>最基本的屬性&#xff0c;用于表示節點的值和指向下一個節點的引用。但是&#xff0c;完全可以根據實際需求添加其他屬性&…

雙非二本找實習前的準備day5

學習目標&#xff1a; 每天2-3到簡單sql&#xff08;刷完即止&#xff09;&#xff0c;每天復習代碼隨想錄上的題目3道算法&#xff08;時間充足可以繼續&#xff09;&#xff0c;今天的八股背少一點&#xff0c;MySQL和Redis各1-2道好了&#xff0c;主攻復習是java基礎 今日…

C語言5道編程題簡單介紹(三)

1、打印楊輝三角 程序分析&#xff1a; 結構如下所示&#xff1a; 1 1 1 1 2 1 1 3 3 1 1 4 6 4 1代碼如下&#xff1a; #include <stdio.h>int main() {int i,j;int a[10][10];printf("\n");for(i0;i<10;i) {a[i][0]1;a…

Vuex 是什么?它在 Vue 應用中扮演什么角色?解釋一下 Vuex 的狀態管理模式。如何在 Vuex 中進行異步操作?

一、Vuex 是什么&#xff1f; Vuex 是一個專為 Vue.js 應用程序開發的狀態管理模式。它采用集中式存儲管理應用的所有組件的狀態&#xff0c;并以相應的規則保證狀態以一種可預測的方式發生變化。Vuex 的出現解決了多個組件間共享狀態的問題&#xff0c;使得狀態管理變得更加直…

#WEB前端(HTML屬性)

1.實驗&#xff1a;a,img 2.IDE&#xff1a;VSCODE 3.記錄&#xff1a; a: href插入超鏈接 默認情況下在本窗口打開鏈接, target可以設置打開的窗口,parent在父窗口打開&#xff0c;blank新開串口打開,top在頂層串口打開,self為默認在本窗口打開 img: 插入圖片 可以插…

解析/區分MOS管的三個引腳G、S、D(NMOS管和PMOS管)

MOS管的三個引腳分別是Gate&#xff08;柵極&#xff09;、Source&#xff08;源極&#xff09;和Drain&#xff08;漏極&#xff09;。以下是詳細介紹&#xff1a; Gate&#xff08;柵極&#xff09;。這是控制MOS管開關的關鍵引腳&#xff0c;用于控制電流的流通。Source&…

智能分析網關V4安全帽檢測/反光衣檢測/通用工服檢測算法及應用

TSINGSEE青犀視頻智能分析網關V4內置了近40種AI算法模型&#xff0c;支持對接入的視頻圖像進行人、車、物、行為等實時檢測分析&#xff0c;上報識別結果&#xff0c;并能進行語音告警播放。硬件管理平臺支持RTSP、GB28181協議、以及廠家私有協議接入&#xff0c;可兼容市面上常…

【DDD】學習筆記-實體和值對象:從領域模型的基礎單元看系統設計

今天我們來學習 DDD 戰術設計中的兩個重要概念&#xff1a;實體和值對象。 這兩個概念都是領域模型中的領域對象。它們在領域模型中起什么作用&#xff0c;戰術設計時如何將它們映射到代碼和數據模型中去&#xff1f;就是我們這一講重點要關注的問題。 另外&#xff0c;在戰略…

springboot238光影視頻

光影視頻平臺 摘 要 使用舊方法對光影視頻平臺的信息進行系統化管理已經不再讓人們信賴了&#xff0c;把現在的網絡信息技術運用在光影視頻平臺的管理上面可以解決許多信息管理上面的難題&#xff0c;比如處理數據時間很長&#xff0c;數據存在錯誤不能及時糾正等問題。這次開…

APS面試審核準備的常規問題

之前根據其他人的經驗貼&#xff0c;準備了一些可能APS 面試審核可能會遇到的常規問題&#xff0c;現在簡單分享一下。 一般會考慮到留學資金來源&#xff0c;在德國能不能順利畢業&#xff1b;學的是什么專業內容之類的&#xff0c;判斷去德國會不會好好學習&#xff1b;對德國…

Linux:上傳文件到虛擬機

常見的方法&#xff1a; 使用虛擬機軟件提供的文件共享功能&#xff1a; 對于VMware Workstation&#xff0c;可以使用“共享文件夾”功能。對于VirtualBox&#xff0c;可以使用“共享文件夾”或“拖放”功能。 使用網絡文件共享服務&#xff1a; 您可以在虛擬機中配置一個Sam…

【Python入門教程】Python實現雞兔同籠

今天跟大家分享一下很久之前自己做的雞兔同籠求解問題的小游戲&#xff0c;使用公式和基本的判斷語句即可實現&#xff0c;可以用來當練手或者消磨時間用。 大家在編代碼的時候最重要就是先理清邏輯思路&#xff0c;例如應該套幾層循環、分幾個模塊等等。然后在編碼時可以先隨意…

TS中符號的用法:?、??、 !、 !!

1) ? 的用法 示例&#xff1a; const obj res?.data || {}; // obj是從接口中取到的數據const dataError obj.a.b; // 若obj為空&#xff0c;則此時會報錯const dataSafe obj?.a?.b; // 相當于 const dataSafe obj && obj.a && obj.a.b ? obj.a.b…

wy的leetcode刷題記錄_Day80

wy的leetcode刷題記錄_Day80 聲明 本文章的所有題目信息都來源于leetcode 如有侵權請聯系我刪掉! 時間&#xff1a;2024-3-2 前言 目錄 wy的leetcode刷題記錄_Day80聲明前言2368. 受限條件下可到達節點的數目題目介紹思路代碼收獲 92. 反轉鏈表 II題目介紹思路代碼收獲 2368…

Redis持久化+Redis內存管理和優化+Redis三大緩存問題

Redis持久化Redis內存管理和優化Redis三大緩存問題一、Redis高可用二、Redis持久化1、RDB持久化1.1 觸發條件(1) 手動觸發(2) 自動觸發(3) 其他自動觸發機制 1.2 執行流程1.3 啟動時加載 2、AOF持久化2.1 開啟AOF2.2 執行流程(1) 命令追加(append)(2) 文件寫入(write)和文件同步…