實戰 | 使用YOLOv8圖像分割實現路面坑洞檢測(步驟 + 代碼)

導? 讀

????本文主要介紹使用YOLOv8圖像分割實現路面坑洞檢測(步驟 + 代碼)。??

背 景

圖片

????如上圖所示,現實生活中路面坑洞對車輛和駕駛員安全來說存在巨大隱患,本文將介紹如何使用YoloV8圖像分割技術來檢測路面坑洞,從而提示駕駛員注意避讓,盡可能保證安全。

??

實現步驟

? ??【1】準備數據集。

????本教程中使用Pothole圖像分割數據集。獲取坑洼圖像分割數據集。您可以從?Kaggle?訪問它,這是一個流行的數據科學競賽、數據集和機器學習資源平臺。數據集下載鏈接:

https://www.kaggle.com/datasets/farzadnekouei/pothole-image-segmentation-dataset

????下載數據集后,如果數據集已打包,您可能需要從壓縮格式(例如 ZIP 或 TAR 文件)中提取文件。

圖片

圖片

圖片

? ??【2】安裝Ultralytics,導入必要的庫。

????安裝Ultralytics:

pip?install?ultralytics

????導入必要的庫:

import pandas as pdimport numpy as npimport matplotlib.pyplot as pltimport seaborn as snsimport osimport warningsfrom ultralytics import YOLOimport cv2from PIL import Imageimport yamlimport random

? ??【3】設置數據路徑。

dataDir = '/content/Pothole_Segmentation_YOLOv8/'

? ??dataDir目錄路徑“/content/Pothole_Segmentation_YOLOv8/”的變量。該變量表示存儲圖像分割任務的數據集的目錄。

? ??【4】加載并繪制圖像。???????

trainImagePath = os.path.join(dataDir, 'train','images')
#list of the imagesimageFiles = [f for f in os.listdir(trainImagePath) if f.endswith('.jpg')]
randomImages = random.sample(imageFiles, 15)
plt.figure(figsize=(10, 10))
for i, image_file in enumerate(randomImages):
    image_path = os.path.join(trainImagePath, image_file)    image = Image.open(image_path)    plt.subplot(3, 5, i + 1)    plt.imshow(image)    plt.axis('off')
  # Add a suptitleplt.suptitle('Random Selection of Dataset Images', fontsize=24)
# Show the plotplt.tight_layout()plt.show()

????設置訓練圖像路徑:

??? trainImagePath = os.path.join(dataDir, 'train','images'):此行構造包含訓練圖像的目錄的路徑。它使用該os.path.join()函數將基本目錄路徑 ( dataDir) 與存儲訓練圖像的子目錄“train”和“images”連接起來。

????列出圖像文件:

??? imageFiles = [f for f in os.listdir(trainImagePath) if f.endswith('.jpg')]:此行在目錄中創建圖像文件列表trainImagePath。它使用列表理解來迭代目錄中的文件,并僅過濾那些以“.jpg”擴展名結尾的文件。

????選擇隨機圖像:

??? randomImages = random.sample(imageFiles, 15):此行從上一步使用該函數獲得的圖像文件列表中隨機選擇 15 個圖像random.sample()。

????繪制圖像:

    • 以下代碼行迭代隨機選擇的圖像,使用?PIL?( Image.open()) 打開每個圖像,然后用于matplotlib.pyplot創建顯示所選圖像的子圖網格。

    • 該plt.subplot()函數用于定位網格中的每個圖像。

    • plt.imshow()在子圖中顯示圖像。

    • plt.axis('off')刪除軸標簽以獲得更清晰的可視化效果。

????添加標題并顯示繪圖:

??? plt.suptitle('Random Selection of Dataset Images', fontsize=24):為整個情節添加標題。

??? plt.tight_layout()調整子圖的布局以防止重疊。

??? plt.show()顯示情節。

圖片

隨機選擇數據集圖像

? ??【5】下載并訓練YoloV8分割模型。

model = YOLO('yolov8n-seg.pt')

????加載預訓練權重:'yolov8n-seg.pt'傳遞給 YOLO 構造函數指定 YOLOv8n 模型預訓練權重的文件路徑。這些權重對于使用訓練過程中學到的參數初始化神經網絡至關重要。

yamlFilePath = os.path.join(dataDir,'data.yaml' )

??? yamlFilePath = os.path.join(dataDir,'data.yaml')用于構造名為 的 YAML 文件的文件路徑data.yaml。???????

results = model.train(     data= yamlFilePath,     epochs= 30 ,     imgsz= 640 ,     batch= 32 ,     optimizationr= 'auto' ,     lr0= 0.0001 ,               # 初始學習率    lrf= 0.01 ,                 # 最終學習率 (lr0 * lrf)?????dropout?=?0.25?,???????????#?使用?dropout?正則化    device= 0 ,                 # 運行的設備,即 cuda device=0     seed= 42 )

????開始 YOLOv8 圖像分割模型的訓練過程。讓我們分解一下傳遞給該model.train()方法的參數:

  • data:此參數指定 YAML 文件 ( ) 的路徑,yamlFilePath其中包含配置設置和有關用于訓練的數據集的信息。YAML 文件可能包含圖像文件路徑、注釋文件、類名等詳細信息。

  • epochs:該參數決定訓練過程中的 epoch 數(完整遍歷整個數據集)。在我們的例子中,模型將訓練 30 個?epoch。

  • imgsz:該參數指定訓練時模型的輸入圖像大小。圖像在輸入網絡之前可能會調整為 640x640 像素。

  • batch:該參數設置訓練期間使用的批量大小。它確定在訓練過程的每次迭代中同時處理的圖像數量。這里使用的批量大小為 32。

  • optimizer:該參數指定用于訓練模型的優化器。該值'auto'表明訓練過程會根據模型架構或其他設置自動選擇優化器。

  • lr0:該參數設置優化器的初始學習率。指定學習率為 0.0001,這是許多優化任務的常見起始值。

  • lrf:該參數指定最終學習率,其計算方式為初始學習率乘以lrf。它有助于在訓練過程中逐漸降低學習率以穩定學習過程。

  • dropout:該參數指定 dropout 率,這是一種用于防止訓練期間過度擬合的正則化技術。丟棄率為 0.25 表示在每次訓練迭代期間將隨機丟棄 25% 的神經元。

  • device:此參數指定模型將在其上進行訓練的設備。值0通常表示在第一個 CUDA 設備 (GPU) 上進行訓練(如果可用),否則將使用 CPU。

  • seed:此參數設置用于訓練期間再現性的隨機種子。設置固定種子可確保每次執行代碼時生成相同的隨機數序列,這對于調試和結果再現性很有用。

? ??【6】加載性能最佳的模型。???????

bestModelpath = '/content/runs/segment/train/weights/best.pt'bestModel = YOLO(bestModelpath)
    • bestModelpath:該變量包含訓練期間獲得的最佳模型的文件路徑。

    • '/content/runs/segment/train/weights/best.pt':該字符串指定包含最佳模型權重的文件的路徑。

? ??【7】加載圖像做推理。???????

validImagePath = os.path.join(dataDir, 'valid', 'images')
imageFiles = [f for f in os.listdir(validImagePath) if f.endswith('.jpg')]
#select Random imagesnumImages = len(imageFiles)selectedImage = [imageFiles[i] for i in range(0, numImages, numImages // 9)]
fig, axes = plt.subplots(3, 3, figsize=(10, 10))fig.suptitle('Validation Set Inferences')
for i, ax in enumerate(axes.flatten()):  imagePath = os.path.join(validImagePath, selectedImage[i])  results = bestModel.predict(source= imagePath, imgsz=640)  annotatedImage = results[0].plot()  annotatedImageRGB = cv2.cvtColor(annotatedImage, cv2.COLOR_BGR2RGB)  ax.imshow(annotatedImageRGB)  ax.axis('off')
plt.tight_layout()plt.show()

????使用訓練期間獲得的最佳模型對驗證圖像集進行推斷。

????設置驗證圖像路徑:

    • validImagePath = os.path.join(dataDir, 'valid', 'images'):此行構造包含驗證圖像的目錄的路徑。

????列出驗證圖像文件:

    • imageFiles = [f for f in os.listdir(validImagePath) if f.endswith('.jpg')]:此行在目錄中創建圖像文件列表validImagePath。

????選擇隨機圖像:

    • numImages = len(imageFiles):此行計算驗證集中的圖像總數。

    • selectedImage = [imageFiles[i] for i in range(0, numImages, numImages // 9)]:此行從驗證集中選擇圖像的子集。似乎通過將圖像總數 ( numImages) 除以 9 來選擇 9 個圖像。

????繪制推斷圖像:

    • 然后,代碼繼續使用 來創建 3x3 子圖網格plt.subplots()。整個圖的標題設置為“驗證集推斷”,使用fig.suptitle().

    • 它使用 迭代子圖enumerate(axes.flatten()),其中每個子圖代表驗證集中的一個圖像。

    • 對于每個子圖,它使用 加載相應的圖像os.path.join(validImagePath, selectedImage[i]),使用 方法執行推理bestModel.predict(),并使用 繪制帶注釋的圖像results[0].plot()。

    • OpenCV的cv2.cvtColor()函數用于將帶注釋的圖像從BGR轉換為RGB格式,適合用Matplotlib顯示。

    • 最后,它使用 隱藏每個子圖的軸ax.axis('off')。

圖片

? ??【8】加載視頻做推理。???????????

import shutilvideoPath = '/content/Pothole_Segmentation_YOLOv8/sample_video.mp4'
bestModel.predict(source=videoPath, save=True)??????????????
import subprocess
# Convert AVI to MP4 using FFmpegsubprocess.call(['ffmpeg', '-y', '-loglevel', 'panic', '-i', '/content/runs/segment/predict/sample_video.avi', 'output_video.mp4'])
from IPython.display import Video
# Display the converted MP4 videoVideo("output_video.mp4", embed=True, width=960)

????結論:

????當我們結束使用 YOLOv8 的圖像分割迷人世界的旅程時,我們發現自己配備了新的見解、技能和可能性。在整個項目中,我們從數據管理到模型訓練、推理和評估,揭示了圖像分割的復雜性及其在計算機視覺中的變革潛力。

—THE END—

本文來自互聯網用戶投稿,該文觀點僅代表作者本人,不代表本站立場。本站僅提供信息存儲空間服務,不擁有所有權,不承擔相關法律責任。
如若轉載,請注明出處:http://www.pswp.cn/news/715651.shtml
繁體地址,請注明出處:http://hk.pswp.cn/news/715651.shtml
英文地址,請注明出處:http://en.pswp.cn/news/715651.shtml

如若內容造成侵權/違法違規/事實不符,請聯系多彩編程網進行投訴反饋email:809451989@qq.com,一經查實,立即刪除!

相關文章

計算機網絡|Socket

文章目錄 Socket并發socket Socket Socket是一種工作在TCP/IP協議棧上的API。 端口用于區分不同應用,IP地址用于區分不同主機。 以下是某一個服務器的socket代碼。 其中with是python中的一個語法糖,代表當代碼塊離開with時,自動對s進行銷毀…

JS:原型與原型鏈(附帶圖解與代碼)

一、原型 寫在前面: 任何對象都有原型。 函數也是對象,所以函數也有原型。 1.什么是原型 在 JavaScript 中,對象有一個特殊的隱藏屬性 [[Prototype]],它要么為 null,要么就是對另一個對象的引用,該對象…

什么是片內片間均勻性?

均勻性在芯片制程的每一個工序中都需要考慮到,包括薄膜沉積,刻蝕,光刻,cmp,離子注入等。較高的均勻性才能保證芯片的產品與性能。那么片內和片間非均勻性是什么?如何計算?有什么作用呢&#xff…

遞歸與遞推(藍橋杯 c++)

目錄 題目一&#xff1a; 代碼&#xff1a; 題目二: 代碼&#xff1a; 題目三&#xff1a; 代碼&#xff1a; 題目四&#xff1a; 代碼&#xff1a; 題目一&#xff1a; 代碼&#xff1a; #include<iostream> #include<cstring> using namespace std; int …

react Provider Consumer 使用方法

相關文章 React Context的使用方法 跨幾個組件傳遞值或者方法的時候, 如果依賴父子組件傳值, 那勢必會很麻煩. 好在react提供了Provider 和 Consumer 1 調用react的createContext()方法, 產生生產者和消費者組件. // context.js import React from react let { Consumer, Pr…

node.js最準確歷史版本下載

先進入官網:Node.js https://nodejs.org/en 嫌其他博客多可以到/release下載:Node.js,在blog后面加/release https://nodejs.org/en/blog/release/ 點擊next翻頁,同樣的道理

數據結構:棧和隊列(隊列)

隊列的性質 一端進,從另一端出,先進的數據一定先出去,進數據的一端叫隊尾,出數據的一端叫隊頭 特點 保障公平性的排隊 #pragma once #include<stdlib.h> #include<stdbool.h> #include<assert.h>typedef int QDataType; typedef struct QueueNode {int v…

設計模式-結構型模式-外觀模式

外觀模式&#xff08;Facade&#xff09;&#xff0c;為子系統中的一組接口提供一個一致的界面&#xff0c;此模式定義了一個高層接口&#xff0c;這個接口使得這一子系統更加容易使用。[DP] 首先&#xff0c;定義子系統的各個組件接口和具體實現類&#xff1a; // 子系統組件接…

【C++】深入理解C++虛函數與純虛函數

文章目錄 一、虛函數&#xff08;Virtual Function&#xff09;1.1 定義和作用1.2 實現原理1.3 示例代碼1.4 虛函數的重寫定義規則注意事項示例 1.5 基類和派生類的虛函數表**示例理解** 二、純虛函數&#xff08;Pure Virtual Function&#xff09;2.1 定義和作用2.2 示例代碼…

2、事件機制、DOM操作、jquery對尺寸操作、jquery添加和刪除

一、事件機制 1、事件源.事件類型(事件處理程序) $(this)中的this不能加引號 $(#box).click(function () {$(this).css(background-color,blue)//點擊顏色變為藍色 })2、事件源.on/bind(事件類型&#xff0c;事件處理程序) $("#box").on(dbclick,function () {$(…

適配器模式在微服務的巧妙應用

適配器模式&#xff08;Adapter Pattern&#xff09;是一種結構型設計模式&#xff0c;它允許不兼容的接口之間可以一起工作。適配器模式通常用于將一個類的接口轉換成客戶端期望的另一種接口&#xff0c;從而使原本因接口不兼容而不能一起工作的類可以一起工作。 適配器模式的…

使用Haproxy搭建Web群集

Hapraxy是目前比較流行的一種群集調度工具&#xff0c;同類群集調度工具有很多&#xff0c;如LVS 和Nginx。相 比較而言&#xff0c;LVS.性能最好&#xff0c;但是搭建相對復雜:Nginx的 upstream 模塊支持群集功能&#xff0c;但是對群集節 點健康檢查功能不強&#xff0c;性能…

基于YOLOv8/YOLOv7/YOLOv6/YOLOv5的番茄成熟度檢測系統(Python+PySide6界面+訓練代碼)

摘要&#xff1a;開發番茄成熟度檢測系統對于提高農業產量和食品加工效率具有重大意義。本篇博客詳細介紹了如何利用深度學習構建一個番茄成熟度檢測系統&#xff0c;并提供了完整的實現代碼。該系統基于強大的YOLOv8算法&#xff0c;并結合了YOLOv7、YOLOv6、YOLOv5的對比&…

騰訊云幻獸帕魯服務器使用Linux和Windows操作系統,對用戶的技術要求有何不同?

騰訊云幻獸帕魯服務器使用Linux和Windows操作系統對用戶的技術要求有何不同&#xff1f; 首先&#xff0c;從操作界面的角度來看&#xff0c;Windows操作系統相對簡單易操作&#xff0c;適合那些偏好使用圖形化界面操作的用戶。而Linux操作系統則需要通過命令行完成&#xff0…

百度搜索引擎SEO優化方法

隨著互聯網的不斷發展&#xff0c;搜索引擎已經成為人們獲取信息、產品和服務的主要途徑之一。而在中國&#xff0c;百度作為最大的搜索引擎&#xff0c;其影響力不可忽視。了解并掌握百度SEO關鍵詞優化方法&#xff0c;對于提升網站在搜索引擎中的排名至關重要。 關鍵詞選擇&a…

數據結構——跳表

簡單介紹跳表 跳表&#xff08;Skip List&#xff09;是一種可以進行對數級別查找的數據結構&#xff0c;它通過在數據中構建多級索引來提高查詢效率。跳表是一種基于鏈表的隨機化數據結構&#xff0c;其本質是由多個鏈表組成&#xff0c;每個鏈表中的元素都是原始鏈表中的元素…

圖論 - Trie樹(字符串統計、最大異或對)

文章目錄 前言Part 1&#xff1a;Trie字符串統計1.題目描述輸入格式輸出格式數據范圍輸入樣例輸出樣例 2.算法 Part 2&#xff1a;最大異或對1.題目描述輸入格式輸出格式數據范圍輸入樣例輸出樣例 2.算法 前言 本篇博客將介紹Trie樹的常見應用&#xff0c;包括&#xff1a;Trie…

C++ 使用 nlohmann::json存儲json文件

C 使用 nlohmann::json存儲json文件 nlohmann::json 概述JSON 存儲的示例以追加的方式存儲json文件 nlohmann::json 概述 nlohmann::json 是 C 中一個流行的 JSON 庫&#xff0c;由 Niels Lohmann 開發。它提供了一個簡單而強大的 API&#xff0c;用于解析、構建、操作和序列化…

電子電氣架構——車載以太網協議棧

電子電氣架構——車載以太網協議棧 我是穿拖鞋的漢子&#xff0c;魔都中堅持長期主義的汽車電子工程師。 老規矩&#xff0c;分享一段喜歡的文字&#xff0c;避免自己成為高知識低文化的工程師&#xff1a; 沒有人關注你。也無需有人關注你。你必須承認自己的價值&#xff0c…

MySQL入門------數據庫與SQL概述

目錄 前言 一、數據庫相關概念 二、數據模型 1.關系型數據庫&#xff08;RDBMS&#xff09; 三、MySQL數據庫 1.下載和安裝 2.配置環境變量 四、SQL 1.SQL通用語法 2.SQL分類 前言 從本期開始&#xff0c;我們開始學習數據庫的相關理論和實踐知識&#xff0c;從入門…