【YOLOv11-目標檢測】目標檢測數據格式(官方說明)

原文鏈接:
https://docs.ultralytics.com/datasets/detect/

寫在前面

訓練一個魯棒且準確的目標檢測模型需要一個全面的數據集。本文介紹:與Ultralytics YOLO模型兼容的各種數據集格式,并深入解析了它們的結構、使用方法以及如何在不同的格式之間進行轉換。

支持的數據集格式

Ultralytics YOLO格式

Ultralytics YOLO格式是一種數據集配置格式,允許您定義數據集根目錄、訓練/驗證/測試圖像目錄的相對路徑(或包含圖像路徑的*.txt文件)以及類別名稱的字典。以下是一個示例:

# Ultralytics 🚀 AGPL-3.0許可證 - https://ultralytics.com/license# COCO8數據集(來自COCO train2017的前8張圖像)由Ultralytics提供  
# 文檔:https://docs.ultralytics.com/datasets/detect/coco8/  
# 示例用法:yolo train data=coco8.yaml  
# 父目錄  
# ├── ultralytics  
# └── datasets  
#     └── coco8  ← 下載至此(1 MB)  # 訓練/驗證/測試集可以是:1) 目錄:path/to/imgs,2) 文件:path/to/imgs.txt,或3) 列表:[path/to/imgs1, path/to/imgs2, ...]  
path: coco8  # 數據集根目錄  
train: images/train  # 訓練圖像(相對于'path')4張圖像  
val: images/val  # 驗證圖像(相對于'path')4張圖像  
test:  # 測試圖像(可選)  # 類別  
names:  0: person  1: bicycle  2: car  3: motorcycle  4: airplane  5: bus  6: train  7: truck  8: boat  9: traffic light  10: fire hydrant  11: stop sign  12: parking meter  13: bench  14: bird  15: cat  16: dog  17: horse  18: sheep  19: cow  20: elephant  21: bear  22: zebra  23: giraffe  24: backpack  25: umbrella  26: handbag  27: tie  28: suitcase  29: frisbee  30: skis  31: snowboard  32: sports ball  33: kite  34: baseball bat  35: baseball glove  36: skateboard  37: surfboard  38: tennis racket  39: bottle  40: wine glass  41: cup  42: fork  43: knife  44: spoon  45: bowl  46: banana  47: apple  48: sandwich  49: orange  50: broccoli  51: carrot  52: hot dog  53: pizza  54: donut  55: cake  56: chair  57: couch  58: potted plant  59: bed  60: dining table  61: toilet  62: tv  63: laptop  64: mouse  65: remote  66: keyboard  67: cell phone  68: microwave  69: oven  70: toaster  71: sink  72: refrigerator  73: book  74: clock  75: vase  76: scissors  77: teddy bear  78: hair drier  79: toothbrush  # 下載腳本/URL(可選)  
download: https://github.com/ultralytics/assets/releases/download/v0.0.0/coco8.zip  

此格式的標簽應以YOLO格式導出,每張圖像對應一個*.txt文件。如果圖像中沒有目標,則不需要*.txt文件。*.txt文件的格式應為每行一個目標,格式為class x_center y_center width height。框坐標必須為歸一化的xywh格式(0到1之間)。如果您的框坐標是像素值,應將x_center和寬度除以圖像寬度,y_center和高度除以圖像高度。類別編號應從0開始(即0為第一個類別)。

示例標注圖像

與上圖對應的標簽文件包含2個人(類別0)和1個領帶(類別27):

示例標簽文件
0 0.5 0.5 0.1 0.2  
0 0.7 0.7 0.1 0.2  
27 0.3 0.3 0.05 0.1  

使用Ultralytics YOLO格式時,請按照以下COCO8數據集的示例組織您的訓練和驗證圖像及標簽。

示例數據集目錄結構
datasets/  
└── coco8/  ├── images/  │   ├── train/  # 訓練圖像  │   └── val/    # 驗證圖像  └── labels/  ├── train/  # 訓練標簽  └── val/    # 驗證標簽  

使用方法

以下是使用這些格式訓練模型的示例:

from ultralytics import YOLO  # 加載模型  
model = YOLO("yolo11n.pt")  # 加載預訓練模型(推薦用于訓練)  # 訓練模型  
results = model.train(data="coco8.yaml", epochs=100, imgsz=640)  

支持的數據集

以下是支持的數據集及其簡要描述:

  • Argoverse:包含來自城市環境的3D跟蹤和運動預測數據,帶有豐富的標注。
  • COCO:Common Objects in Context (COCO)是一個大規模的目標檢測、分割和字幕生成數據集,包含80個目標類別。
  • LVIS:一個大規模的目標檢測、分割和字幕生成數據集,包含1203個目標類別。
  • COCO8:從COCO train和COCO val中提取的前4張圖像的小型子集,適合快速測試。
  • COCO8-Grayscale:通過將RGB轉換為灰度創建的COCO8灰度版本,適用于單通道模型評估。
  • COCO8-Multispectral:通過插值RGB波長創建的10通道多光譜版本,適用于光譜感知模型評估。
  • COCO128:從COCO train和COCO val中提取的前128張圖像的小型子集,適合測試。
  • Global Wheat 2020:包含2020年全球小麥挑戰賽的小麥穗圖像的數據集。
  • Objects365:一個高質量、大規模的目標檢測數據集,包含365個目標類別和超過60萬張標注圖像。
  • OpenImagesV7:谷歌提供的全面數據集,包含170萬張訓練圖像和4.2萬張驗證圖像。
  • SKU-110K:一個零售環境中的密集目標檢測數據集,包含超過1.1萬張圖像和170萬個邊界框。
  • HomeObjects-3K New 🚀:包含室內家居物品(如床、椅子、電視等)的數據集,適用于智能家居自動化、機器人、增強現實和房間布局分析等應用。
  • VisDrone:包含無人機捕獲圖像的目標檢測和多目標跟蹤數據,超過1萬張圖像和視頻序列。
  • VOC:Pascal Visual Object Classes (VOC)數據集,用于目標檢測和分割,包含20個目標類別和超過1.1萬張圖像。
  • xView:用于俯視圖像中目標檢測的數據集,包含60個目標類別和超過100萬個標注目標。
  • Roboflow 100:一個多樣化的目標檢測基準,包含100個數據集,涵蓋7個圖像領域,用于全面模型評估。
  • Brain-tumor:用于檢測腦腫瘤的數據集,包含MRI或CT掃描圖像,標注了腫瘤的存在、位置和特征。
  • African-wildlife:包含非洲野生動物(如水牛、大象、犀牛和斑馬)圖像的數據集。
  • Signature:包含各種文檔的簽名標注圖像,支持文檔驗證和欺詐檢測研究。
  • Medical-pills:包含醫療藥丸圖像的數據集,適用于藥品質量保證、藥丸分類和法規遵從等應用。

添加您自己的數據集

如果您有自己的數據集并希望用于訓練Ultralytics YOLO模型,請確保其遵循上述“Ultralytics YOLO格式”中指定的格式。將您的標注轉換為所需格式,并在YAML配置文件中指定路徑、類別數量和類別名稱。

移植或轉換標簽格式

從COCO數據集格式轉換為YOLO格式

您可以使用以下代碼片段輕松將流行的COCO數據集格式的標簽轉換為YOLO格式:

from ultralytics.data.converter import convert_coco  convert_coco(labels_dir="path/to/coco/annotations/")  

此轉換工具可用于將COCO數據集或任何COCO格式的數據集轉換為Ultralytics YOLO格式。該過程將基于JSON的COCO標注轉換為更簡單的基于文本的YOLO格式,使其與Ultralytics YOLO模型兼容。

請務必檢查您要使用的數據集是否與您的模型兼容,并遵循必要的格式約定。正確格式化的數據集對于訓練成功的目標檢測模型至關重要。

常見問題

什么是Ultralytics YOLO數據集格式?如何構建它?

Ultralytics YOLO格式是一種用于定義訓練項目中數據集的結構化配置。它涉及設置訓練、驗證和測試圖像及其對應標簽的路徑。例如:

path: coco8  # 數據集根目錄  
train: images/train  # 訓練圖像(相對于'path')  
val: images/val  # 驗證圖像(相對于'path')  
test:  # 測試圖像(可選)  # 類別  
names:  0: person  1: bicycle  ...  

標簽保存在*.txt文件中,每張圖像對應一個文件,格式為class x_center y_center width height,坐標已歸一化。詳細指南請參考COCO8數據集示例。

如何將COCO數據集轉換為YOLO格式?

您可以使用Ultralytics的轉換工具將COCO數據集轉換為YOLO格式。以下是一個快速方法:

from ultralytics.data.converter import convert_coco  convert_coco(labels_dir="path/to/coco/annotations/")  

此代碼將您的COCO標注轉換為YOLO格式,實現與Ultralytics YOLO模型的無縫集成。更多詳情請訪問“移植或轉換標簽格式”部分。

Ultralytics YOLO支持哪些目標檢測數據集?

Ultralytics YOLO支持多種數據集,包括:

  • Argoverse
  • COCO
  • LVIS
  • COCO8
  • Global Wheat 2020
  • Objects365
  • OpenImagesV7

每個數據集頁面都提供了針對YOLO11訓練優化的詳細結構和用法信息。完整列表請參閱“支持的數據集”部分。

如何使用我的數據集開始訓練YOLO11模型?

要開始訓練YOLO11模型,請確保您的數據集格式正確,并在YAML文件中定義路徑。使用以下腳本開始訓練:

from ultralytics import YOLO  model = YOLO("yolo11n.pt")  # 加載預訓練模型  
results = model.train(data="path/to/your_dataset.yaml", epochs=100, imgsz=640)  

更多關于使用不同模式(包括CLI命令)的詳細信息,請參考“使用方法”部分。

在哪里可以找到使用Ultralytics YOLO進行目標檢測的實際示例?

Ultralytics提供了許多示例和實用指南,展示了YOLO11在多種應用中的使用。完整概述請訪問Ultralytics博客,您可以找到目標檢測、分割等的案例研究、詳細教程和社區故事。具體示例請查看文檔中的“使用方法”部分。

本文來自互聯網用戶投稿,該文觀點僅代表作者本人,不代表本站立場。本站僅提供信息存儲空間服務,不擁有所有權,不承擔相關法律責任。
如若轉載,請注明出處:http://www.pswp.cn/news/913752.shtml
繁體地址,請注明出處:http://hk.pswp.cn/news/913752.shtml
英文地址,請注明出處:http://en.pswp.cn/news/913752.shtml

如若內容造成侵權/違法違規/事實不符,請聯系多彩編程網進行投訴反饋email:809451989@qq.com,一經查實,立即刪除!

相關文章

yolo8實現目標檢測

?步驟一:安裝 PyTorch(M1 專用)# 推薦使用官方 MPS 后端(Apple Metal 加速) pip install torch torchvision torchaudio確認是否使用了 Apple MPS:import torch print(torch.backends.mps.is_available()…

安全管理協議(SMP):配對流程、密鑰生成與防中間人攻擊——藍牙面試核心考點精解

一、SMP 核心知識點高頻考點解析1.1 SMP 在藍牙安全體系中的定位考點:SMP 的功能與協議棧位置解析: SMP(Security Manager Protocol,安全管理協議)是藍牙核心規范中負責設備配對、密鑰生成與安全連接的關鍵協議&#x…

U盤實現——U 盤類特殊命令

文章目錄 U 盤類特殊命令U 盤的命令封包命令階段數據階段狀態階段get max luninquiry(0x12)read format capacities(0x23)read capacity(0x25)mode sense(0x1a)test unit ready(0x00)read(10) 0x28write(10) 0x2aU 盤類特殊命令 U 盤的命令封包 命令階段 命令階段主要由主機通…

深度帖:瀏覽器的事件循環與JS異步

一、瀏覽器進程 早期的瀏覽器是單進程的,所有功能雜糅在一個進程中;現在的瀏覽器是多進程的,包含瀏覽器進程、網絡進程、渲染進程等等,每個進程負責的工作不同。瀏覽器進程:負責界面顯示(地址欄、書簽、歷史…

Linux網絡:UDP socket創建流程與簡單通信

本文介紹 UDP 服務端與客戶端 的創建流程&#xff0c;和相關的函數接口 核心流程 創建 socket → socket()填寫服務器地址信息 → sockaddr_in 結構體綁定地址和端口 → bind()接收并響應客戶端數據 → recvfrom() / sendto()socket() #include<sys/so…

windows內核研究(系統調用 1)

WindowsAPI函數的調用過程什么是WindowsApi&#xff1f;Windows API&#xff08;Application Programming Interface&#xff0c;應用程序編程接口&#xff09;是微軟為Windows操作系統提供的一套系統級編程接口&#xff0c;允許開發者與操作系統內核、硬件、系統服務等進行交互…

【前端】異步任務風控驗證與輪詢機制技術方案(通用筆記版)

一、背景場景 在某類生成任務中&#xff0c;例如用戶點擊“執行任務”按鈕后觸發一個較耗時的后端操作&#xff08;如生成報告、渲染圖像、轉碼視頻等&#xff09;&#xff0c;由于其調用了模型、渲染服務或需要較長處理時間&#xff0c;為了防止接口被頻繁惡意調用&#xff0c…

Vim 編輯器常用操作詳解(新手快速上手指南)

&#x1f4bb; Vim 編輯器常用操作詳解&#xff08;新手快速上手指南&#xff09;作者&#xff1a;Lixin 日期&#xff1a;2025-07-09 學習內容&#xff1a;Vim 編輯器基礎 常用快捷鍵 Xshell/Xftp連接 Linux基本操作 學習目標&#xff1a;掌握 Vim 的三種常用模式切換與基本…

OpenGL 生成深度圖與點云

文章目錄 一、簡介二、實現代碼三、實現效果一、簡介 這里基于OpenGL實現對一個Mesh對象深度圖的獲取,思路其實很簡單,直接通過glReadPixels函數獲取整個OpenGL中的深度緩沖數據即可;那么反過來我們如果有了這個深度圖之后,也可以基于每個像素點的深度值,反算出圖像中的深…

25春云曦期末考復現

Web 瘋狂星期四 <?php$tg1u$_GET[tg1u];if(!preg_match("/0|1|[3-9]|\~|\|\|\#|\\$|\%|\^|\&|\*|\&#xff08;|\&#xff09;|\-|\|\|\{|\[|\]|\}|\:|\|\"|\,|\<|\.|\>|\/|\?|\\\\|localeconv|pos|current|print|var|dump|getallheaders|get|define…

從Prompt到預訓練:掌握大模型核心技術的階梯式進化

本文較長&#xff0c;建議點贊收藏&#xff0c;以免遺失。更多AI大模型應用開發學習視頻及資料&#xff0c;盡在聚客AI學院。 在探討大模型&#xff08;LLM&#xff09;的四階段技術時&#xff0c;我們可以從Prompt Engineering&#xff08;提示工程&#xff09;、AI Agent&…

手機文件夾隱藏工具,一鍵保護隱私

軟件介紹 今天為大家推薦一款手機文件夾隱藏工具——Amarok&#xff0c;它能幫助用戶快速隱藏手機中的私密文件夾&#xff0c;保護個人隱私。 核心功能 Amarok主打文件夾隱藏功能&#xff0c;操作簡單便捷。需要注意的是&#xff0c;雖然軟件支持應用隱藏功能&#xff0…

day10-Redis面試篇

經過前幾天的學習&#xff0c;大家已經掌握了微服務相關技術的實際應用&#xff0c;能夠應對企業開發的要求了。不過大家都知道在IT領域往往都是面試造火箭&#xff0c;實際工作擰螺絲。為了更好的應對面試&#xff0c;讓大家能拿到更高的offer&#xff0c;我們接下來就講講“造…

Axure版本Element組件庫-免費版

Axure版本的Element組件庫基于Element UI/Plus設計規范開發&#xff0c;涵蓋了從基礎元素到復雜交互的全品類組件&#xff0c;能高效支撐各類Web原型設計&#xff0c;尤其適合后臺管理系統、企業級應用等場景。以下從核心類別展開詳細介紹&#xff1a; 鏈接地址 添加圖片注釋&a…

記一次JVM問題排查

今天遇到了1次OOM&#xff0c;導入萬條數據的Excel于是讓運維進行排查。正式環境顯示內存還有很多 于是我說讓運維加上參數 -XX:HeapDumpOnOutOfMemoryError&#xff0c;出現OOM的時候dump到文件中&#xff0c;將堆內存設置為4G&#xff0c;在Idea上進行測試于是讓運維在生產環…

快手Kwai Keye-VL多模態大模型模型架構、訓練策略、數據情況

快速看一下Kwai Keye-VL的技術報告&#xff0c; 模型架構 Keye-VL和經典的MLLM架構類似&#xff0c;由ViTMLPLLM組成。視覺側有兩點可以看看&#xff1a; 1、具有原生分辨率的視覺編碼器 提到&#xff0c;MLLMs使用預訓練的固定分辨率ViT作為視覺編碼器。然而&#xff0c;這…

前端-CSS-day2

目錄 1、后代選擇器 2、子代選擇器 3、并集選擇器 4、交集選擇器 5、偽類選擇器 6、超鏈接偽類 7、CSS特性-繼承性 8、CSS特性-層疊性 9、CSS特性-優先級 10、優先級-疊加計算 11、Emmet寫法 12、背景圖 13、背景圖平鋪方式 14、背景圖位置 15、背景圖縮放 16、…

米思齊2.0 3.0 mixly arduino 編程軟件下載安裝及詳情使用指南 導入庫文件方法 支持8266 esp32

一、米思齊軟件下載及安裝 1、 米思齊軟件下載 https://item.taobao.com/item.htm?id883253312209 2、軟件版本簡單說明&#xff1a; a、 Windows版本&#xff08;建議win10及以上系統使用&#xff09;&#xff1a; 一鍵更新完整版 2.8GB-3GB&#xff1a;下載后解壓即可使…

結構體指針:使用結構體指針訪問和修改結構體成員。

知識點結構體指針Employee *p; 保存結構體的地址&#xff1b;p->member 用箭頭運算符訪問或修改成員。數組與指針Employee *emps malloc(N * sizeof *emps); 動態創建結構體數組&#xff1b;p < emps N 與 p 配合遍歷。scanf 與數組退化p->name 是 char name[50] 的…

支持零樣本和少樣本的文本到語音48k star的配音工具:GPT-SoVITS-WebUI

支持零樣本和少樣本的文本到語音48k star的配音工具&#xff1a;GPT-SoVITS-WebUI 官網&#xff1a;RVC-Boss/GPT-SoVITS: 1 min voice data can also be used to train a good TTS model! (few shot voice cloning) 用戶手冊&#xff1a;GPT-SoVITS指南 功能 零樣本文本到語…