Python----目標檢測(PASCAL VOC數據集)

一、PASCAL VOC數據集

????????PASCAL VOC(Visual Object Classes)數據集是計算機視覺領域中廣泛使用的一個 標準數據集,用于目標檢測、圖像分割、圖像分類、動作識別等任務。該數據集由 PASCAL(Pattern Analysis, Statistical Modelling and Computational Learning) 網絡主辦的年度挑戰賽推出,旨在推動視覺對象識別技術的發展。

PASCAL VOC 數據集可以通過官方網站下載,每個版本的圖像和標注文件都可以獨立獲取:

The PASCAL Visual Object Classes Homepage

2012年數據集下載

????????2012 年 PASCAL 視覺對象類挑戰賽 (VOC2012)

1.1、數據集的版本

????????PASCAL VOC 數據集從2005年開始發布,最常用的版本包括2007、2010和2012年 版本。每個版本包含不同數量的圖像和注釋。

VOC2007:包括5011張訓練圖像和4952張測試圖像,總共9963張圖像。包含20 個類別。

VOC2010:圖像數量比VOC2007更多,并增加了更多復雜的場景。

VOC2012:進一步增加了數據集的大小和多樣性,包含11530張訓練和驗證圖像 (未公開test)。

1.2、數據集類別

PASCAL VOC 數據集包括以下20個類別(其他類、動物類、交通工具類、家具 類):

1. Person(人)

2. Bird(鳥)

3. Cat(貓)

4. Cow(牛)

5. Dog(狗)

6. Horse(馬)

7. Sheep(羊)

8. Aeroplane(飛機)

9. Bicycle(自行車)

10. Boat(船)

11. Bus(公共汽車)

12. Car(汽車)

13. Motorbike(摩托車)

14. Train(火車)

15. Bottle(瓶子)

16. Chair(椅子)

17. Dining table(餐桌)

18. Potted plant(盆栽植物)

19. Sofa(沙發)

20. TV/monitor(電視/監視器)

1.3、?PASCAL VOC任務

1. 目標檢測:識別圖像中的所有目標,并給出每個目標的類別和邊界框。

2. 圖像分類:給出整幅圖像的類別標簽。

3. 語義分割:對圖像中的每個像素進行分類,標注其所屬類別。

4. 動作識別:識別圖像中人物的動作類別。

1.3.1、分類/檢測圖像示例

1.3.2、語義分割

定義:

????????語義分割的目標是將圖像中的每個像素分類到預定義的類別中,而不區分同一類別中 的不同個體。

特點:

????????類別級別分類:每個像素被分配到一個類別,例如,所有的汽車像素被分類為“汽 車”。

????????不區分實例:同一類別的不同個體在結果中不區分,例如,圖像中所有的汽車像 素都被標記為“汽車”,而不會區分它們屬于不同的汽車。

例子:

????????在一張包含兩只貓和一只狗的圖片中,語義分割的結果是將所有貓的像素標記為 “貓”,將狗的像素標記為“狗”,而不會區分兩只不同的貓。

應用:

????????自動駕駛汽車中的道路和障礙物檢測。

????????醫學圖像處理中的組織和器官分割。

1.3.3、實例分割?

定義:

????????實例分割的目標是將圖像中的每個像素不僅分類到預定義的類別中,還要區分同一類 別中的不同個體。

特點:

????????類別級別和實例級別分類:每個像素不僅被分配到一個類別,還被分配到一個實 例,例如,不僅區分“汽車”,還區分每輛不同的汽車。

????????區分實例:同一類別的不同個體在結果中被區分開來,例如,圖像中兩輛不同的 汽車會被標記為“汽車1”和“汽車2”。

例子:

????????在一張包含兩只貓和一只狗的圖片中,實例分割的結果是將兩只貓分別標記為“貓1” 和“貓2”,并將狗標記為“狗”。

應用:

????????機器人視覺中的對象識別和抓取。

????????計算機視覺中的多對象跟蹤和分析。

1.4、數據集結構?

PASCAL VOC 數據集的文件結構通常包括以下幾個部分:

????????JPEGImages:存放所有圖像文件,格式為JPEG。

????????Annotations:存放圖像的標注文件,格式為XML。每個XML文件對應一張圖 像,包含圖像中每個對象的類別、邊界框坐標等信息。

????????ImageSets:包含不同任務(如Main、Segmentation、Layout、Action)下的 訓練、驗證和測試集的劃分文件。

???????????????? Main:用于分類和檢測任務。

????????????????Segmentation:用于分割任務。

????????????????Layout:用于物體布局任務。

????????????????Action:用于動作識別任務。

1.5、標注文件示例

<annotation>  <!-- 文件夾名稱 -->  <folder>VOC2012</folder>  <!-- 圖像文件名 -->  <filename>2007_000033.jpg</filename>  <!-- 圖像來源信息 -->  <source>  <database>The VOC2007 Database</database> <!-- 數據庫名稱 -->  <annotation>PASCAL VOC2007</annotation> <!-- 數據集名稱 -->  <image>flickr</image> <!-- 圖像來源平臺 -->  </source>  <!-- 圖像尺寸信息 -->  <size>  <width>500</width> <!-- 圖像寬度 -->  <height>366</height> <!-- 圖像高度 -->  <depth>3</depth> <!-- 圖像深度(RGB三通道) -->  </size>  <!-- 是否進行過分割,1表示是 -->  <segmented>1</segmented>  <!-- 第一個對象(飛機) -->  <object>  <name>aeroplane</name> <!-- 對象類別:飛機 -->  <pose>Unspecified</pose> <!-- 姿態:未指定 -->  <truncated>0</truncated> <!-- 未截斷 -->  <difficult>0</difficult> <!-- 不是難以識別的對象 -->  <bndbox>  <xmin>9</xmin> <!-- 邊界框左上角X坐標 -->  <ymin>107</ymin> <!-- 邊界框左上角Y坐標 -->  <xmax>499</xmax> <!-- 邊界框右下角X坐標 -->  <ymax>263</ymax> <!-- 邊界框右下角Y坐標 -->  </bndbox>  </object>  <!-- 第二個對象(飛機) -->  <object>  <name>aeroplane</name> <!-- 對象類別:飛機 -->  <pose>Left</pose> <!-- 姿態:向左 -->  <truncated>0</truncated> <!-- 未截斷 -->  <difficult>0</difficult> <!-- 不是難以識別的對象 -->  <bndbox>  <xmin>421</xmin> <!-- 邊界框左上角X坐標 -->  <ymin>200</ymin> <!-- 邊界框左上角Y坐標 -->  <xmax>482</xmax> <!-- 邊界框右下角X坐標 -->  <ymax>226</ymax> <!-- 邊界框右下角Y坐標 -->  </bndbox>  </object>  <!-- 第三個對象(飛機,部分被截斷) -->  <object>  <name>aeroplane</name> <!-- 對象類別:飛機 -->  <pose>Left</pose> <!-- 姿態:向左 -->  <truncated>1</truncated> <!-- 被截斷 -->  <difficult>0</difficult> <!-- 不是難以識別的對象 -->  <bndbox>  <xmin>325</xmin> <!-- 邊界框左上角X坐標 -->  <ymin>188</ymin> <!-- 邊界框左上角Y坐標 -->  <xmax>411</xmax> <!-- 邊界框右下角X坐標 -->  <ymax>223</ymax> <!-- 邊界框右下角Y坐標 -->  </bndbox>  </object>  
</annotation>  

本文來自互聯網用戶投稿,該文觀點僅代表作者本人,不代表本站立場。本站僅提供信息存儲空間服務,不擁有所有權,不承擔相關法律責任。
如若轉載,請注明出處:http://www.pswp.cn/bicheng/81759.shtml
繁體地址,請注明出處:http://hk.pswp.cn/bicheng/81759.shtml
英文地址,請注明出處:http://en.pswp.cn/bicheng/81759.shtml

如若內容造成侵權/違法違規/事實不符,請聯系多彩編程網進行投訴反饋email:809451989@qq.com,一經查實,立即刪除!

相關文章

mariadb 升級 (通過yum)

* 注意下 服務名, 有的服務器上是mysql,有的叫mariadb,mysqld的 #停止 systemctl stop mysql #修改源 vi /etc/yum.repos.d/MariaDB.repo baseurl http://yum.mariadb.org/11.4/centos7-amd64 #卸載 yum remove mysql #安裝 yum install MariaDB-server galera-4 MariaDB-…

vuejs處理后端返回數字類型精度丟失問題

標題問題描述 后端返回數據有5.00和3.30這種數據&#xff0c;但是前端展示的時候返回對應分別為5和3.0&#xff0c;小數點后0都丟失了。 接口返回數據展示network-Response&#xff1a; 接口返回數據展示network-Preview&#xff1a; 錯誤數據效果展示 發現問題 瀏覽器接口…

ubuntu kubeasz 部署高可用k8s 集群

ubuntu kubeasz 部署高可用k8s 集群 測試環境主機列表軟件清單kubeasz 部署高可用 kubernetes配置源配置host文件安裝 ansible 并進行 ssh 免密登錄:下載 kubeasz 項?及組件部署集群部署各組件開始安裝修改 config 配置文件增加 master 節點增加 kube_node 節點登錄dashboard…

IDEA2025版本使用Big Data Tools連接Linux上Hadoop的HDFS

目錄 Windows的準備 1. 將與Linux上版本相同的hadoop壓縮包解壓到本地 ?編輯2.設置$HADOOP HOME環境變量指向:E:\hadoop-3.3.4 3.下載hadoop.dll和winutils.exe文件 4.將hadoop.dll和winutils.exe放入$HADOOP HOME/bin中 IDEA中操作 1.下載Big Data Tools插件 2.添加并連…

Java轉Go日記(三十九):Gorm查詢

1.1.1. 查詢 // 獲取第一條記錄&#xff0c;按主鍵排序db.First(&user)SELECT * FROM users ORDER BY id LIMIT 1;// 獲取最后一條記錄&#xff0c;按主鍵排序db.Last(&user)SELECT * FROM users ORDER BY id DESC LIMIT 1;// 獲取所有記錄db.Find(&users)SELECT *…

bisheng系列(二)- 本地部署(前后端)

一、導讀 環境&#xff1a;Ubuntu 24.04、open Euler 23.03、Windows 11、WSL 2、Python 3.10 、bisheng 1.1.1 背景&#xff1a;需要bisheng二開商用&#xff0c;故而此處進行本地部署&#xff0c;便于后期調試開發 時間&#xff1a;20250519 說明&#xff1a;bisheng前后…

5G金融互聯:邁向未來金融服務的極速與智能新時代

5G金融互聯:邁向未來金融服務的極速與智能新時代 大家好,我是Echo_Wish,今天咱們聊聊一個大家都十分關心的話題:5G網絡在金融服務中的應用。咱們平時可能覺得5G只是打個電話、刷個視頻更流暢了,但在金融服務領域,5G的低延時、大帶寬和高可靠性正在悄然改變整個游戲規則。…

UE5 GAS框架解析內部數據處理機制——服務器與客戶端

當&#xff0c; gas通過點擊鼠標光標觸發事件時&#xff0c;內部的處理機制。 當通過點擊事件&#xff0c;命中中目標時&#xff0c; 可獲取到對應的TargetData 目標數據。處理相應的操作。 僅有本地的客戶端的情況下。命中并不會有什么異常。 當存在服務器時&#xff0c; 服…

Golang的Web應用架構設計

# Golang的Web應用架構設計 介紹 是一種快速、高效、可靠的編程語言&#xff0c;它在Web應用開發中越來越受歡迎。Golang的Web應用架構設計通常包括前端、后端和數據庫三個部分。在本篇文章中&#xff0c;我們將詳細介紹Golang的Web應用架構設計及其組成部分。 前端 在Golang的…

對比 HTTP-REST 與 gRPC:各自的優缺點以及適用的場景

文章目錄 對比 HTTP-REST 與 gRPC&#xff1a;各自的優缺點以及適用的場景HTTP-REST 與 gRPC 的核心區別gRPC 的優缺點HTTP-REST 的優缺點適用場景 模糊點什么是 Protobuf&#xff1f;HTTP/2 會將 HTTP 消息拆分并封裝為二進制幀&#xff0c;那還能過使用 HTTP/2 構建 RESTful …

現代健康生活養生指南

現代社會中&#xff0c;熬夜加班、久坐不動、飲食不規律成為許多人的生活常態&#xff0c;由此引發的健康問題也日益增多。想要擺脫亞健康&#xff0c;不必依賴中醫理念&#xff0c;從以下這些現代科學養生方法入手&#xff0c;就能逐步改善身體狀況。? 飲食上&#xff0c;注…

Go語言數組的定義與操作 - 《Go語言實戰指南》

在 Go 語言中&#xff0c;數組&#xff08;Array&#xff09; 是一種定長、同類型的集合。它在內存中是連續分布的&#xff0c;適合用于性能敏感的場景。 一、數組的定義 數組的基本語法如下&#xff1a; var 數組名 [長度]元素類型 示例&#xff1a; var nums [5]int …

Helm Chart 中配置多個 Docker Registry 地址以實現備用訪問

在 Helm Chart 中配置多個 Docker Registry 地址以實現備用訪問&#xff0c;可以通過以下幾種方式實現&#xff1a; 1. 在 values.yaml 中定義多個 Registry 在 values.yaml 中定義主 Registry 和備用 Registry&#xff0c;以便在部署時靈活切換&#xff1a; # values.yaml …

云原生安全:錯誤策略S3存儲桶ACL設置為Everyone:FullControl

??「炎碼工坊」技術彈藥已裝填! 點擊關注 → 解鎖工業級干貨【工具實測|項目避坑|源碼燃燒指南】 ——從基礎到實踐的深度解析 1. 基礎概念 S3存儲桶與ACL Amazon S3(Simple Storage Service)是AWS提供的對象存儲服務,支持存儲和檢索任意規模的數據。ACL(訪問控制列表…

.NET 8 kestrel 配置PEM,實現內網https

一、生成證書 mkcert 是一個簡單的工具&#xff0c;用于制作本地信任的開發證書。它不需要配置。 mkcert官方倉庫地址&#xff1a;GitHub - FiloSottile/mkcert: A simple zero-config tool to make locally trusted development certificates with any names youd like. 簡…

nodejs快速入門到精通1

參考 nodejs快速入門到精通 菜鳥教程-nodejs nodejs官方文檔 原因 視頻免費 資料收費 筆記還是自己寫吧 安裝 nodejs官網 windows下&#xff1a; #查看nodejs版本 node -v #查看npm版本 npm -v #設置npm為淘寶鏡像源 npm config set registry https://registry.npmmirror.…

nginx負載均衡及keepalive高可用

實驗前期準備&#xff1a; 5臺虛擬機&#xff1a;4臺當做服務器&#xff0c;1臺當做客戶機&#xff08;當然&#xff0c;也可以使用主機的瀏覽器&#xff09;&#xff0c;4臺服務器中&#xff0c;2臺服務器當做后端真實訪問服務器&#xff1b;另外2臺服務器當做負載均衡服務器…

go語法大賞

前些日子單機房穩定性下降&#xff0c;找了好一會才找到真正的原因。這里面涉及到不少go語法細節&#xff0c;正好大家一起看一下。 一、仿真代碼 這是仿真之后的代碼 package mainimport ("fmt""go.uber.org/atomic""time" )type StopSignal…

Android 14 解決打開app出現不兼容彈窗的問題

應用安裝到 Android 14 上&#xff0c;出現如下提示 This app isn’t compatible with the latest version of Android. Check for an update or contact the app’s developer. 通過源碼找原因。 提示的字符 根據字符找到 ./frameworks/base/core/res/res/values/strings.xm…

Linux句柄數過多問題排查

以下是Linux句柄數過多問題的排查與解決方法整理&#xff1a; 一、檢測句柄使用情況 1?.查看系統限制? 單個進程限制&#xff1a;ulimit -n 系統級總限制&#xff1a;cat /proc/sys/fs/file-max 2?.統計進程占用量? 查看指定進程&#xff1a;lsof -p <PID> | wc -…