深度學習基礎--目標檢測入門簡介

在這里插入圖片描述

博主簡介:努力學習的22級本科生一枚 🌟?
博客主頁:羊小豬~~-CSDN博客
內容簡介:探索AI算法,C++,go語言的世界;在迷茫中尋找光芒?🌸?
往期回顧:yolov5基礎–一步一步教你訓練自己的數據集-CSDN博客

文章目錄

  • 1. 基礎概念
    • 1.1 目標檢測定義
    • 1.2 圖像識別任務
    • 1.3 目標檢測核心問題
    • 1.4 物體檢測概述
    • 1.5 錨框
      • 概念
      • IoU–交并比
      • 賦予錨框標號
      • NMS
  • 2. 評價指標
    • 2.1 TP、TN、FP、FN
    • 2.2 precision和recall
    • 2.3 置信度
    • 2.4 AP和mAP
  • 3. 參考資料

1. 基礎概念

1.1 目標檢測定義

📚 一句話,找出圖像中感興趣的物體,確定其位置和類別。

由于物體類別不同,其形狀、外觀、姿態都不同,而且還受環境的影響,故在cv領域,目標檢測一直都是一個很熱門的話題。

1.2 圖像識別任務

  • 分類:解決“是什么”,給一張圖判斷包含什么類別物體;
  • 定位:解決“在哪里”,即定位目標的位置;
  • 👀 目標檢測“:解決是什么,在哪里”,定位這個目標的位置并且知道目標檢測的物體的位置,本人感覺是分類和定位的結合體
  • 分割:解決“每個像素點屬于哪個目標物體”;

1.3 目標檢測核心問題

  • 位置的任意性,目標可以出現在圖片的任何位置;

    • 在這里插入圖片描述
  • 大小的多樣性,同一張圖像可能同時出現多個不同或者相同的目標,但是他們大小差異大;

    • 在這里插入圖片描述
  • 形態的差異性,同一目標的形態差異可能很大,故同一個物體在目標檢測中可能形狀各部相同;

    • 在這里插入圖片描述

1.4 物體檢測概述

🐶 目標檢測任務:找出每個物體,類別標注出來,還需要找出具體的位置,位置通常用邊緣框表示

在這里插入圖片描述


邊緣框概念

用一個邊框框主一個物體,如圖:

在這里插入圖片描述

這個圖要注意一下:坐標系和普通不太一樣,主要是坐標。

所以,如果物體很多,那需要的成本也是需要很高的。


目標檢測數據集

  • 每一行表示一個物體
    • 圖片文件名,物體類別,邊緣框

1.5 錨框

概念

📄 用李沐老師的話說:就是計算機視覺的算法生成的一些框用來預測變化的框。

一類目標檢測的算法是基礎錨框的,如圖:
在這里插入圖片描述

提出多個框(錨框),首先做分類,是否有需要的目標物體,如果有則以這個框為主移動,直到框住的是目標物體,即真實的邊緣框。

IoU–交并比

👀 上面提到,物體檢測首先是用多個框框物體,所以這就涉及到如何進行不同框合并的問題,因為對于一個物體來說(假設他比較大哈),那么在他附近的圖相識度一定很高,故需要進行框的合并。

在這里插入圖片描述

Jacqard指數是衡量兩個框的相似度。

賦予錨框標號

🔬 假設:一個沒有訓練的模型,每個像素都需要生產幾個錨框;

📚 假設結果

  • 這樣就造成了一張圖片需要生成大量的錨框,導致大量的負類樣本框(框住的不是目標物體);
  • 無論圖片物體多還是少,對于需要預測的一個物體來說,這個模型在這種圖片分類只有兩種,一個是目標物體,一個是其他,故,這里就需要一個標注的東西,來標注生成的錨框是目標物體來說其他

在這里插入圖片描述


給錨框分配對應的真實框

📘 以李沐老師上課圖所示:

在這里插入圖片描述

提示:本文給圖片進行標號,從左到右為圖1,圖2,圖3。

👀 圖片描述,以圖片1為例,列向表示真實物體的邊緣框,行表示生產的錨框。

🍲 步驟:

  1. 先計算出所有的錨框和真實框的IoU,IoU值填入對應的格子中,;
  2. 找到矩陣中最大的元素,如圖1,假設最大值為x23的框,說明錨框2和邊緣框重合度最高,即用錨框2代表真實邊緣框3;
  3. 每次找到后,將那一行、列刪除,繼續重復步驟2.

NMS

預測時,傳入一張圖片,模型依然生成一大堆框,然后會根據訓練出來的偏移等參數預測錨框;這些框,會有很多重疊的類似的框,圍著同一個目標輸出;所以,就需要一個算法來去重,NMS就是其中之一。

在這里插入圖片描述

🔬 分析,以狗分析。

  • 第一步,選取預測概率最大的,這里是dog=0.9
  • 第二步是去除,就是去除重復面積大于某一個IoU值的預測,這里出去的是dog=0.8,dog=0.7,這樣就剩下一個框,就是第一步選中的;
  • 重復第二步操作。

2. 評價指標

2.1 TP、TN、FP、FN

這四個是分類最常用的了,無論是圖像分類還是文本分類,都用這幾個作為評價指標。

👀 T或者F代表的是該樣本是否被正確分類,P或者N代表的是該樣本被預測成了正樣本還是負樣本。

  • TP(True Positives)意思就是被分為了正樣本,而且分對了,
  • TN(True Negatives)意思就是被分為了負樣本,而且分對了
  • FP(False Positives)意思就是被分為了正樣本,但是分錯了(事實上這個樣本是負樣本)
  • FN(False Negatives)意思就是被分為了負樣本,但是分錯了(事實上這個樣本是正樣本)

一般對于分類來說,一般都會制作一個混淆矩陣,以上指標都很直觀的展示出來了。

2.2 precision和recall

這個也是分類的常用指標。

precision

在這里插入圖片描述

👀 解釋:分類器分類的正類占總樣本正類的比例,說白了就是分類模型預測為正的占總體樣本的比例;

recall

在這里插入圖片描述

👀 解釋:分類器認為的正類樣本且確實是正類的樣本占所有樣本中確實是正類樣本的比例。

2.3 置信度

這個是一個統計學的概念,舉個例子,一個樣本中:

在這里插入圖片描述

如果說置信度設置為0.95的話,那么目標檢測算法將把1設置為正樣本,其他都是負樣本。

2.4 AP和mAP

AP其實就是precision和recall的組合畫出的圖像,如下圖所示:

在這里插入圖片描述

AP值就是上圖畫的那條曲線下的面積,面積越大,代表模型效果越好,這個和AUC值我感覺很像。

mAP就是AP的平均值。

3. 參考資料

  • 【41 物體檢測和數據集【動手學深度學習v2】】https://www.bilibili.com/video/BV1Lh411Y7LX?vd_source=1fd424333dd77a7d3e2e741f7d6fd4ee
  • 【42 錨框【動手學深度學習v2】】https://www.bilibili.com/video/BV1aB4y1K7za?vd_source=1fd424333dd77a7d3e2e741f7d6fd4ee
  • 簡單理解錨框(anchor box)生成過程 - 知乎
  • 《目標檢測藍皮書》第5篇 目標檢測基礎-CSDN博客

本文來自互聯網用戶投稿,該文觀點僅代表作者本人,不代表本站立場。本站僅提供信息存儲空間服務,不擁有所有權,不承擔相關法律責任。
如若轉載,請注明出處:http://www.pswp.cn/web/78002.shtml
繁體地址,請注明出處:http://hk.pswp.cn/web/78002.shtml
英文地址,請注明出處:http://en.pswp.cn/web/78002.shtml

如若內容造成侵權/違法違規/事實不符,請聯系多彩編程網進行投訴反饋email:809451989@qq.com,一經查實,立即刪除!

相關文章

雅思寫作--70個高頻表達

文章目錄 1. learn new skills學生通過戶外活動學到很多新技2. take immediate action to do各國采取有效行動以保護環境政府采取了必要行動以減少失業。你應該立即采取行動來解3. communication skills4. grow significantly5. have many advantages1. learn new skills “lea…

深入理解虛擬機與容器:原理、對比與應用場景分析

目錄 前言1 虛擬機技術詳解1.1 虛擬機的基本原理1.2 虛擬機的優勢與局限 2 容器技術詳解2.1 容器的運行機制2.2 容器的優勢與局限 3 虛擬機與容器的核心差異對比3.1 架構對比3.2 啟動速度與資源消耗3.3 安全性與隔離性3.4 兼容性與遷移性 4 實際應用場景分析4.1 適合使用虛擬機…

SQL Server數據庫提權的幾種方法——提權教程

SQL Server數據庫提權的幾種方法——提權教程 一、簡介 在利用系統溢出漏洞沒有效果的情況下,可以采用數據庫進行提權。 數據庫提權的前提條件: 1、服務器開啟數據庫服務 2、獲取到最高權限用戶密碼 (除Access數據庫外,其他數據庫基本都存在數據庫提權的可能) 二、使用x…

【第19節 信息加解密技術】

本章目錄: 一、節概述二、知識詳解1. 信息加密的基本分類2. 對稱加密算法詳解3. 非對稱加密算法詳解4. 密鑰控制技術5. 密鑰分發機制6. 公鑰體系的密鑰管理機制7. 密鑰分類與生成 三、關鍵點提煉四、考試提示五、總結與建議 一、節概述 在信息安全體系中,信息加解密…

記錄搭建自己的應用中心-需求看板搭建

記錄搭建自己的應用中心-需求看板搭建 人員管理新增用戶組織用戶登錄和操作看板狀態看板任務通知任務詳情 人員管理 由于不是所有人都有應用管理權限,所以額外做了一套應用登錄權限,做了一個新的組織人員表,一個登錄賬戶下的所有應用人員共享…

Java從入門到精通 - Java入門

Java 入門 此筆記參考黑馬教程,僅學習使用,如有侵權,聯系必刪 文章目錄 Java 入門01 Java快速入門1. Java 是什么?能干什么?1.1 Java 背景知識1.2 Java 能做什么?1.3 Java 技術體系 2. 如何使用 Java&…

MySQL-排序

介紹 在MySQL中,排序查詢結果可以使用 ORDER BY 子句來實現。這個子句允許你根據一個或多個列進行排序,并且可以選擇升序(ASC)或者降序(DESC)的方式。以下是基本的語法結構: SELECT column1, …

當插入排序遇上“凌波微步“——希爾排序的奇幻漂流

文章目錄 一、排序江湖的隱藏高手二、分而治之的魔法1. 核心思想拆解2. 動態演示(腦補版) 三、C語言實現大揭秘代碼要點解析: 四、性能分析與實戰技巧1. 時間復雜度迷思2. 實測性能對比 五、為什么說它永不過時?六、進階思考題 一…

一種導彈追蹤算法的MATLAB仿真實現

代碼說明: 參數設置:設定時間步長、總模擬時間、初始位置和速度等參數。空氣動力學模型:利用簡化的空氣阻力公式來計算兩個導彈所受的阻力。追蹤算法:采用比例導引算法,讓防空導彈追蹤機動變軌導彈。機動變軌模擬&…

日語學習-日語知識點小記-構建基礎-JLPT-N4階段(13): ておきます ています & てあります

日語學習-日語知識點小記-構建基礎-JLPT-N4階段(13): ておきます &ています & てあります 。 1、前言(1)情況說明(2)工程師的信仰 2、知識點(1)&#x…

基于tabula對pdf中多個excel進行識別并轉換成word中的優化(五)

優化地方:處理合并的單元格內容。 1、修改為stream"complex" 2、增加換行符f"{table_data[i - 1][j]}\n{table_data[i][j]}".strip() 一、pdf中excel樣例 二、完整代碼 import tabula import numpy as np from docx import Document from docx…

pytest基礎知識----配置

1、自動化主流框架介紹 當前業界基于python語言的自動化框架主要包括:Unittest,Pytest這2種,其中:Unittest是Python標 準庫中自帶的單元測試框架,Unittest有時候也被稱為PyUnit,就像JUnit是Java語言的標準單元測試框…

Python實現簡易博客系統

下面我將介紹如何使用Python實現一個簡易的博客系統,包含前后端完整功能。這個系統將使用Flask作為Web框架,SQLite作為數據庫,并包含用戶認證、文章發布、評論等基本功能。 1. 系統架構設計 技術棧選擇 ??后端??:Flask (Python Web框架)??數據庫??:SQLite (輕量…

藍橋杯比賽

藍橋杯全國軟件和信息技術專業人才大賽是由工業和信息化部人才交流中心主辦,國信藍橋教育科技(北京)股份有限公司承辦的計算機類學科競賽。以下是其相關信息: 參賽對象 具有正式全日制學籍且符合相關科目報名要求的研究生、本科生…

高性能、云原生的對象存儲服務MinIO 詳細介紹與案例應用

什么是MinIO? MinIO是一個高性能、云原生的對象存儲服務,采用Apache License v2.0開源協議發布。它與Amazon S3云存儲服務API兼容,適合構建高性能、可擴展的存儲基礎設施。支持大規模非結構化數據的存儲,適合圖片、視頻、日志、備…

Transformer架構的解耦重組現象

技術演進圖譜與技術成熟度曲線 (一)架構創新范式迭代 1.1 Transformer架構的解耦重組現象 以2025年Opt模型為例,其通過引入強化學習微調模塊實現了傳統單層堆疊架構向"感知-推理分離"模式的轉型。實驗數據顯示,該架構…

Linux——線程(3)線程同步

一、線程同步的引入 通過上面的搶票系統我們發現,有的線程,進行工作(掛鎖),當其馬上結束工作(解鎖),發現外面有很多線程在排隊等著加鎖執行任務,這個線程解鎖后就立馬給…

基于go的簡單管理系統(增刪改查)

package mainimport ("database/sql""fmt"_ "github.com/go-sql-driver/mysql" )var db *sql.DBtype user struct {id intname stringage int }// 建立連接 func initDB() (err error) {dsn : "root:123456tcp(127.0.0.1:3306)/mysqltes…

HTN77A0原理圖提供聚能芯半導體禾潤一級代理技術支持免費送樣

在電源管理需求日益嚴苛的當下,禾潤 HTN77A0 以卓越性能脫穎而出。它不僅適配多種應用場景,還兼具高效節能與穩定輸出,為設備供能帶來革新體驗。 禾潤 HTN77A0 同步降壓變換器,憑借5V~130V 超寬輸入電壓范圍,打破傳統供…

小程序中的頁面跳轉

小程序中的頁面跳轉 在之前網頁的學習中,我們往往采用超鏈接,或者定義方法、函數等方式來實現頁面的跳轉,但是微信小程序中沒有超鏈接,那我們該如何實現呢?微信小程序的頁面跳轉包括兩個,一個是tabBar頁面…