YOLOV1學習

YOLOV1學習(輸入的圖像固定大小為448X448X3)
參考文獻

模型結構

將輸入的圖像歸一化為大小為448x448x3的圖像,然后將經過中間24層的卷積后得到了7x7x1024的特征圖,然后后面連接的是兩個全連接層,分別是4096和1470,最后將1470reshape成7x7x30的張量。

問題0:①為什么是30,又為什么是7?②怎么解析?
答:①為什么是7是因為將輸入圖像劃分成了7x7的grid cell,30是因為每個grid cell都會生成兩個預測框,每個預測框又有5個參數(x,y,h,w,c),又因為這里是針對Pascal 數據集進行設計的,這個數據集中含有20個類,因此會有20個類別條件概率,因此對于每一個grid cell都有**(2x5+20=30)30個參數需要記錄,因此最終的矩陣為7x7x30**
②根據①知道了每一個深度方向的信息代表什么,因此我們可以根據這個進行解析。深度方向有30維通道,1-5通道是第一個bounding box的x,y,h,w,c, 6-10是第二個bounding box的x,y,h,w,c,后面11-30則是每一類的條件概率值【p(第i類)/p(含物體)】。

注:真正的類別概率是:每一類的條件概率乘以置信度
置信度=p[object]是否包含物體的概率,條件概率=p【屬于第i類的概率】/p[object]
p【屬于第i類的概率】=置信度 * 條件概率

[外鏈圖片轉存失敗,源站可能有防盜鏈機制,建議將圖片保存下來直接上傳(img-wVF2VAoW-1629564873766)(en-resource://database/533:1)]

[外鏈圖片轉存失敗,源站可能有防盜鏈機制,建議將圖片保存下來直接上傳(img-ZonZ4xEu-1629564873769)(en-resource://database/527:1)]

預測階段

一、模型訓練好的前提下目標檢測的大體步驟

[外鏈圖片轉存失敗,源站可能有防盜鏈機制,建議將圖片保存下來直接上傳(img-qT5dGEKL-1629564873772)(en-resource://database/529:1)]

步驟一:劃分網格

先將輸入的圖像劃分為sxs個大小相等的網格;(s=7),每一個網格稱之為grid cell
[外鏈圖片轉存失敗,源站可能有防盜鏈機制,建議將圖片保存下來直接上傳(img-2VR96r7v-1629564873775)(en-resource://database/519:1)]

問題1:這樣劃分的目的是什么?
答:用于生成預測框,將預測框的中心限制在網格中

步驟二:生成預測框bounding box

每個grid cell都會生成兩個預測框,且預測框的中心在grid cell內,預測框的參數有:中心坐標(x,y),框寬高(h.w),以及是否為一個物體的置信度c(反應在框的粗細中,粗框表示置信度高),這里共生成7x7x2 = 98個bounding box
[外鏈圖片轉存失敗,源站可能有防盜鏈機制,建議將圖片保存下來直接上傳(img-FmjqlIXq-1629564873780)(en-resource://database/521:1)]

問題2:每一個grid cell的2個預測框是怎么生成的?
答:根據參數x,y,h,w,c生成的
問題3:怎么得到這幾個參數?
根據7x7x30的矩陣所得

步驟三:生成條件概率

每一個grid cell還會預測一組條件類別概率,即在包含物體的前提下,是某一類物體的概率,稱之為條件概率。根據條件概率可以繪制下圖的class probability map圖,每一個顏色表示不同的類別,這里是將20個概率中取最大的概率作為最終的概率繪制出來的
[外鏈圖片轉存失敗,源站可能有防盜鏈機制,建議將圖片保存下來直接上傳(img-wWlVAkbE-1629564873783)(en-resource://database/523:1)][外鏈圖片轉存失敗,源站可能有防盜鏈機制,建議將圖片保存下來直接上傳(img-A9rAIVBZ-1629564873785)(en-resource://database/535:1)]

問題4:條件概率有什么作用?
答:將每一個bounding box的置信度乘以條件概率,就可以得到bounding box的各類別的概率。
問題5:條件概率是怎么計算得到的?
根據7x7x30的矩陣所得

步驟四:根據步驟二和步驟三生成預測結果

根據bounding box和類別概率就可以得到預測結果。即根據問題4中得到的概率,就可以判別出每一個bounding box最終的預測結果,將屬于背景的box剔除,然后利用NMS進行非極大值抑制,就得到了目標檢測的結果
[外鏈圖片轉存失敗,源站可能有防盜鏈機制,建議將圖片保存下來直接上傳(img-gnMCt2zA-1629564873787)(en-resource://database/537:1)]

[外鏈圖片轉存失敗,源站可能有防盜鏈機制,建議將圖片保存下來直接上傳(img-F8NY3Ge5-1629564873790)(en-resource://database/531:1)]

問題6
①怎么訓練網絡,得到網絡的參數,進而能夠進行目標檢測?
②怎么判斷grid cell是否含有物體

二、預測階段,后處理

1、預測階段

對于一個grid cell來說,有兩個預測框,每個預測框都有一個20維的類別概率,因此有每一個grid cell都會得到兩個全概率即2x20,對于7x7的grid cell來說,就會得到7x7x2=98個20維的全概率向量
[外鏈圖片轉存失敗,源站可能有防盜鏈機制,建議將圖片保存下來直接上傳(img-NBcALAj8-1629564873794)(en-resource://database/539:1)]

2、后處理

后處理其實就是將98個預測框中低置信度的框和重復的框剔除,這個過程稱之為NMS
① 先設置一個閾值,對于同一個類別概率小于p_thre的grid cell全部設置為0
②將不為0的grid cell按照高低順序進行排列,取出概率最大的預測框;
③將所有的框跟概率大的框計算交并比,IOU,若交并比大于某一個閾值,則表明預測了同一個物體,將低概率的概率設置為0,;若交并比小于某一個閾值,則說明不是預測的同一個物體,保留這個預測框;
④對于每一個類別都是重復①-③步驟(即NMS),進行20次NMS后就會得到最終的結果。
[外鏈圖片轉存失敗,源站可能有防盜鏈機制,建議將圖片保存下來直接上傳(img-Z2Nyaww8-1629564873797)(en-resource://database/541:1)]

訓練階段

本文來自互聯網用戶投稿,該文觀點僅代表作者本人,不代表本站立場。本站僅提供信息存儲空間服務,不擁有所有權,不承擔相關法律責任。
如若轉載,請注明出處:http://www.pswp.cn/news/255855.shtml
繁體地址,請注明出處:http://hk.pswp.cn/news/255855.shtml
英文地址,請注明出處:http://en.pswp.cn/news/255855.shtml

如若內容造成侵權/違法違規/事實不符,請聯系多彩編程網進行投訴反饋email:809451989@qq.com,一經查實,立即刪除!

相關文章

KUKA通信 CREAD問題

嗨。 我想通過串行端口1發送X,Y,Z,A,B,C坐標給機器人。 G1: ...... CREAD(HANDLE,SR_T,MR_T,TIMEOUT,OFFSET,"%F",X) P.XX CREAD(HANDLE,SR_T,MR_T,TIMEOUT,OFFSET,"%F",Y) P.YY ...... GOTO G1…

bzoj 1901: Zju2112 Dynamic Rankings

Time Limit: 10 Sec Memory Limit: 128 MBSubmit: 6245 Solved: 2593[Submit][Status][Discuss]Description 給定一個含有n個數的序列a[1],a[2],a[3]……a[n],程序必須回答這樣的詢問:對于給定的i,j,k,在a[i],a[i1],a[i2]……a[j]中第k小的…

第 36 章 RRDTool

36.1. install $ apt-get install rrdtool原文出處:Netkiller 系列 手札 本文作者:陳景峯 轉載請與作者聯系,同時請務必標明文章原始出處和作者信息及本聲明。

手機號碼已經注冊寫到數據庫中,如何利用相同手機號碼再次注冊?

手機號碼已經注冊寫到數據庫中,如何利用相同手機號碼再次注冊? 解:刪除數據庫中以前注冊的手機號碼就可以了啊,delete那條記錄,轉載于:https://www.cnblogs.com/panxuejun/p/6122499.html

騰訊技術研究類和數據分析第一次筆試(2021.8.22)——Python

第一題:開鎖——數學期望 # 最優策略:鑰匙的選擇先從消耗時間最少的開始選擇,然后選擇第二小的依次類推 # 開鎖概率1/n def openLockTime(n, m, time):time_reverse [] # (n,m)->(m,n)for i in range(m):m_time []for j in range(n):m…

教你怎樣選擇伺服電機控制方式

伺服電機一般都有三種控制方式:速度控制方式,轉矩控制方式,位置控制方式 。 速度控制和轉矩控制都是用模擬量來控制的。位置控制是通過發脈沖來控制的。具體采用什么控制方式要根據客戶的要求,滿足何種運動功能來選擇。 …

.Net Discovery系列之四 深入理解.Net垃圾收集機制(下)

上一節給大家介紹了 .Net GC的運行機制,下面來講下與GC相關的重要方法。 第二節.GC關鍵方法解析 1.Dispose()方法 Dispose可用于釋放所有資源,包括托管的和非托管的,需要自己實現。 大多數的非托管資源都要求手動釋放,…

真靜態和偽靜態的區別

首先肯定的是純靜態和偽靜態都是SEO的產物,但純靜態和偽靜態還是有很大區別的。 純靜態是生成真實的HTML頁面保存到服務器端,用戶訪問時直接訪問這 個HTML頁面即可,從而大大的減輕了服務器壓力(如dedecms就是采用的純靜態&#xf…

非常有趣的Console

console覺醒之路,打印個動畫如何? 原文地址: http://www.helloweba.com/view-blog-383.html 批量去掉或替換文本中的換行符(notepad、sublime text2) 原文地址:http://m.blog.csdn.net/article/details?id43228729 有…

shopee蝦皮科技測試工程師第一次筆試

10道單選題 10道多選題 2道編程題 第一題:十進制轉二進制計算1的個數(負數轉為補碼) #!/usr/bin/env python # -*- coding: utf-8 -*- # Time : 2021/8/23 15:44 # Author : linlianqin # Site : # File : 十進制轉換為二進制&am…

假期實踐

第一天 地點:杭州頤高數碼城 第一天,我來到了自己家附近的頤高數碼城。文三路這邊有一個賣數碼產品的一條街,這里也是最貼近我專業實踐的地方,所以第一天的實踐我選擇了這里。 2001年開業的頤高數碼廣場座落于“電子一條街”文三路、學院路口…

3.AngularJS-過濾器

轉自:https://www.cnblogs.com/best/p/6225621.html 二、過濾器 使用過濾器格式化數據,變換數據格式,在模板中使用一個插值變量。語法格式如下: {{ express | filter:parameter1:p2:p3… | … | …}} 過濾器分了內置過濾器與自定義…

webstorm卡頓問題

解決webstorm卡頓問題 webstorm強大的功能就不多做介紹了。但是它的缺點也顯而易見:吃內存。 電腦配置稍低一點,運行webstorm就特別容易卡頓,特別是項目比較大的時候,那卡頓得不要不要的。 在我的筆記本8g內存 256ssd的配置下&…

cmd.exe啟動參數說明

啟動命令解釋程序 Cmd.exe 的新范例。如果在不含參數的情況下使用,cmd 將顯示操作系統的版本和版權信息。 語法 cmd [{/c | /k}] [/s] [/q] [/d] [{/a | /u}] [/t:FG] [/e:{on | off}] [/f:{on | off}] [/v:{on | off}] [String] 參數 /c 執行 String 指定的命令&am…

【深度學習】——訓練過程

包含哪些層 訓練過程 其實就是yf(x)的求參過程,先給參數一個初始值,然后根據初始函數計算得到預測值,根據預測值和真值計算損失,然后又根據損失函數進行反向傳播更新參數,更新參數后,再次計算預測值&#…

ABB RAPID 程序 WorldZone 歸納

在 RAPID 程序中,靜態的 WorldZone 不能被解除并再次激活,或者進行擦除。在 RAPID 程序中, 臨時的 WorldZone 可以被解除(WZDisable) , 再次激活(WZEnable) 或者擦除(WZF…

thinkphp自定義模板標簽(一)

thinkphp內置的foreach和include等模板標簽使用是非常方便的;但是內置的那些標簽只能滿足常用功能,個性化的功能就需要我們自己編寫自定義模板標簽了;下面就是要講解如何實現; 示例環境:thinkphp3.2.3 thinkphp的模板標…

【深度學習】——激活函數(sigmoid、tanh、relu、softmax)

目錄 激活函數 1、作用 2、常用激活函數 3、衡量激活函數好壞的標準: 4、不同的激活函數 1)sigmoid 2)tanh函數 3)RULE函數和leak-relu函數 4)softmax函數 激活函數 1、作用 如果只是線性卷積的話&#xff0c…

SDUT 3377 數據結構實驗之查找五:平方之哈希表

數據結構實驗之查找五:平方之哈希表 Time Limit: 400MS Memory Limit: 65536KBSubmit StatisticProblem Description 給定的一組無重復數據的正整數,根據給定的哈希函數建立其對應hash表,哈希函數是H(Key)Key%P,P是哈希表表長&…

我的2017年前端之路總結

原文首發于我的博客 年末了,趕著剛考完兩門考試,在最后4門考試來臨之前抽空寫一下今年的小結。 今年格外忙。忙完本科畢設,又馬上投入了研究生實驗室的搬磚生涯。跟去年一樣,列個今年的學習成果清單: 過去的一年 技術成…