【深度學習】——物體檢測的難點

目錄

一、小物體檢測

1、降采樣率減小 +空洞卷積

2、anchor設計

1)統計方法

2)anchor邊框聚類

3、多尺度訓練(multi scale training——MST)

4、 特征融合


一、小物體檢測

????????在分類任務中,一般物體的大小都差不多,這也使得單純的分類任務不需要考慮物體的大小等因素,但是在目標檢測中,因為在同一個圖像中,可能會出現多個目標,有的目標像素占比大,有的目標像素占比小,比如遠處的人高度只有30個像素,近處的人卻有幾百個像素,這導致在深度學習的前向傳播過程中,由于下降樣的因素,會導致小目標在降采樣的過程中直接丟失。

??????? 一般解決的方法有以下幾種:降采樣率減小、anchor設計、多尺寸訓練、特征融合、尺度歸一化(SNIP)

1、降采樣率減小 +空洞卷積

?????? 將采樣率下降的話就可以使得更小的物體能夠保留下來,而不至于在下采樣后一個像素點都不保留,但是減小下采樣率會導致模型的感受野減小,這樣對于模型是不利的,因此為了平衡二者之間的關系,一般我們可以使用空洞卷積來維持感受野的大小。

2、anchor設計

1)統計方法

????????設計多組anchor,然后將每一組anchor和真實框進行對比,以IOU和正樣本數作為指標。取一組性能指標指示最好的anchor作為訓練的anchor。

????????同一類物體雖然在單一尺寸上有很大的區別,但是在寬高比例上可能差別不大。

2)anchor邊框聚類

????????利用k-means等聚類算法對訓練集的真實框的長寬進行聚類,得到k個中心,將這些中心的值作為anchor生成的比例。具體可以參考yolov3模型。

3、多尺度訓練(multi scale training——MST)

??????? 訓練的時候將圖像縮放成指定的尺度,然后進行訓練。為了實現多尺度,先設置多組不同的尺度,然后每次迭代訓練的時候都是先隨機選取一個尺度,然后將輸入圖像縮放到這個尺度后再進行訓練,雖然在同一次的迭代時,尺度是一樣的,但是不同的迭代會有不一樣的尺度,這樣得到的模型就會有較高的魯棒性。

??????? 測試的時候則將圖像放大4倍或者其他倍數后,再進行檢測,這樣有利于小物體的檢測。

4、 特征融合

??????? 一個圖像在深度學習模型前向傳播的過程中,圖像會逐漸減小,導致圖像的細節丟失,語義信息增加。即淺層的圖像細節多,深層的圖像語義信息多,因此可以將深層的上采樣回來和淺層的進行融合。常見的有FPN、DetNet、彩虹融合、dssd等等

?5、

?

本文來自互聯網用戶投稿,該文觀點僅代表作者本人,不代表本站立場。本站僅提供信息存儲空間服務,不擁有所有權,不承擔相關法律責任。
如若轉載,請注明出處:http://www.pswp.cn/news/255782.shtml
繁體地址,請注明出處:http://hk.pswp.cn/news/255782.shtml
英文地址,請注明出處:http://en.pswp.cn/news/255782.shtml

如若內容造成侵權/違法違規/事實不符,請聯系多彩編程網進行投訴反饋email:809451989@qq.com,一經查實,立即刪除!

相關文章

ABB 機器人 通信指令(人機對話):

(1)清屏指令:TPErase (2)寫屏指令:PWrite String   tring:顯示的字符串。(string)在示教器顯示屏上顯示字符串數據,也可以用“……”形式直接定義字符串,每一個寫屏…

hadoop streaming編程小demo(python版)

大數據團隊搞數據質量評測。自動化質檢和監控平臺是用django,MR也是通過python實現的。(后來發現有orc壓縮問題,python不知道怎么解決,正在改成java版本) 這里展示一個python編寫MR的例子吧。 抄一句話:Hadoop Streaming是Hadoop提…

Asp.net在IE10、IE11下事件丟失經驗總結

asp.net4.0出生得比IE10早,所以asp.net4.0以前版本不認識IE10 的 User-Agent 標頭,導致的后果就是ASP.NET 特定功能失效,例如:頁面報錯__doPostBack找不到,不支援 Cookies 功能等等。這屬于.net的Bug,微軟也…

第6章 循環結構

循環語句: 可以讓一部分代碼,反復執行 1.1 循環語句while while循環: 編寫格式:while(條件){ 循環體 } 條件: 當條件是true,就執行循環體,執行完循環體后 程序再次執行while中的條件,如果條件還是true,繼續執行循環體 直到條件是false的時候,循環就結束 public class WhileDem…

【深度學習】——pytorch搭建模型及相關模型

目錄 1、搭建模型的流程 1)步驟 2)完整代碼——手寫minist數據集為例(這里使用的數據集是自帶的) 2、搭建模型的四種方法 1)方法一——利用nn.Sequential() 2)方法二——利用co…

ABB robot 與 Fronius 設備 IO

ABB robot 與 Fronius 設備 IO

初次使用cocoapods注意事項

在僅僅用cocoapods時可能會遇到各種各樣的錯誤和問題 這里中總結下: 1.首先使用cocoapods有非常多優點,在github上非常多優秀的開源項目都用到了它;假設你不會使用它,那么非常多優秀的開源項目你下載下來了也發現跑不起來,假設發現有Profile,Profile.lock,Pods等cocoapods相關…

MongoDB復制集技術

為什么使用MongogDB復制集技術? mysql中:一主一從,一主多從結構存在的問題 1、 fileover(故障轉移)a) 選主投票b) 切換 2、 是否對就用透明化 3、 數據補償的問題a) 兩階段數據補償 4、 解決方法 mysql中使用MHAVIP b…

Linux文件系統的實現 (圖文并茂,比較好)

作者:Vamei 出處:http://www.cnblogs.com/vamei 歡迎轉載,也請保留這段聲明。謝謝! Linux文件管理從用戶的層面介紹了Linux管理文件的方式。Linux有一個樹狀結構來組織文件。樹的頂端為根目錄(/),節點為目錄&#xff0…

【深度學習】——如何處理輸入圖像大小不一樣的情況

這里一般有常見的幾種方法: 1)將圖像縮放成大小一致后再輸入,如RCNN算法 2)roi pooling:這里允許輸入圖像的大小不一樣,后續根據指定的固定大小來求解池化的核大小,以此來得到相同大小的特征圖&…

ROS探索總結(一)——ROS簡介

隨著機器人領域的快速發展和復雜化,代碼的復用性和模塊化的需求原來越強烈,而已有的開源機器人系統又不能很好的適應需求。2010年Willow Garage公司發布了開源機器人操作系統ROS(robot operating system),很快在機器人…

微信瀏覽器取消緩存的方法

摘要:做微信公家號以及調試手機頁面的時辰,防止不了頁面要跳轉到微信閱讀器打開,調試階段,android版微信閱讀器一直都默許緩存html靜態資本,每一次靜態資本變革乃至新內容發布的時辰在微信閱讀器上都極有可能不克不及更新&#xf…

【機器視覺】——裂紋檢測筆記

目錄 傳統算法處理裂縫的基本思路: 第一種思路 第二種思路: 第三種思路 CPP代碼 halcon代碼 python代碼 Matlab代碼 深度學習缺陷檢測 裂縫檢測文獻 傳統算法處理裂縫的基本思路: 第一種思路 1.先轉換彩色圖為灰度圖 2.進行自適應…

利用union判斷系統的大小端

int checkCPUendian()//返回1,為小端;反之,為大端; { union{ unsigned int a; unsigned char b; }c; c.a 1; return 1 c.b; }大端模式(Big-endian),是指數據的高字節保存在內存的低地址中,而數據…

Filter(過濾器)?和?interceptor(攔截器)的區別

Filter(過濾器) 和 interceptor(攔截器)的區別 1.攔截器是基于java反射機制的,而過濾器是基于函數回調的。 2.過濾器依賴于Servlet容器,而攔截器不依賴于Servlet容器。 3.攔截器只對Action請求起作用&#…

ROS探索總結(二)——ROS總體框架

一、 總體結構 根據ROS系統代碼的維護者和分布來標示,主要有兩大部分:(1)main:核心部分,主要由Willow Garage公司和一些開發者設計、提供以及維護。它提供了一些分布式計算的基本工具,以及整個…

python 阿貍的進階之路(4)

裝飾器 #1、開放封閉原則:對擴展開放,對修改是封閉#2、裝飾器:裝飾它人的,器指的是任意可調用對象,現在的場景裝飾器-》函數,被裝飾的對象也是-》函數#原則:1、不修改被裝飾對象的源代碼 2、不修…

【深度學習】——利用pytorch搭建一個完整的深度學習項目(構建模型、加載數據集、參數配置、訓練、模型保存、預測)

目錄 一、深度學習項目的基本構成 二、實戰(貓狗分類) 1、數據集下載 2、dataset.py文件 3、model.py 4、config.py 5、predict.py 一、深度學習項目的基本構成 一個深度學習模型一般包含以下幾個文件: datasets文件夾:存放…

二叉樹的序遍歷

時間限制: 1 s空間限制: 32000 KB題目等級 : 白銀 Silver題目描述 Description求一棵二叉樹的前序遍歷,中序遍歷和后序遍歷 輸入描述 Input Description第一行一個整數n,表示這棵樹的節點個數。 接下來n行每行2個整數L和R。第i行的兩個整數Li和Ri代表編號…

GUI登錄界面

在這次的作業中,我先使用單選按鈕,輸入框,復選框設計了一個簡單地登錄界面。接著我使用了MouseListener將登陸按鈕與下一個“查詢界面”連接起來。最后我使用了我們本周所學的JFrame框架與事件處理機制設計了一個簡單地界面。我所設計的登錄界…