RCNN 學習

RCNN算法流程

RCNN算法流程可分為4個步驟

  • 一張圖像生成1K~2K個候選區域(使用Selective Search方法)
  • 對每個候選區域,使用深度網絡圖特征
  • 特征送入每一類的SVM分類器,判別是否屬于該類
  • 使用回歸期器細修正候選框位置

?1.候選區域的生成

????????利用Selective Search算法通過圖像分割的方法得到一些原始區域,然后使用一些合并策略將這些區域合并,得到一個層次化的區域結構,而這些結構就包含著可能需要的物體。

2.對每個候選區域,使用深度網絡提取特征

????????將2000候選區域縮放到227x227pixel,接著將候選區域輸入事先訓練好的AlexNet CNN網絡獲取4096維的特征得到2000X4096維矩陣。

?3.特征送入每一類的SVM分類器,判定類別

????????將2000X4096維特征與20個SVM組成的權值矩陣4096X20相乘獲得2000X20維矩陣表示每個建議框是某個目標類別的得分(建議框歸屬于每一個類別的概率)。分別對上述2000X20維矩陣中每一列即每一類進行非極大值抑制剔除重疊建議框,得到該列即該類中得分最高的一些建議框。

???????將2000X4096的特征矩陣與20個SVM組成的權值矩陣4096X20相乘,獲得2000X20的概率矩陣,每一行代表一個建議框歸于每個目標類別的概率。分別對上述2000X20維矩陣中每一列即每一類進行非極大值抑制剔除重疊建議框,得到該列即該類中得分最高的一些建議框。

?最左邊是2000×4096的一個特征矩陣,在特征矩陣中,每一行就是我們一個候選框通過CNN網絡得到的一個特征向量,然后它有2000個候選框,所以它有2000行特征向量。

中間的圖是SVM權值矩陣,每一列對應著一個類別的的權值向量,一共有20個類別,拼接在一起就是4096×20的權值矩陣。(假設SVM分類器的第一列使我們所需要檢測的貓,第二列是我們所需檢測的狗......)

非最大抑制:抑制不是最大值的元素

4.使用回歸器精細修正候選框位置
????????對NMS處理后剩余的建議框進一步篩選。接著分別用20個回歸器對上述20個類別中剩余的建議框進行回歸操作,最終得到每個類別的修正后的得分最高的bounding box。
????????如圖,黃色框口P表示建議框Region Proposal,綠色窗口G表示實際框Ground Truth,紅色窗G表示Region Proposal進行回歸后的預測窗口,可以用最小二乘法解決的線性回歸問題。

R-CNN框架

?R-CNN存在的問題

1.測試速度慢:

????????測試一張圖片約53s(CPU)。用Selective Search算法提取候選框用時約2秒,一張圖像內候選框之間存在大量重疊,提取特征操作冗余。

2.訓練速度慢:

????????過程及其繁瑣

3.訓練所需空間大:
????????對于SVM和bbox回歸訓練,需要從每個圖像中的每個目標候選框提取特征,并寫入磁盤。對于非常深的網絡,如VGG16,從VOCO7訓練集上的5k圖像上提取的特征需要數百GB的存儲空間

本文來自互聯網用戶投稿,該文觀點僅代表作者本人,不代表本站立場。本站僅提供信息存儲空間服務,不擁有所有權,不承擔相關法律責任。
如若轉載,請注明出處:http://www.pswp.cn/news/211447.shtml
繁體地址,請注明出處:http://hk.pswp.cn/news/211447.shtml
英文地址,請注明出處:http://en.pswp.cn/news/211447.shtml

如若內容造成侵權/違法違規/事實不符,請聯系多彩編程網進行投訴反饋email:809451989@qq.com,一經查實,立即刪除!

相關文章

【星海隨筆】Prometheus(一)

注:Pagerduty作為報警系統,出鏡率很高。 雖然收費,但對于企業來說很便宜。 一個月幾十美金 不太支持中文,主要是語音方面。 Prometheus 查詢語句 , 基于數學運算模式的監控查詢 我們計算一下一天多少秒 1 * 24 * 60 *…

ChatGPT是科學還是藝術?

OpenAI最近談到GPT4變懶的問題,說“它更像是多人共同參與的藝術創作”,那到底大模型是科學還是藝術?

公式識別任務各個鏈條全部打通

目錄 引言公式識別任務是什么?公式識別任務解決方案初探使用建議寫在最后 引言 隨著LaTeX-OCR模型轉換問題的解決,公式識別任務中各個鏈條已經全部打通。小伙伴們可以放開膀子干了。 解決業界問題的方案,并不是單獨訓練一個模型就完事了&am…

如何確認網站是否有漏洞,如何找出網站存在的漏洞,找到漏洞該如何處理

如何確認網站或者服務器是否有漏洞 判斷一個網站是否是存在漏洞的方法: 1.可以借助德迅云安全漏洞掃描功能來檢查漏洞。 2.打開德迅云安全首頁,點擊最上面導航欄中的“安全產品”。 3.滑到“漏洞掃描”,選擇“產品價格”服務。 4.選擇您需…

【力扣】141和142環形鏈表

141.環形鏈表 法一:快慢指針 思路: 用兩個指針slow,fast,后者能比前者多走一步路,那判斷是不是有環,只需要判斷是否會相遇。 就是有一個能比烏龜跑2倍快的兔子,兩小只都在有環的路上跑,那是不是肯定會相…

golang開發之個微機器人的二次開發

簡要描述: 下載消息中的文件 請求URL: http://域名地址/getMsgFile 請求方式: POST 請求頭Headers: Content-Type:application/jsonAuthorization:login接口返回 參數: 參數名必選類型…

java基礎之TreeMap詳解

TreeMap詳解 TreeMap是Map接口的一個實現類,底層基于紅黑樹的實現,按照key的順序存儲 TreeMap 從繼承結構可以看到TreeMap除了繼承了AbstractMap類,還實現了NavigableMap接口,而NavigableMap接口是繼承自SortedMap接口的&#xff…

使用Vue3+Typescript手寫一個日歷簽到組件

設計理念 昨天寫了個簡單美觀的日歷簽到組件,使用的是Vue3TypeScript,大概邏輯是先找到本月份第一天是周幾,然后開始填充月份日期:weeksArray:[[]]:之后渲染到表格中,對于簽到事件觸發則先判斷是否是今天且還未沒有簽…

【PyTorch】模型訓練過程優化分析

文章目錄 1. 模型訓練過程劃分1.1. 定義過程1.1.1. 全局參數設置1.1.2. 模型定義 1.2. 數據集加載過程1.2.1. Dataset類:創建數據集1.2.2. Dataloader類:加載數據集 1.3. 訓練循環 2. 模型訓練過程優化的總體思路2.1. 提升數據從硬盤轉移到CPU內存的效率…

SPRD Android 13 需要在設置--顯示--鎖定屏幕--雙行時鐘--<關閉>

開始去改默認值沒生效 --- a/frameworks/base/packages/SettingsProvider/res/values/defaults.xml +++ b/frameworks/base/packages/SettingsProvider/res/values/defaults.xml @@ -336,4 +336,6 @@<integer name="def_navigation_bar_config">0</integer…

西南科技大學數字電子技術實驗三(MSI邏輯器件設計組合邏輯電路及FPGA的實現)FPGA部分

一、實驗目的 進一步掌握MIS(中規模集成電路)設計方法。通過用MIS譯碼器、數據選擇器實現電路功能,熟悉它們的應用。進一步學習如何記錄實驗中遇到的問題及解決方法。二、實驗原理 1、4位奇偶校驗器 Y=S7i=0DiMi D0=D3=D5=D6=D D1=D2=D4=D7= `D 2、組合邏輯電路 F=A`B C …

面試計算機網絡八股文五問五答第二期

面試計算機網絡八股文五問五答第二期 作者&#xff1a;程序員小白條&#xff0c;個人博客 相信看了本文后&#xff0c;對你的面試是有一定幫助的&#xff01; ?點贊?收藏?不迷路&#xff01;? 1.OSI七層協議&#xff1f; 2. TCP和UDP傳輸協議的區別&#xff1f; TCP是可…

C語言_常見位操作

C語言_常見位操作 文章目錄 C語言_常見位操作一、位操作函數二、代碼示例 一、位操作函數 設置某位為1或者對某位清0、獲取某位的值、對某位取反 /*對某位置1*/ unsigned Setbit(unsigned x,int n) {return x | 1 << n; }/*對某位清0*/ unsigned Resetbit(unsigned x,…

為什么要用向量檢索

之前寫過一篇文章&#xff0c;是我個人到目前階段的認知&#xff0c;所做的判斷。我個人是做萬億級數據的搜索優化工作的。一直在關注任何和搜索相關的內容。 下一代搜索引擎會什么&#xff1f;-CSDN博客 這篇文章再來講講為什么要使用向量搜索。 在閱讀這篇文章之前呢&#xf…

【網絡安全】網絡設備可能面臨哪些攻擊?

網絡設備通常是網絡基礎設施的核心&#xff0c;并控制著整個網絡的通信和安全&#xff0c;同樣面臨著各種各樣的攻擊威脅。 對網絡設備的攻擊一旦成功&#xff0c;并進行暴力破壞&#xff0c;將會導致網絡服務不可用&#xff0c;且可以對網絡流量進行控制&#xff0c;利用被攻陷…

【JavaEE】線程池

作者主頁&#xff1a;paper jie_博客 本文作者&#xff1a;大家好&#xff0c;我是paper jie&#xff0c;感謝你閱讀本文&#xff0c;歡迎一建三連哦。 本文于《JavaEE》專欄&#xff0c;本專欄是針對于大學生&#xff0c;編程小白精心打造的。筆者用重金(時間和精力)打造&…

springcloud分布式事務

文章目錄 一.為什么引入分布式事務?二.理論基礎1.CAP定理2.BASE理論 三.Seata1.微服務集成Seata2.XA模式(掌握)3.AT模式(重點)4.TCC模式(重點)5.Saga模式(了解) 四.四種模式對比五.Seata高可用 一.為什么引入分布式事務? 事務的ACID原則 在大型的微服務項目中,每一個微服務都…

案例課4——智齒客服

1.公司介紹 智齒科技&#xff0c;一體化客戶聯絡中心解決方案提供商。提供基于「客戶聯絡中心」場景的一體化解決方案&#xff0c;包括公域私域、營銷服務、軟件BPO的三維一體化。 智齒科技不斷整合前沿的人工智能及大數據技術&#xff0c;已構建形成呼叫中心、機器人「在線語音…

Python中函數的遞歸調用

函數調用自己的編程方式被稱為函數的遞歸調用。遞歸通常能夠將一個大型的復雜問題的遞歸條件&#xff0c;一層一層的回溯到終止條件&#xff0c;然后再根據終止條件的運算結果&#xff0c;一層一層的遞進運算到滿足全部的遞歸條件。它能夠使用少量程序描述出解題過程中的重復運…

主機訪問Android模擬器網絡服務方法

0x00 背景 因為公司的一個手機app的開發需求&#xff0c;要嘗試鏈接手機開啟的web服務。于是在Android Studio的Android模擬器上嘗試連接&#xff0c;發現谷歌給模擬器做了網絡限制&#xff0c;不能直接連接。當然這個限制似乎從很久以前就存在了。一直沒有注意到。 0x01 And…