目標檢測20年(三)

對這篇論文感興趣的小伙伴可以訂閱筆者《目標檢測》專欄,關注筆者對該文獻的閱讀和理解。

前兩篇解讀鏈接:

目標檢測20年(一)-CSDN博客

目標檢測20年(二)-CSDN博客


目錄

四、 檢測器的加速發展

4.1 特征映射共享計算

4.2 級聯檢測

4.3 網絡修剪和量化

4.4 輕量化網絡設計

4.4.1 分解卷積

4.4.2 組卷積

4.4.3 深度可分離卷積

? 4.4.4 瓶頸設計

4.4.5 NAS檢測

4.5 數值加速

4.5.1 積分圖像加速

4.5.2 頻域加速

4.5.3 矢量量化


四、 檢測器的加速發展

讓檢測器變得更快一直是一項具有挑戰性的工作。加速技術可以分為“檢測流水線”加速、“檢測骨干(backbone)”加速和“數值計算”加速三個層次,如下圖所示:

加速技術從下至上形成金字塔結構:數值計算包括積分圖像、快速傅里葉變換(Fast Fourier Transform)、矢量量化和約階近似。檢測引擎/骨干的加速包括網絡修剪和量化以及輕量化網絡設計。最后,流水線加速包括特征映射共享計算和級聯檢測。

下面對這些技術分別進行介紹:

4.1 特征映射共享計算

檢測器不同計算階段中,特征提取占據計算量的主導地位。減少特征計算冗余最常用的方法就是只計算一次整幅圖像的特征映射,該方法已實現數十倍甚至百倍的加速。

4.2 級聯檢測

級聯檢測是一種常用技術,采用從“粗”到“精”的檢測理念,使用簡單計算過濾簡單的背景窗口,用復雜窗口處理困難窗口。該方法適用于大場景小物體檢測任務,如人臉、行人的檢測。

4.3 網絡修剪和量化

“網絡修剪”和“網絡量化”是兩種加速CNN模型的方法。前者修剪網絡結構或權值,后者減少代碼長度。最初網絡修剪采用迭代訓練和修剪,每個訓練階段后只去除一小組不重要的權值并重復該操作。目前的工作集中于網絡二值化,通過激活或權重量化為二進制(0/1)壓縮網絡,將浮點運算轉為邏輯運算。

標準的卷積如下圖所示:

4.4 輕量化網絡設計

除了有“少通道多層”的方法外,近年來也提出了許多其他方法。

4.4.1 分解卷積

這是輕量級CNN最直接的方法。一般有兩組分解方法:第一組是將大的卷積濾波器分解成一組小的,如下圖所示:

我們可以將一個7×7的濾波器分解成三個3×3的濾波器,并且它們享受相同的感受野,后者的效率卻更高。第二組則是對通道維度的卷積進行因式分解,如下圖所示:

4.4.2 組卷積

?組卷積就是將特征通道分成不同組,在每個組上進行卷積,從而減少卷積層中參數數量。如下圖所示:

? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? 理論上,其他條件相同情況下,將特征均勻分成m組,計算量將減少1/m。

4.4.3 深度可分離卷積

深度可分離卷積可以看作是組卷積的一種特殊情況(即組的個數和通道數相同)。使用多個1×1濾波器進行維度轉換以得到具有所需通道數量的輸出。通過深度可分離卷積,計算量可以從O(dk^{2}c)減少到O(ck^{2})+O(dc)。該思想可以應用于目標檢測和細粒度分類。如下圖所示:

? 4.4.4 瓶頸設計

與前幾層相比,神經網絡瓶頸層包含節點較少。瓶頸的設計通常被用來設計輕量級網絡。可以對輸入層網絡進行壓縮,減少檢測開始的計算量。也可以壓縮特征圖,加快后續檢測。? ?? ? ? ? ? ? ? ? ? ? ?

4.4.5 NAS檢測

基于深度學習的檢測器越來越復雜,也嚴重依賴手工構建的網絡架構和訓練參數。神經結構搜索(Nerual Architecture Search,NAS)主要關注確定候選網絡適當空間,改進快速準確搜索策略,以低成本驗證搜索結果。在設計檢測模型時,NAS可以減少人為干預網絡骨干網和錨盒設計需求。

4.5 數值加速

數值加速旨在加速目標檢測器底層實現過程。

4.5.1 積分圖像加速

積分圖像是圖像處理的一種方法,其有助于快速圖像子區域的和。本質就是信號處理中卷積的積分-微分可分性。

f(x)*g(x)=(\int f(x)dx)*(\frac{dg(x)}{dx})

其中dg(x)/dx是稀疏信號,之后卷積部分就能通過方程右邊部分進行加速。

積分圖像也可以用于加速更多的目標檢測常見特征,如顏色直方圖、梯度直方圖。很典型的是通過計算積分HOG映射加速HOG,如下圖所示:

積分HOG地圖用于行人檢測,并在不損失精度條件下加速數十倍。

4.5.2 頻域加速

卷積是一種重要的運算,由于線性檢測器檢測可以看作是特征映射和檢測器權重之間的窗口內積,通過卷積實現。傅里葉變換是一種加速卷積的方法。在適當條件下,兩個信號I*W的卷積傅里葉變換F是他們傅里葉空間中的點積:

I*W=F^{-1}(F(I)\odot F(W))

F是傅里葉變換,F-1是傅里葉反變換。上述公式可以通過快速傅里葉變換和快速傅里葉反變換實現加速。

4.5.3 矢量量化

VQ(vector quantization)是信號處理的常用量化方法。通過一組小的原型向量近似一組大數據分布。可以用于數據壓縮和加速目標檢測內積運算。

?? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ?

本文來自互聯網用戶投稿,該文觀點僅代表作者本人,不代表本站立場。本站僅提供信息存儲空間服務,不擁有所有權,不承擔相關法律責任。
如若轉載,請注明出處:http://www.pswp.cn/news/898912.shtml
繁體地址,請注明出處:http://hk.pswp.cn/news/898912.shtml
英文地址,請注明出處:http://en.pswp.cn/news/898912.shtml

如若內容造成侵權/違法違規/事實不符,請聯系多彩編程網進行投訴反饋email:809451989@qq.com,一經查實,立即刪除!

相關文章

智能手持終端PDA在設備巡檢管理中的應用

在工業制造、能源電力、軌道交通等領域,設備巡檢是保障生產安全與連續性的核心環節。傳統巡檢模式存在效率低、易出錯、數據滯后等痛點。上海岳冉智能設備巡檢手持終端PDA,以智能化、數字化、高可靠為核心設計理念,集RFID、條碼掃描、AI圖像識…

AI知識補全(二):提示工程(Prompting)是什么?

名人說:人生如逆旅,我亦是行人。 ——蘇軾《臨江仙送錢穆父》 創作者:Code_流蘇(CSDN)(一個喜歡古詩詞和編程的Coder😊) 上一篇:AI知識補全(一):tokens是什么…

C++友元:跨墻訪問的三種姿勢

目錄 友元 友元之普通函數形式 友元之成員函數形式 友元類 友元的特點 友元 什么叫友元? 一般來說,類的私有成員只能在類的內部訪問,類之外是不能訪問它們的。但如果將其他類/函數設置為類的友元,那么友元類/函數就可以在前…

位運算[找出唯一成對的數]

題目來源:藍橋云課 不用輔助儲存空間 import java.util.Random;public class T_01 {public class Util {public static void swap(int[] arr, int i, int j) {int temp arr[i];arr[i] arr[j];arr[j] temp;}public static void print(int[] arr) {for (int i 0; …

簡記_FPGA 硬件最小系統設計

一、FPGA板級設計的五要素 1.1、電源電路 核心電壓:一般為固定值 IO電壓:FPGA的IO分為多個bank,同一個bank的不同IO引腳電壓相同,不同bank的電壓可以不同 輔助電壓:除了核心電壓和IO電壓,FPGA工作所需的…

7.2 控件和組件

版權聲明:本文為博主原創文章,轉載請在顯著位置標明本文出處以及作者網名,未經作者允許不得用于商業目的 C#工具箱位于編輯窗口的左側,它默認內置了大量的控件和組件。控件一般派生于System.Windows.Forms.Control類,顯…

Spring Boot中接口數據字段為?Long?類型時,前端number精度丟失問題解決方案

Spring Boot中接口數據字段為 Long 類型時,前端number精度丟失問題解決方案 在Spring Boot中,當接口數據字段為 Long 類型時,返回頁面的JSON中該字段通常會被序列化為數字類型。 例如,一個Java對象中有一個 Long 類型的屬性 id …

OpenCV第2課 OpenCV的組成結構與圖片/視頻的加載及展示

1.OpenCV 的組成結構 2.OpenCV 的具體模塊 3. 圖像的讀取 4. 視頻的讀取 1.OpenCV 的組成結構 OpenCV 是由很多模塊組成的,這些模塊可以分成很多層: 最底層是基于硬件加速層(HAL)的各種硬件優化。再上一層是opencv_contrib 模塊所包含的OpenCV 由其他開發人員所貢獻的代…

安裝配置Tesseract-OCR

1,下載對應的可執行文件 在Tesseract OCR下載地址Index of /tesseract下載合適的版本安裝包,如下: 點擊安裝包進行安裝: 語言選擇英文: 如果需要識別中文,則可以在安裝過程中勾選下載中文語言包和腳本(也可以按需選擇繁體):

關于墻面涂鴉的視覺檢測與噴涂修復裝置研究(大綱)

公共場所墻面涂鴉視覺檢測與精準噴涂修復裝置研究 融合視覺識別與自動化噴涂的墻面維護解決方案 第一章 緒論 1.1 研究背景與意義 城市形象與秩序維護: 涂鴉對公共環境的影響(破壞美觀、傳遞不良信息)清除涂鴉的重要性(恢復原貌…

圖論 | 98. 所有可達路徑

98. 所有可達路徑 題目鏈接: 98. 所有可達路徑 思路 先創建鄰接矩陣,再深搜寫代碼是需要注意的是acm格式,輸入的格式要轉化為int,輸出要轉化為str,用map()實現。 dfs def dfs(grid,node,n,…

MCP+Hologres+LLM 搭建數據分析 Agent

LLM大模型在數據分析領域的挑戰 在數據分析領域,大模型(LLM)具備強大語言理解能力,NL2SQL等各類智能化工具也極大提升了數據分析人員的分析效率,但仍舊面臨不少挑戰: 傳統 LLM 缺乏實時數據接入能力&…

Categorical分布(分類分布):深度學習中的離散建模利器

Categorical分布:深度學習中的離散建模利器 引言 對于深度學習研究者來說,概率分布是模型設計和優化的基石。在許多生成模型中,如變分自編碼器(VAE)及其變種VQ-VAE(Vector Quantized Variational Autoenc…

Langchain 提示詞(Prompt)

基本用法 1. 基本概念 提示詞模板 是一個字符串模板,其中包含一些占位符(通常是 {variable} 形式的),這些占位符可以在運行時被實際值替換。LangChain 提供了多種類型的提示詞模板,以適應不同的使用場景。 2. 主要類…

centos7.9鏡像源及Python引入ssl問題處理

一、鏡像源修改 1. 備份原有的鏡像源配置文件 在修改之前,先備份現有的 CentOS-Base.repo 文件: sudo cp /etc/yum.repos.d/CentOS-Base.repo /etc/yum.repos.d/CentOS-Base.repo.backup 2. 編輯鏡像源配置文件 使用文本編輯器(如 nano 或 vi)打開 /etc/yum.repos.d/Ce…

Java高頻面試之集合-17

hello啊,各位觀眾姥爺們!!!本baby今天來報道了!哈哈哈哈哈嗝🐶 面試官:JDK 8 對 HashMap 主要做了哪些優化呢?為什么要這么做? JDK 8 對 HashMap 的主要優化及原因 JDK…

計算機二級:函數基礎題

函數基礎題 第一題 rinput("請輸入半徑:") c3.1415926*r*2 print("{:.0f}".format(c))輸出: Type Error第二題 a7 b2 print(a%2)輸出 1第三題 ab4 def my_ab(ab,xy):abpow(ab,xy)print(ab,end"\n") my_ab(ab,2)prin…

C# 屬性(Property)?詳解

在 C# 中,?屬性(Property)? 是類或結構體中的成員,用于封裝對私有字段(稱為 ?backing field?)的訪問,提供更靈活和安全的數據操作方式。屬性通過 get 和 set 訪問器控制對數據的讀寫&#x…

iPhone 16如何翻譯文檔?文檔翻譯技巧、軟件推薦

在全球化的今天,跨語言交流變得越來越頻繁,而文檔翻譯更是成為許多人日常工作和學習中的重要需求。作為蘋果公司最新推出的旗艦機型,iPhone 16憑借其強大的硬件性能和豐富的軟件生態,為我們提供了多種便捷的文檔翻譯方式&#xff…

HRP方法全文總結與模型流程解析

背景與問題 傳統二次優化方法(如Markowitz的CLA)存在三大問題: 不穩定性:協方差矩陣的高條件數導致逆矩陣計算誤差放大,權重劇烈波動。 集中性:優化結果過度集中于少數資產,易受個體風險沖擊。…