面向惡劣條件的道路交通目標檢測----大創自用(當然你也可以在里面學到很多東西)

全部內容梳理

目標檢測的兩個任務:

預測標簽 邊界框

語義分割 實力分割

一個是類別 一個是實例級別

分類任務把每個圖像當作一張圖片看待 所有解決方法是先生成候選區域 再進行分類

置信度:

包括對類別和邊界框預測的自信程度

輸出分類和IOU分數的乘積

雙階段代表R-CNN FAST R-CNN

分類 閾值判斷

回歸 擬合最優

錨定框是可能的候選區域

具體的

是否包含物體

判斷類別

微調邊界框

coco格式 json文件

YOLO格式 類別 x,y,w,h

驗證集:用于驗證模型效果的數據,評價模型學的好不好,選擇超參數。

直接通過測試集進行檢測,那么模型是以測試集為目標去優化,相當于作弊

交叉驗證---為了規避掉驗證集選擇的bias(如驗證集上的都是同一類別)

mAP:對每個類別計算AP,取所有類別AP計算平均mAP

對于每個類別,基于預測結果和真實標簽,計算出一個precision-recall曲線

對于每個類別的precision-recall曲線,計算出該曲線下的面積,即AP
計算所有類別的AP的平均值。

正樣本

類別 邊界框損失

負樣本

類別

softmax單一預測

sigmoid多預測

檢測任務是遍歷的分類任務

常見的優化器

Loss(w,b)容易陷入局部最優

SGD也叫mini-batch,之后的優化算法,一定是建立在SGD之上,容易震蕩

模擬退火,通過隨機擾動避免了局部最優

AdaGrad自適應調整學習率,缺點:學習率會一直減小,最終可能變得過小,導致訓練提前停止

RMSProp是對AdaGrad改進,通過指數加權平均來調整歷史梯度的影響,使學習率減小的更加平滑。

Momentum參數更新不僅取決于當前梯度,還取決于之前的更新的累計動量

Adam結合了MomentumRMSProp的優點,通過自適應學習率和動量加速收斂

主干網絡

頸部:對于主干網絡提取的特征信息做進一步融合,增加了魯棒性和特征的表達能力,對多尺度目標檢測和小目標檢測有著重要作用

頭部:卷積層或FC層進行分類和定位

anchor free

對每個像素點預測類別和邊界框

每個位置預測一個框 重疊位置可能無法檢測

anchor box

復雜度高

不靈活

正樣本

正樣本指預測框和真實框IOU大于設定閾值

負樣本指預測框和真實框IOU小于設定閾值

失衡的后果:

負樣本過多會淹沒正樣本 關注負樣本

模型傾向于負樣本預測 漏檢正樣本

最后一層換成了SPPF

模型版本

準確率

Accuracy

召回率(Recall

F1

F1 Score

每秒浮點運算次數(GFLOPs

平均精度均值(mAP

未改進版本

82.3%

78.5%

80.1%

5.6

0.468

改進點一

83.6%

82.5%

82.8%

5.7

0.479

改進點二

83.4%

81.7%

80.3%

5.6

0.468

改進點一+改進點二

85.1%

83.7%

84.1%

5.7

0.481

對于小波卷積的替換 只需要對寫好小波卷積部分 然后在各個結構中進行替換

同理

標注使用LABELME YOLO格式

使用的主干網絡RESNET101 使用了預訓練權重

批次大小設置為24 訓練輪次100?優化器為 Adam 優化器,初始學習率為0.01

召回率關注的是在所有實際為正的樣本中,模型能夠正確預測出多少,即模型預測正類的完整性

精確率關注的是模型預測為正的樣本中有多少是 真正的正樣本,即模型預測正類的準確性

map是0.5--0.95的平均map?

0.75更能反映小目標

小波變換 正交基 沒有冗余信息

小波變換用于替代短時傅里葉變換 把無限長的基替換為有限長的衰減小波基

短時傅里葉處理不平穩的信號 小波變換克服了短時傅里葉的窗口不變性

小波變換卷積通過小波變換分解為不同的頻率分量 關注不同的頻率

進行小核卷積 進行上采樣 小波基函數類似卷積核

低頻對應全局 高頻對應局部 通過對低頻高頻分別處理 更好的進行多尺度表達

小波變換卷積通過低頻逐漸向高頻過渡 從而實現大尺度物體向小尺度的轉變 低頻的信息具有全局特征 彌補了CNN局部提取的缺陷 高頻特征更好的捕捉了邊緣紋理等 強化了形狀的識別

絕大部分噪音都是圖像的高頻分量,通過低通濾波器來濾除高頻; ?邊緣也是圖像的高頻分量,可以通過添加高頻分量來增強原始圖像的邊緣;

學生網絡接收到的標簽

一種是教師網絡的輸出, 一種是真實的標簽。

硬標簽 獨熱編碼 軟標簽 概率分布

蒸餾溫度 溫度越高越平滑 越可以容忍學生的過失

concat 維度增加 自適應學習

add 信息量增加 殘差連接

卷積如何在計算機中并行計算 轉化為特征向量

深度可分離卷積 空洞卷積 擴大感受野

車道線檢測

線提議單元 為了學習全局特征 類似于貓框

正標簽選擇 小于一個閾值 但一個車道線可以有多個提議

負標簽選擇 與所有車道線都大于閾值

首先是距離判斷正負標簽 其次看分類的分數

像目標檢測一樣 只有正標簽 才有回歸損失

回歸損失 平滑L1損失 避免了過度懲罰小誤差

車道線具有高級語義 也需要低級語義進行定位

高級語義檢測車道線 低級語義定位

RIO聚合上下文

車到先驗

背景前景概率 長度 角度和起點 N個偏移量

線IOU把車道線作為一個

在檢測過程中?

計算焦點損失 類別

相似度損失 距離遠近

訓練時

類別損失 回歸損失 LIOU損失

Lseg輔助分割損失 更好的定位

Laneiou考慮了車道角度

CLRKDNE對檢測頭和FPN進行簡化 推理速度上升60%? 保持了和CLRNET相當的精度

利用教師模型 CLRNet 的中間特征層、先驗嵌入和最終檢測頭 logits 來提升其車道檢測能力?

logits是一個向量 類似軟標簽

起點和角度

CLRKDNET單個檢測頭 固定先驗參數(教師傳遞,不可迭代)

知識蒸餾分為三個部分

注意力圖蒸餾

讓學生網絡也能關注關鍵特征

先驗知識嵌入和logits蒸餾

學生網絡直接使用起點和角度(RIO精煉后的)L2范數進行損失比較

Logit 蒸餾:Logit 蒸餾關注檢測頭的最終輸出

確保學生有老師的輸出邏輯 參數包括長度 類別 偏移量等

目標檢測

DETR對于真實值 預測值 摒棄了NMS 使用匈牙利算法進行二分圖匹配 并行預測

二分圖匹配考慮 匹配損失 包括類別和回歸

GIOU廣義交并比 考慮了重疊區域 考慮了位置信息

D-fine

對于回歸任務 概率分布 細粒度分布優化

深層向淺層的知識傳遞

傳統的logits模仿和特征模仿在檢測任務下精度低下

從固定的坐標預測變成建模概率分布(殘差方式)

把四個邊分為了n個bin預測每個bin的概率 取最大

首先第一層預測初步邊界框 初步概率分布?

邊界框作為參考框 后續層對概率分布進行優化

wn通過分段可以對小的偏差更精細調整

DEIM

解決DETR中稀疏監督的問題

增加額外的目標 提高每個圖像中的正樣本數量

YOLO的每個目標和多個貓框相關聯 提供了密集監督

對小目標 密集監督更加重要

增加每張訓練樣本中的額外目標數量

提供監督

保留了020的匹配機制 避免了NMS 防止推理速度變慢

老師提問:

寫的是中文還是英文

核心還是SCI

核心的發表時間會更長

改進點是什么

正常回答

前期成果
對deim進行了改進
學術論文初稿寫好
參數不要動了

課題哪里來的

α:
師兄中科院二區論文和畢業論文的課題上延伸

α:
雨雪條件到惡劣條件

α:
提高了場景適應性
已經進入實驗室進行相關研究 有專業的老師和師兄指導

本文來自互聯網用戶投稿,該文觀點僅代表作者本人,不代表本站立場。本站僅提供信息存儲空間服務,不擁有所有權,不承擔相關法律責任。
如若轉載,請注明出處:http://www.pswp.cn/pingmian/82236.shtml
繁體地址,請注明出處:http://hk.pswp.cn/pingmian/82236.shtml
英文地址,請注明出處:http://en.pswp.cn/pingmian/82236.shtml

如若內容造成侵權/違法違規/事實不符,請聯系多彩編程網進行投訴反饋email:809451989@qq.com,一經查實,立即刪除!

相關文章

需求管理工具使用不當,如何優化?

要優化需求管理工具的使用,需從選擇合適工具、規范使用流程、加強用戶培訓、統一數據結構、定期審查與優化使用配置五個方面著手。其中,選擇合適工具是前提。錯誤的工具選擇往往會導致項目溝通效率低、需求追蹤失效甚至造成交付物偏離客戶預期。因此&…

openwrt虛擬機安裝調試

分類 lienol lean immortalwrt 一、獲取固件 (1)下載地址 1.官網構建下載 OpenWrt Firmware Selector 官網 OpenWrt Firmware Selector 2.第三方構建網站 ImmortalWrt Firmware Selector ImmortalWrt Firmware Selector 3.第三方構建下載 ht…

Apache OFBiz 17.12.01 的遠程命令執行漏洞 -Java 反序列化 + XML-RPC 請求機制

目錄 漏洞原理 🎯 一、漏洞背景(CVE-2020-9496) ?? 二、攻擊原理簡述 🧱 三、完整攻擊流程步驟詳解 🔎 1. 信息收集 🛠? 2. 工具準備 🧪 3. 構造初始 payload:下載惡意腳本…

最好用的wordpress外貿主題

產品展示獨立站wordpress主題 橙色的首頁大banner外貿英文wordpress主題,適合用于產品展示型的外貿網站。 https://www.jianzhanpress.com/?p8556 Machine機器wordpress模板 寬屏簡潔實用的wordpress外貿建站模板,適合工業機器生產、加工、制造的外貿…

Q1:Go協程、Channel通道 被close后,讀會帶來什么問題?

在 Go 語言中,Channel(通道)關閉后讀取的行為是一個常見但需要謹慎處理的問題。以下是詳細的分析和注意事項: 1. 關閉 Channel 后讀取的行為 (1) 讀取已關閉的 Channel 剩余數據仍可讀取: 關閉 Channel 后&#xff0…

【AI Study】第三天,Python基礎 - 同NumPy類似的類庫

學習計劃:AI Study,學習計劃源碼地址:https://github.com/co-n00b/AI-Study.git 2025-05-23 在學習NumPy的過程中,除了了解NumPy之外,我們也對比看看其他類似的類庫都有什么?各自的優缺點是什么&#xff1…

基于aspnet,微信小程序,mysql數據庫,在線微信小程序汽車故障預約系統

詳細視頻:【基于aspnet,微信小程序,mysql數據庫,在線微信小程序汽車故障預約系統。-嗶哩嗶哩】 https://b23.tv/zfqLWPV

人工智能100問?第32問:什么是遷移學習?

目錄 一、通俗解釋 二、專業解析 三、權威參考 遷移學習就是讓AI把在一個任務中學到的本事,拿來加速另一個任務的學習,實現“舉一反三”。 一、通俗解釋 想象你已經學會了打乒乓球,現在去學打網球,是不是會學得更快&#xff…

Linux之概述和安裝vm虛擬機

文章目錄 操作系統概述硬件和軟件操作系統常見操作系統 初識LinuxLinux的誕生Linux內核Linux發行版 虛擬機介紹虛擬機 VMware WorkStation安裝虛擬化軟件VMware WorkStation 安裝查看VM網絡連接設置VM存儲位置 在VMware上安裝Linux(發行版CentOS7)安裝包獲取CentOS7 安裝 Mac系…

兩個mysql的maven依賴要用哪個?

背景 <dependency><groupId>mysql</groupId><artifactId>mysql-connector-java</artifactId> </dependency>和 <dependency><groupId>com.mysql</groupId><artifactId>mysql-connector-j</artifactId> &l…

復雜項目中通過使用全局變量解決問題的思維方式

最近接手了一個公司的老系統的PHP項目&#xff0c;里面的代碼比較混亂&#xff0c;排查解決了一個問題&#xff0c;決定將這個思路記錄下來&#xff0c;希望能幫助更多的人。 其中一部分的代碼信息如下&#xff1a; 備注&#xff1a;為了避免公司的相關數據信息暴露&#xff0…

V9數據庫替換授權

文章目錄 環境文檔用途詳細信息 環境 系統平臺&#xff1a;Linux x86-64 Red Hat Enterprise Linux 7 版本&#xff1a;9.0 文檔用途 1、本文檔用于指導V9數據庫替換授權。 2、V9數據庫授權文件為license.dat。 詳細信息 1、上傳新的授權文件到服務器并修改授權文件屬主為…

初識 Flask 框架

目錄 1. Flask 框架概述 1.1 安裝 Flask 1.2 創建你的第一個 Flask 應用 1.3 運行 Flask 應用 2. Flask 路由與視圖函數 2.1 動態路由 2.2 支持多種 HTTP 請求方法 2.3 使用 Jinja2 模版渲染 HTML 2.5 模版繼承與塊 3. Flask 表單處理與用戶輸入 3.1 安裝 Flask-WTF …

《深入剖析:Python自動化測試框架之unittest與pytest》

unittest作為Python標準庫的一部分&#xff0c;猶如一位沉穩可靠的“老工匠”&#xff0c;默默為無數項目提供著堅實的測試基礎。它誕生于Python社區長期的實踐沉淀&#xff0c;擁有一套標準化的測試體系&#xff0c;就像一套精密的儀器&#xff0c;各個部件各司其職。 unitte…

【Python 命名元祖】collections.namedtuple 學習指南

&#x1f4da; collections.namedtuple 學習指南 命名元組&#xff08;namedtuple&#xff09;是 Python collections 模塊中一種增強型元組&#xff0c;支持通過字段名訪問元素&#xff0c;同時保持元組的內存效率和不可變性。 一、基礎用法 1. 定義命名元組 from collectio…

iOS知識復習

block原理 OC block 是個結構體&#xff0c;內部有個一個結構體成員 專門保存 捕捉對象 Swift閉包 是個函數&#xff0c;捕獲了全局上下文的常量或者變量 修改數組存儲的內容&#xff0c;不需要加_block,修改數組對象本身時需要 weak原理 Weak 哈希表 &#xff08;散列表&a…

手眼標定:九點標定、十二點標定、OpenCV 手眼標定

因為一直使用6軸協作機器人&#xff0c;且主要應用是三維視覺&#xff0c;平常的手眼標定基本都是基于OpenCV來計算的&#xff0c;聽說有九點標定和十二點標定&#xff0c;順便了解下。 目錄 1.九點標定1.1 基本原理1.2 關于最小二乘法1.3 具體示例 2.十二點標定3.OpenCV 手眼標…

CSS之元素定位

元素定位 一、什么是元素定位 元素定位&#xff08;CSS Positioning&#xff09; 是指通過CSS的 position 屬性控制HTML元素在頁面中的布局方式。它決定了元素如何相對于其父元素、視口或其他元素進行位置調整。 CSS的 position 屬性用于控制元素在頁面上的定位方式&#xff…

測試工程師如何通俗理解和入門RAG:從“查資料”到“寫答案”的智能升級

1. 為什么要學習RAG?——從“查資料”到“寫答案”的飛躍 背景:你已經掌握了Embedding技術,能將文檔、代碼、測試用例等離散信息轉化為向量,用于相似度匹配。 痛點:但僅靠向量匹配找到相關文檔后,如何快速生成答案?如何避免“找到文檔卻不會總結”的尷尬? RAG的價值:…

數量優勢:使用Bagging和Boosting的集成模型

文章目錄 裝袋法&#xff08;Bagging&#xff09;和提升法&#xff08;Boosting&#xff09;利用集成學習創建強大的模型裝袋法&#xff08;Bagging&#xff09;&#xff1a;為機器學習模型增加穩定性裝袋法示例 提升法&#xff08;Boosting&#xff09;&#xff1a;減少弱學習…