深度學習loss總結(二)

       對于目前深度學習主流任務學習,loss的設置至關重要。下面就不同任務的loss設置進行如下總結:

(1)目標檢測

2D/3D目標檢測中的 Loss(損失函數)是訓練模型時優化目標的核心,通常包括位置、類別、尺寸、方向等多個方面。以下是目前 常見的 2D 和 3D 目標檢測 Loss 分類與總結


?? 一、2D 目標檢測常見 Loss

2D 目標檢測常見于圖像(如 COCO、VOC),其 Loss 主要分為以下三類:

1. 分類損失(Classification Loss)
  • Cross Entropy Loss:最常用,如 Faster R-CNN、YOLOv3。

  • Focal Loss:用于處理前景/背景不均衡,如 RetinaNet。

2. 邊界框回歸損失(Bounding Box Regression Loss)
  • Smooth L1 Loss / Huber Loss:常用于 R-CNN 系列。

  • IoU Loss:直接優化 IoU,穩定性更好。

  • GIoU / DIoU / CIoU Loss(用于 YOLOv4/v5 等):

    • GIoU: Generalized IoU,考慮重疊與包圍。

    • DIoU: Distance IoU,考慮中心距離。

    • CIoU: Complete IoU,綜合中心、面積和長寬比。

3. 輔助任務損失
  • Objectness Loss:YOLO 系列判斷該區域是否有目標。

  • Center-ness Loss:FCOS 中判斷中心點可信度。

  • Heatmap Loss(如 CornerNet, CenterNet):

    • 用高斯熱圖回歸目標中心點,常用 MSE 或 focal loss


?? 二、3D 目標檢測常見 Loss

3D 檢測用于點云(如 KITTI、nuScenes、Waymo),損失函數更加復雜,涵蓋了空間維度、方向等:

1. 分類損失
  • 同 2D 檢測,使用 CrossEntropy/Focal Loss。

  • 在 anchor-based 方法中用于前背景分類。

2. 3D 邊界框回歸損失
  • 通常為多項組合,包括中心位置、大小、方向等:

? 位置損失:
  • L1 / Smooth L1:對中心點 (x,y,z)(x, y, z)。

  • Center Distance Loss:點云中心與GT中心的距離。

? 尺寸損失:
  • 對 w,h,lw, h, l 使用 L1/Smooth L1。

? 朝向損失(方向角):
  • 角度回歸 loss:L1 / Smooth L1。

  • 角度分類 loss:方向離散為多個 bin,使用分類損失。

  • Sin-Cos 回歸 loss:使用 sin?(θ),cos?(θ)\sin(\theta), \cos(\theta) 規避周期性問題。

3. IoU類損失
  • 3D IoU Loss(較難優化但直觀):如 PointRCNN。

  • BEV IoU Loss(Bird's Eye View):簡化空間問題。

4. 關鍵點 / 熱力圖損失
  • Heatmap Loss(如 CenterPoint, PV-RCNN)用于預測中心點。

    • 通常為 Gaussian Focal Loss

  • Offset Loss:預測熱圖中心點到真實中心點的偏移量。

5. 方向不變性損失
  • Corner Loss(如 Frustum-PointNet):

    • 通過角點預測反推旋轉和平移,更魯棒。

  • Chamfer Distance(點云匹配):在 PointNet++ 等方法中。


?? 三、檢測 Loss 組合示意

模型 分類 Loss 回歸 Loss 特殊項
Faster R-CNN Cross Entropy Smooth L1 -
YOLOv5 BCE / Focal CIoU Loss Objectness Loss
RetinaNet Focal Loss Smooth L1 -
CenterNet Heatmap Loss Offset + Size (L1) -
PointRCNN Focal + IoU 3D Box Regression + Corner Loss Direction Class
PV-RCNN Heatmap + CE L1 + 3D IoU + Sin-Cos Angle Loss RoI Pool + BEV Match
CenterPoint Heatmap + CE Offset + Size + Direction (multi-part) Gaussian Focal + Direction Bin

? 總結:選擇檢測 Loss 的核心要點

目標 推薦 Loss 類型
二分類 / 多分類

本文來自互聯網用戶投稿,該文觀點僅代表作者本人,不代表本站立場。本站僅提供信息存儲空間服務,不擁有所有權,不承擔相關法律責任。
如若轉載,請注明出處:http://www.pswp.cn/web/91629.shtml
繁體地址,請注明出處:http://hk.pswp.cn/web/91629.shtml
英文地址,請注明出處:http://en.pswp.cn/web/91629.shtml

如若內容造成侵權/違法違規/事實不符,請聯系多彩編程網進行投訴反饋email:809451989@qq.com,一經查實,立即刪除!

相關文章

【Linux網絡】netstat 的 -anptu 各個參數各自表示什么意思?

netstat 是一個網絡統計工具,它可以顯示網絡連接、路由表、接口統計、偽裝連接和多播成員資格。在 netstat 命令中,不同的參數可以用來定制輸出的內容。 你提到的 -anptu 參數組合各自的功能如下: -a (all): 顯示所有活動的連接和監聽端口。它…

[硬件電路-115]:模擬電路 - 信號處理電路 - 功能放大器工作分類、工作原理、常見芯片

功能放大器是以特定功能為核心的集成化放大電路,通過將運算放大器與外圍電阻、電容等元件集成在單一芯片中,實現標準化、高性能的信號放大功能。其核心優勢在于簡化設計流程、提升系統穩定性,并針對特定應用場景優化性能參數。以下從定義、分…

雙網卡UDP廣播通信機制詳解

UDP廣播通信機制詳解 一、通信流程分析 發送階段 通過Client.Bind(192.168.0.3, 60000)將UDP套接字綁定到指定網卡和端口設置RemoteHost "255.255.255.255"實現全網段廣播數據流向:192.168.0.3:60000 → 255.255.255.255:50000 接收階段 設備響應數據應返…

從遮擋難題到精準測量:激光頻率梳技術如何實現深孔 3D 輪廓的 2um 級重復精度?

一、深孔 3D 輪廓測量的遮擋困境深孔結構(如航空發動機燃油噴嘴孔、模具冷卻孔)因孔深大(常超 100mm)、深徑比高(>10:1),其 3D 輪廓測量長期受限于光學遮擋難題。傳統光學測量技術&a…

.NET 依賴注入(DI)全面解析

文章目錄一、依賴注入核心原理1. 控制反轉(IoC)與DI關系2. .NET DI核心組件二、服務生命周期1. 三種生命周期類型三、DI容器實現原理1. 服務注冊流程2. 服務解析流程四、高級實現方法1. 工廠模式注冊2. 泛型服務注冊3. 多實現解決方案五、ASP.NET Core中的DI集成1. 控制器注入2…

K8S部署ELK(二):部署Kafka消息隊列

目錄 1. Kafka 簡介 1.1 Kafka 核心概念 (1)消息系統 vs. 流處理平臺 (2)核心組件 1.2 Kafka 核心特性 (1)高吞吐 & 低延遲 (2)持久化存儲 (3)分…

Rust進階-part1-智能指針概述-box指針

Rust進階[part1]_智能指針概述&box指針 智能指針概述 在Rust中,智能指針是一類特殊的數據結構,它們不僅像普通指針一樣可以引用數據,還帶有額外的元數據和功能。與普通指針不同,智能指針通常使用結構體實現,并且會實現 Deref 和 Drop 等特定的trait,以提供更強大的…

C++擴展 --- 并發支持庫(補充1)

C擴展 --- 并發支持庫(下)https://blog.csdn.net/Small_entreprene/article/details/149606406?fromshareblogdetail&sharetypeblogdetail&sharerId149606406&sharereferPC&sharesourceSmall_entreprene&sharefromfrom_link atom…

在Three.js中導入和添加自定義網格的最佳實踐 - 綜合指南

探索在Three.js中導入和添加自定義網格的最佳實踐。本指南涵蓋增強 3D 項目的技術、技巧和實際示例。 添加圖片注釋,不超過 140 字(可選) 強烈建議使用 GLTF 格式來集成 3D 幾何體,提供簡化的流程,并固有地支持動畫、…

Redis知識點(1)

目錄 Redis Redis和MySQL的區別 Redis的高可用方案 Redis可以用來做什么 Redis的數據類型 字符串 列表 哈希 集合 有序集合 Bitmap Redis為什么快呢? I/O多路復用 說說select,poll,epoll,kqueue,IOCP的區別 Redis為什么早期選擇單線程? …

使用iptables封禁惡意ip異常請求

查看后端日志發現一IP(103.76.250.29)頻繁請求不存在的資源路徑??(如 /api/v1/guest/comm/config、/theme/default/assets/compoments.js 等),并伴隨對根路徑 / 的正常訪問。這種行為的可能性包括惡意掃描、自動化工…

BehaviorTree.Ros2 編譯教程

1. 源碼下載 git clone https://github.com/BehaviorTree/BehaviorTree.ROS2.git2. 編譯過程 源碼中有3個項目: btcpp_ros2_interfacesbtcpp_ros2_interfacesbtcpp_ros2_samples 2.1 編譯btcpp_ros2_interfaces: colcon --packages-select btcpp_ros2_interfaces2.2 編譯 …

AR智能巡檢系統:制造業設備管理的效率革新

隨著工業4.0和數字化轉型的加速,設備管理在制造業、能源、交通等關鍵領域的重要性愈發凸顯。傳統設備巡檢依賴人工記錄和紙質報告,不僅效率低下,還容易因人為疏忽導致數據錯誤或安全隱患。然而,增強現實(AR www.teamhe…

破解海外倉客戶響應難題:自動化系統是關鍵

在跨境電商蓬勃發展的當下,海外倉作為連接賣家與終端消費者的重要樞紐,其服務效率直接影響著賣家的運營成果。其中,即時客戶響應一直是行業痛點,尤其對中小型海外倉而言,單純依靠人力維持全天候服務意味著高昂的成本壓…

PyTorch基礎——張量計算

文章目錄PyTorch基礎——張量計算1 什么是張量計算?2 基本算術運算2.1 加法運算2.1.2 torch.add2.1.3 a.add(b) 與 a.add_(b)a.add(b) 方法a.add_(b) 方法核心區別2.2 減法運算2.2.1 toch.sub()2.2.2 a.sub(b) 和a.sub_(b)a.sub(b) 方法a.sub_(b) 方法核心區別使用建…

云原生聯調利器:Telepresence實戰

Telepresence在云原生聯調中的應用:本地服務直連K8s集群實戰在云原生開發中,調試和測試服務常常需要本地環境與遠程Kubernetes(K8s)集群無縫集成。Telepresence是一個開源工具,它允許開發者將本地服務“注入”到K8s集群…

瀏覽器【詳解】requestIdleCallback(瀏覽器空閑時執行)

簡介requestIdleCallback 是瀏覽器的一個 API,用于在瀏覽器空閑時間執行低優先級任務,避免阻塞主線程,提升頁面性能和響應速度。 當瀏覽器完成了關鍵任務(如渲染、布局、用戶交互處理)且暫時沒有更高優先級的工作時&am…

STP技術

一、環路的危害1.現象鏈路指示燈快速閃爍MAC表震蕩:交換機頻繁修改MAC地址表 → 轉發失效。2.環路危害造成的影響鏈路堵塞主機操作系統響應遲緩二層交換機管理緩慢沖擊網關設備的CPU三、STP的作用1.STP基本原理STP即生成樹協議,它通過阻斷冗余鏈路來消除…

RAGFLOW~knowledge graph

start 為了增強多跳問答,RAGFlow在數據提取和索引之間增加了一個知識圖譜構建步驟,如下面所示。這一步驟會從您指定的分塊方法生成的現有塊中創建額外的塊。 從v0.16.0版本開始,RAGFlow支持在知識庫上構建知識圖譜,允許你在知識庫…

機器學習【二】KNN

KNN算法是一種基于實例的惰性學習算法,其核心思想是通過"多數投票"機制進行分類決策。算法流程包括數據準備(需歸一化處理)、距離計算(常用歐氏距離)、選擇K值(通過交叉驗證確定)和決…