車道線檢測----CLRERNet

CLRerNet:利用LaneIoU提升車道檢測置信度

摘要

車道標檢測在自動駕駛和駕駛輔助系統中至關重要。現代深度車道檢測方法在車道檢測基準測試中表現出色。通過初步的預言機實驗,我們首次拆解車道表示組件以確定研究方向。我們表明,正確的車道位置已存在于現行車道檢測器的預測中,并且準確表示與真實值IoU的置信度分數最有益。基于這一發現,我們提出了LaneIoU,它通過考慮局部車道角度與評估指標更相關。我們開發了一種名為CLRerNet的新檢測器,其在目標分配成本和損失函數中采用LaneIoU,旨在提升置信度分數質量。通過仔細設計的基準測試,包括交叉驗證,我們證明CLRerNet大幅超越現有技術——在CULane上的F1分數為81.43%,相比現有方法的80.47%;在CurveLanes上為86.47%,相比86.10%。代碼和模型可在 GitHub 上獲取。

1. 引言

車道檢測在自動駕駛和駕駛輔助系統中起著重要作用。與其他計算機視覺任務一樣,卷積神經網絡(CNN)的出現推動了車道檢測性能的快速發展。現代車道檢測方法按車道實例表示可分為四類。分割基準[18,27]和關鍵點基準[21]分別將車道視為分割掩碼和關鍵點。參數表示方法[25,16]利用曲線參數回歸車道形狀。行基準表示[24,28,19,20,15]將車道視為特定水平線上的坐標集。前兩類被用于自下而上的檢測范式,直接在圖像中檢測車道位置,隨后將其分組為車道實例。后兩類被用于自上而下的實例檢測方法,每個車道檢測被視為全局車道實例和局部車道點集。行基準表示在檢測性能方面已成為事實上的標準。我們選擇CLRNet作為基線。

車道檢測的性能依賴于車道點定位和實例級分類。車道檢測基準[18,7]采用基于分割掩碼的IoU作為評估指標。預測車道中得分高于預設閾值的被視為有效預測以計算F1分數。因此,預測車道與真實車道的分割基準IoU應較大,分類分數應較高。為確定研究方向,我們首先進行初步預言機實驗。將置信度分數替換為預言機值后,F1分數接近完美(98.47%)。這表明正確車道已在預測中,置信度分數需更準確地表示與真實值的IoU。圖1(中)顯示了所有預測(藍色)和真實值(虛線橙色)的比較。預測的置信度分數與顏色深度成正比。最左側的預測是高置信度假陽性,錯過了真實值,但在真實值附近存在高IoU的低置信度預測。

下一個問題是:如何將基于分割的IoU作為學習目標?在行基準方法中,預測和真實車道均表示為固定行上的x坐標。[28]引入LineIoU損失逐行測量交集和并集并分別求和。但這種方法與基于分割的 IoU 不等價,特別是對于非垂直、傾斜車道(例如圖1底部)或曲線。我們引入新的IoU——LaneIoU,考慮車道的局部角度。LaneIoU整合每行的角度感知交集和并集以匹配基于分割的IoU。行基準方法為每個錨點學習全局車道概率分數。最近目標檢測器中采用的動態樣本分配[4,5]在車道檢測訓練中也有效[28]。IoU矩陣和成本矩陣分別確定每個真實車道分配的錨點數量和分配的錨點。置信度目標被設置為正(一)。因此,樣本分配負責學習置信度分數。我們引入LaneIoU到樣本分配中,使檢測器的置信度分數接近基于分割的IoU。LaneIoU動態確定每個真實車道分配的錨點數量,并作為成本函數優先分配錨點。此外,用于回歸水平坐標的IoU 損失也被我們的LaneIoU替代,以適當懲罰不同傾斜角度的預測車道。將LaneIoU集成到CLRNet中,使檢測器訓練更直接,因此我們將其命名為CLRerNet。我們通過在CULane和CurveLanes上的廣泛實驗展示了LaneIoU的有效性,并報告了最新的基準測試結果。重要的是,為確保基準測試的可靠性和公平性,我們采用五種模型的平均分數作為每個實驗條件的結果,而以往工作僅顯示單一模型的分數。此外,由于車道檢測評估中的F1指標對檢測器的車道置信度閾值極為敏感,我們利用訓練集的5折交叉驗證確定閾值。我們的貢獻如下:

  • 明確研究方向:通過初步預言機實驗,我們表明正確的車道位置已存在于現檢測器的預測中,并且表示與真實值的IoU的置信度分數最有益于提升性能。

  • 明確訓練方法:我們采用與評估指標高度相關的LaneIoU作為車道相似性函數并將其集成到訓練中作為樣本分配成本和回歸目標。

  • 明確基準測試:采用多模型評估和基于交叉驗證的分數閾值確定,確保公平基準測試。LaneIoU的有效性和通用性得到驗證,CLRerNet在CULane和CurveLanes基準測試中達到最新水平。

2. 相關工作

2.1 目標檢測

樣本分配:樣本分配是目標檢測的主要研究重點。從檢測頭生成的提議被分配給真實樣本。[22,13,8,12]通過在特征圖網格和真實框之間靜態計算IoU來分配真實樣本。[4]為對象檢測器的訓練樣本分配引入最優傳輸分配(OTA),動態分配預測框給真實樣本。[5]簡化OTA并實現無迭代分配。IoU函數:提出了幾種IoU函數的變體[23,29,30],用于準確的邊界框回歸和快速收斂。例如,廣義IoU(GIoU)[23]引入最小凸包的概念,即使邊界框不重疊,也能使IoU可微。我們的LaneIoU基于GIoU,但新增了在行基準表示中計算曲線之間的IoU功能。

2.2 車道檢測

車道檢測范式根據車道表示類型分為四類,即基于分割、基于關鍵點、基于行和基于參數的表示。

  • 基于分割的表示:這類工作是基于像素的車道存在概率估計。SCNN[18]和RESA[27]采用語義分割范式,在每個像素上將車道實例分類為不同類別。車道與類別的對應關系由注釋確定,因此不夠靈活(例如某些車道位置可能屬于兩個類別)。基準數據集[18,7]采用像素級IoU比較預測車道與真實車道,對基于分割的方法較為友好。然而,這些方法不將車道視為整體實例,需要計算成本高昂的后處理。[19,28]僅在訓練期間利用分割任務作為輔助損失以改進骨干網絡。我們遵循這些方法,采用輔助分支和損失。

  • 基于行的表示:車道實例被表示為固定行上的x坐標集。LaneATT[24]采用車道錨點來學習每個錨點的置信度分數和局部x坐標偏移。錨點被定義為固定角度和起點。訓練目標根據每個錨點與真實車道之間的水平距離靜態分配CLRNet[28]采用可學習的錨點參數(起點xa、ya和θa)和長度l對于樣本分配,采用簡化最優傳輸分配[5]動態分配最近的預測給每個真實車道。這兩種方法通過錨點池化特征圖,并將提取的特征輸入到頭部網絡。頭部網絡輸出每個錨點的分類和回歸張量。這種范式對應于兩階段目標檢測方法,如[13,8]。UFLD[19]通過展平特征圖捕獲全局特征,并學習行-wise車道位置分類。UFLDv2[20]擴展[19],增加列-wise車道表示以處理近水平車道。CondLaneNet[15]從車道起點的概率熱圖中學習,并從中提取動態卷積核。動態卷積被應用于特征圖,從而完成行-wise車道點分類和x坐標回歸。LaneFormer[6]采用具有行和列注意力的變換器,以端到端的方式檢測車道實例。此外,車輛檢測結果被輸入到解碼器中,使管道具備對象感知能力。在四種表示類型中,基于行的表示在檢測性能方面已成為事實上的標準。

3. 方法

3.1 網絡設計和損失函數

基于行的表示[28,15,24]采用了四種類型中最準確但簡單的檢測流程。我們從基于行的方法中選擇性能最佳的CLRNet[28]作為基線。網絡示意圖如圖2所示。骨干網絡(例如ResNet[9]和DLA[26])和上采樣網絡提取多級特征圖,其空間維度為輸入圖像的1/8、1/16、1/32。初始錨點由Na個可學習的錨點參數(xa、ya、θa)形成,其中(xa、ya)是起點,θa是錨點的傾斜度。沿每個錨點采樣特征圖并輸入到卷積和全連接(FC)層。FC層輸出分類 logits c、錨點細化 δxa、δya、δθa、長度 l 和局部x坐標細化 δx張量通過δxa、δya和δθa細化的錨點重新采樣更高分辨率的特征圖,并重復該過程三次。池化特征通過交叉注意力與特征圖交互,并在不同細化階段進行連接。車道預測表示為分類(置信度)logits和從最終xa、ya、θa、l和δx計算出的在Nrow行上的x坐標集。更多關于細化機制的細節可在[28]中找到。在訓練期間,通過動態分配器[5]將接近真實車道的預測分配給真實車道。分配的預測被回歸到對應的真實車道,并學習被分類為正類。

本文來自互聯網用戶投稿,該文觀點僅代表作者本人,不代表本站立場。本站僅提供信息存儲空間服務,不擁有所有權,不承擔相關法律責任。
如若轉載,請注明出處:http://www.pswp.cn/diannao/83349.shtml
繁體地址,請注明出處:http://hk.pswp.cn/diannao/83349.shtml
英文地址,請注明出處:http://en.pswp.cn/diannao/83349.shtml

如若內容造成侵權/違法違規/事實不符,請聯系多彩編程網進行投訴反饋email:809451989@qq.com,一經查實,立即刪除!

相關文章

ML307R 的 USB Vendor ID (VID):0x2ECC ML307R 的 USB Product ID (PID):0x3012

可以的,在文檔的「Table 3. VID、PID查詢表」中明確指出: ML307R 的 USB Vendor ID (VID):0x2ECCML307R 的 USB Product ID (PID):0x3012 你可以將這對 VID/PID 加到 Linux 的 option 驅動中,比如: ech…

論信息系統項目的范圍管理

論信息系統項目的范圍管理 前言一、規劃范圍管理,收集需求二、定義范圍三、創建工作分解結構四、確認范圍五、控制范圍 前言 為了應對煙草零售客戶數量大幅度增長所帶來的問題,切實履行控煙履約的相關要求,同時也為了響應國務院“放管服”政策…

MongoDB與PostgreSQL兩個數據庫的特點詳細對比

MongoDB 和 PostgreSQL 是兩種不同類型的數據庫,分別屬于 ??NoSQL(文檔型)?? 和 ??關系型(SQL)?? 數據庫。它們在數據模型、查詢語言、擴展性、事務支持等方面有顯著差異。以下是詳細對比: ??1. …

計算機網絡:什么是電磁波以及有什么危害?

電磁波詳解 電磁波(Electromagnetic Wave)是由電場和磁場相互激發、在空間中傳播的能量形式。它既是現代通信的基石(如手機、Wi-Fi、衛星信號),也是自然界中光、熱輻射等現象的本質。以下從定義、產生、特性、分類及應用全面解析: 一、電磁波的本質 1. 核心定義 電場與…

如何使用 Solana Yellowstone gRPC 重新連接和重放插槽

Yellowstone gRPC 是一個功能強大、可用于生產環境且經過實戰檢驗的工具,用于流式傳輸實時的 Solana 數據。但在實際條件下,網絡中斷或服務器重啟可能導致連接中斷。如果沒有適當的重連策略,你的應用程序可能會錯過區塊鏈的關鍵更新。 為了防…

foxmail - foxmail 啟用超大附件提示密碼與帳號不匹配

foxmail 啟用超大附件提示密碼與帳號不匹配 問題描述 在 foxmail 客戶端中,啟用超大附件功能,輸入了正確的賬號(郵箱)與密碼,但是提示密碼與帳號不匹配 處理策略 找到 foxmail 客戶端目錄/Global 目錄下的 domain.i…

MySQL 事務(一)

文章目錄 CURD不加控制,會有什么問題CURD滿足什么屬性,能解決上述問題?什么是事務為什么要有事務事務的版本支持了解事務的提交方式 事務常見操作方式研究并發場景事務的正常操作事務的非正常情況的案例結論事務操作的注意事項 CURD不加控制&…

CSS面試題匯總

在前端開發領域,CSS 是一項不可或缺的技術。無論是頁面布局、樣式設計還是動畫效果,CSS 都扮演著重要的角色。因此,在前端面試中,CSS 相關的知識點往往是面試官重點考察的內容。為了幫助大家更好地準備面試,本文匯總了…

Java 后端給前端傳Long值,精度丟失的問題與解決

為什么后端 Long 類型 ID 要轉為 String? 在前后端分離的開發中,Java 后端通常使用 Long 類型作為主鍵 ID(如雪花算法生成的 ID)。但如果直接將 Long 返回給前端,可能會導致前端精度丟失的問題,特別是在 J…

對稱二叉樹的判定:雙端隊列的精妙應用

一、題目解析 題目描述 給定一個二叉樹,檢查它是否是鏡像對稱的。例如,二叉樹 [1,2,2,3,4,4,3] 是對稱的: 1/ \2 2/ \ / \ 3 4 4 3而 [1,2,2,null,3,null,3] 則不是鏡像對稱的: 1/ \2 2\ \3 3問題本質 判斷一棵二叉…

C#數組與集合

🧠 一、數組(Array) 1. 定義和初始化數組 // 定義并初始化數組 int[] numbers new int[5]; // 默認值為 0// 聲明并賦值 string[] names { "Tom", "Jerry", "Bob" };// 使用 new 初始化 double[] scores …

本地部署Scratch在線編輯器

1、說明 由于在GitHub上沒有找到Scratch源碼,所以只能編寫腳本下載官網相關資源,然后在本地部署。 如果你找到了Scratch源碼,請自行編譯部署,可忽略以下操作。 項目結構:scratch.mit.edu |-- chunks | |-- fetch-w…

Gmsh 讀取自定義輪廓并劃分網格:深入解析與實踐指南

一、Gmsh 簡介 (一)Gmsh 是什么 Gmsh 是一款功能強大的開源有限元網格生成器,廣泛應用于工程仿真、數值模擬以及計算機圖形學等領域。它為用戶提供了從幾何建模到網格劃分的一整套解決方案,能夠有效處理復雜幾何形狀,生成高質量的二維和三維網格,滿足多種數值方法的需求…

Elabscience 精準識別 CD4+ T 細胞|大鼠源單克隆抗體 GK1.5,適配小鼠樣本的流式優選方案

內容概要 CD4 T細胞在免疫調節、自身免疫疾病及腫瘤免疫治療中發揮關鍵作用。Elabscience推出的APC Anti-Mouse CD4 Antibody (GK1.5)(貨號:E-AB-F1097E)是一款高特異性、低背景的流式抗體,專為小鼠CD4 T細胞亞群檢測優化設計。該…

【RabbitMQ】應用問題、仲裁隊列(Raft算法)和HAProxy負載均衡

🔥個人主頁: 中草藥 🔥專欄:【中間件】企業級中間件剖析 一、冪等性保障 什么是冪等性? 冪等性是指對一個系統進行重復調用(相同參數),無論同一操作執行多少次,這些請求…

51 單片機頭文件 reg51.h 和 reg52.h 詳解

51 單片機頭文件詳解 51 單片機的頭文件reg51.h和reg52.h是開發中非常重要的文件,它們定義了單片機的特殊功能寄存器 (SFR) 和位地址。以下是對這兩個頭文件的詳細解析: 1. 頭文件概述 reg51.h:針對標準 8051 單片機(4KB ROM, 128B RAM) reg52.h:針對增強型 8052 單片…

前端的面試筆記——JavaScript篇(二)

一、instanceof 在 JavaScript 里,instanceof 是一個相當實用的運算符,它的主要功能是檢查某個對象是否屬于特定構造函數的實例。這里需要明確的是,判斷的依據并非對象的類型,而是其原型鏈。下面為你詳細介紹它的用法和特點&…

”一維前綴和“算法原理及模板

前綴和,就是通過一種方法來求出數組中某個連續區間的元素的和的辦法。我們通常先預處理出來一個前綴和數組,然后把數組中進行元素填充后再進行后續使用。 我們通過一道模板題或許能更加理解其意思。 現在的問題就是:如果我們用暴力枚舉來記錄…

5.13/14 linux安裝centos及一些操作命令隨記

一、環境準備 VMware Workstation版本選擇建議 CentOS 7 ISO鏡像下載指引 虛擬機硬件配置建議(內存/處理器/磁盤空間) 二、系統基礎命令 一、環境準備 1.VMware Workstation版本選擇建議 版本選擇依據 選擇VMware Workstation的版本時&#xff0c…

spring學習->sprintboot

spring IoC(控制翻轉): 控制:資源的控制權(資源的創建,獲取,銷毀等) 反轉:和傳統方式不一樣(用上面new什么),不用new讓ioc來發現你用什么,然后我來給什么 DI:(依賴注入) 依賴:組件的依賴關系。如newsController依賴NewsServi…