【論文解讀】Uncertainty Quantification of Collaborative Detection for Self-Driving

Uncertainty Quantification of Collaborative Detection for Self-Driving

  • 摘要
  • 引言
  • 方法
    • 問題定義
    • 方法概覽
    • Double-M
  • 實驗
  • 結論

摘要

在聯網和自動駕駛汽車(CAVs)之間共享信息從根本上提高了自動駕駛協同目標檢測的性能。然而,由于實際挑戰,CAV 在目標檢測方面仍然存在不確定性,這將影響自動駕駛中的后續模塊,例如規劃和控制。因此,不確定性量化對于 CAV 等安全關鍵系統至關重要。我們的工作是第一個估計協作目標檢測的不確定性的工作。我們提出了一種新的不確定性量化方法,稱為雙 M 量化,它通過直接建模邊界框每個角的多變量高斯分布來調整移動塊引導 (MBB) 算法。我們的方法通過基于離線雙 M 訓練過程的一次推理傳遞來捕獲認知不確定性和任意不確定性。它可以用于不同的協作對象檢測器。通過對綜合協同感知數據集進行了實驗,我們表明與最先進的不確定性量化方法相比,我們的 Double-M 方法在不確定性得分上提高了 4× 以上,準確率提高了 3% 以上。我們的代碼在 https://coperception.github.io/double-m-quantification/

引言

在本文中,我們提出了一種新的用于協同目標檢測的不確定性量化方法,稱為DoubleM量化(直接建模移動塊自舉量化),它只需要一個推理通道即可捕獲認知和任意不確定性。我們的方法為每個檢測到的目標構建的不確定性集有助于后續模塊完成自動駕駛任務,如不確定性傳播的軌跡預測[25]和魯棒規劃與控制[26],[27]。從圖1可以看出,采用我們的不確定性量化方法,檢測精度低的目標往往具有較大的不確定性,構建的不確定性集在大多數情況下覆蓋了ground-truth bounding box。與目前的現狀[20],[21]相比,我們的Double-M Quantification方法在綜合協同感知數據集V2X-SIM上的不確定性評分提高了4倍,準確率提高了3.04%[1]。
在這里插入圖片描述
圖1:左圖為鳥瞰圖(BEV)中間協同的檢測結果,右圖對特定部分進行放大,顯示兩種檢測的魯棒范圍。紅框代表預測,綠框代表事實。橙色橢圓表示每個角的協方差。陰影凸包表示被檢測對象的不確定性集。在大多數情況下,陰影凸包覆蓋綠色邊界框,這有助于后續模塊完成自動駕駛任務,如不確定性傳播的軌跡預測[25]和魯棒規劃與控制[26],[27]。采用我們的Double-M量化方法,檢測精度低的目標往往具有較大的不確定性。

我們的貢獻:
1)據我們所知,我們提出的Double-M量化是第一次嘗試估計協同目標檢測的不確定性。我們的方法定制了一種移動塊自舉算法來估計。在一個推理過程中,認知不確定性和任意不確定性同時存在。
2)設計了一種新的直接建模分量中邊界盒不確定性的表示格式,以估計任意不確定性。我們將邊界框的每個角視為一個獨立的多變高斯分布,每個角的協方差矩陣由一個輸出頭估計,而現有文獻主要假設每個角的每個維度都是單變高斯分布或所有角都是高維高斯分布。
3)我們驗證了基于V2X-SIM[1]的方法的優勢,并表明我們的雙m量化方法減少了不確定性,提高了精度。結果還驗證了在自動駕駛汽車之間共享中間特征信息有利于系統提高準確性和減少不確定性。

方法

在本節中,我們首先定義了協作目標檢測的不確定性量化問題。然后,我們描述了我們的新型DoubleM量化(直接建模移動塊自舉量化)方法的總體結構,如圖2所示,然后是詳細的算法過程。最后,我們定義了神經網絡模型的損失函數。一個主要的新穎之處是首次定制了移動塊引導34算法,以解決協作對象檢測的不確定性量化挑戰,并在離線訓練過程中通過一次推理來估計認知和任意不確定性。該算法不依賴于特定的神經網絡模型或結構,可以與不同的協作對象檢測器(如DiscoNet[1])一起使用。相應的損失函數同時考慮預測精度和協方差作為度量
在這里插入圖片描述
圖2所示:協同目標檢測的雙m量化方法。(a)早期協作與其他代理共享原始點云,(b)中間協作與其他代理共享中間特征表示。?雙m量化方法估計每個角的多變量高斯分布。我們的雙m量化方法可用于不同的協同目標檢測。在訓練階段,Double-M Quantification定制了一種移動塊自舉算法來獲得最終的模型參數,Σa作為驗證數據集的平均任意不確定性,Σe作為所有殘差向量的協方差,用于認知不確定性。在推理階段,將Σa、Σe與目標檢測器預測的協方差矩陣↓Σ結合,計算出分布的協方差矩陣↓Σ = Σe + (1 2 Σa + 1 2↑Σ)

問題定義

在每個點云數據X中,有J個對象。對于每個對象j∈{1,…, J},我們建議預測邊界框的I個角。每個角i∈{1,…, I}由BEV映射中的d維向量表示。真實的邊界框集合Y表示為Y ={cj, {yij}I I =1}J J =1,其中c是分類標簽,而yij∈RD,?(I, J)。預測邊界框集合y表示為y ={pj, {yj, {Σij}I I =1}J J =1,其中p是預測分類概率,將邊界框的每個角建模為多元高斯分布。這里,我們假設邊界框的每個角的概率分布是獨立的。在訓練過程中,通過最小化檢測損失Ldet(Y, Y^)來共同學習編碼器E、聚合器和解碼器D的神經網絡參數,Ldet(Y, Y^)包括分類損失和考慮預測準確性和不確定性的回歸損失。

方法概覽

我們設計了一種新的不確定性量化方法,稱為直接建模移動塊自舉量化(Double-M量化),通過將MBB算法與DM方法相結合來估計認知和任意不確定性。雙m量化在協同目標檢測上的概述如圖2所示。在訓練階段,我們在重采樣的運動塊上訓練目標檢測器。經過N次bootstrap,我們得到目標檢測器f θ(其中,θ為最終模型參數),計算驗證數據集的平均任意不確定性Σa,計算所有殘差向量的認知不確定性協方差Σe。在推理階段,我們以輸入點云X為例,結合Σa、Σe和f θ (X)的預測協方差矩陣- Σij,計算多元高斯分布的協方差矩陣- Σij = Σe +(1 2 Σa + 1 2 Σij)。

bootstrap】Bootstrap 是一種統計方法,通過從原始數據集中抽取多個樣本并對這些樣本進行重新采樣,以生成多個訓練集。這些訓練集會用于訓練多個模型,從而生成多個預測結果。這種方法可以用于評估模型的穩定性和魯棒性,以及估算預測誤差。

Double-M

Monte-Carlo dropout[23]和deep ensembles[24]被用來估計認知不確定性。然而,它們都沒有考慮數據集中的時間序列特征,而時間特征對cav來說很重要。我們設計了一種新的不確定性量化方法,稱為Double-M量化,用于在考慮數據集中的時間特征時估計認知和任意不確定性。特別是,我們的設計在時間序列數據上定制了一個移動塊引導[34]過程,該過程通過在訓練過程中從構建的數據塊中采樣數據來捕獲數據內的自相關性。

在算法1中給出了雙m量化方法的訓練階段。
在這里插入圖片描述

  • 我們首先初始化協同目標檢測器的參數θ,并使用訓練數據集對模型進行預訓練。然后,我們從包含K幀的時間序列訓練數據etdk中構造定長時間序列塊集B,注意,塊集b通過保持同一塊內幀的順序來保持時間特性 (參見第2行)
  • 然后,在每次迭代中,我們使用采樣數據集重新訓練模型,該數據集包含M個從塊集B中以替換和均勻隨機概率采樣的塊 (參見第4-5行)
  • 在每個訓練迭代n的最后一步,我們在驗證數據集VK′上測試保留的模型fθn (見第6行),并將殘差向量計算為地面實況向量yijk和預測的平均向量vx yijk之間的差,?i∈[1,i],j∈[1],j],k∈[1、k′](見第7行)

經過N次迭代后,我們得到了最終的模型參數θ,以通過模型f θ來預測協方差。除了最終訓練的模型之外,我們還通過使用驗證數據集的殘差和預測協方差矩陣來估計算術和認知的不確定性。我們首先通過計算∑a來估計算術不確定性,∑a是所有預測協方差矩陣的平均值。為了估計認知不確定性,我們計算所有殘差向量的協方差矩陣,用∑e表示。
一方面,我們的雙M量化方法通過對驗證數據集上N次迭代的多個模型進行聚合,提供了袋裝算術不確定性估計。另一方面,它近似殘差的誤差分布,以便我們可以量化認識上的不確定性。

我們的雙m量化方法的推理階段如算法2所示
在這里插入圖片描述

實驗

在這里插入圖片描述
1)下限(LB)[1]:不需要協作的單個目標探測器,只使用單個激光雷達的點云數據。
2) DiscoNet (DN)[2]:中間協同目標檢測器,利用邊緣權值為矩陣值的有向圖,通過抑制噪聲空間區域,增強信息區域,自適應聚合不同agent的特征。它通過共享緊湊和上下文感知的場景表示,顯示了良好的性能-帶寬權衡。
3)上界(UB)[1]:早期協同目標檢測器使用來自所有聯網車輛的原始點云數據,如圖2(a)所示。它通常具有良好的信息無損性能,但占用較高的通信帶寬。

在這里插入圖片描述
圖3所示。我們的雙m量化結果在V2X-Sim不同場景下的可視化[1]。LB、DN和UB的結果分別顯示在第一行、第二行和第三行。紅框代表預測,綠框代表事實。橙色橢圓表示每個角的協方差。我們可以看到,當紅色邊界框和對應的綠色邊界框之間的差異很大時,我們的Double-M Quantification預測了較大的橙色橢圓,這意味著我們的方法是有效的。例如,在場景29第20幀的DiscoNet子圖中,對于右上方的對象O1,紅色和綠色邊界框之間的差異很大,因此Double-M Quantification預測出較大的橙色橢圓。對于O1左側的三個對象,它們的紅色和綠色邊界框之間的差異很小,因此Double-M量化預測了小的橙色橢圓

在這里插入圖片描述

結論

這項工作提出了首次嘗試估計協作目標檢測的不確定性。本文提出了一種新的不確定性量化方法,即雙不確定性量化方法,可以通過一次推理同時預測認知不確定性和任意不確定性。關鍵的新穎之處是定制的移動塊引導訓練過程,以及為邊界盒的每個角估計一個獨立的多變量高斯分布的損失函數設計。在不同的協同目標檢測器上驗證了我們的不確定度量化方法。實驗表明,該方法具有較好的不確定度估計和精度。在未來,我們將把我們的方法應用于更多的協同感知數據集,并通過不確定性量化來提高軌跡預測的性能。

本文來自互聯網用戶投稿,該文觀點僅代表作者本人,不代表本站立場。本站僅提供信息存儲空間服務,不擁有所有權,不承擔相關法律責任。
如若轉載,請注明出處:http://www.pswp.cn/news/696545.shtml
繁體地址,請注明出處:http://hk.pswp.cn/news/696545.shtml
英文地址,請注明出處:http://en.pswp.cn/news/696545.shtml

如若內容造成侵權/違法違規/事實不符,請聯系多彩編程網進行投訴反饋email:809451989@qq.com,一經查實,立即刪除!

相關文章

十九、圖像的放縮和插值

項目功能實現&#xff1a;對一張圖像進行放大和縮小操作 按照之前的博文結構來&#xff0c;這里就不在贅述了 一、頭文件 resizing.h #pragma once#include<opencv2/opencv.hpp>using namespace cv;class RESIZING { public:void resizing(Mat& image); };#pragma…

深度解析:用 Python 爬蟲逆向破解 dappradar 的請求頭加密 X-Api-Sk

大家好!我是愛摸魚的小鴻,關注我,收看每期的編程干貨。 逆向是爬蟲工程師進階必備技能,當我們遇到一個問題時可能會有多種解決途徑,而如何做出最高效的抉擇又需要經驗的積累。本期文章將以實戰的方式,帶你詳細地逆向分析 dappradar 網站請求頭加密字段 X-Api-SK 的構造邏…

解決Edge瀏覽器,微博無法查看大圖(Edge Image Viewer)

使用Edge瀏覽器瀏覽微博或其它帶校驗的圖片時&#xff0c;會導致無法查看。 主要原因為Edge自帶了一個Edge Image Viewer, 但是該圖片查看器無法查看帶校驗數據的圖片&#xff0c;所以導致查看時一片空白。 解決方法 地址欄輸入 edge://flags/搜索 Edge Image Viewer選擇 Disa…

HTML5 Canvas 限定文本區域大小,文字自動換行,自動縮放

<!DOCTYPE html> <html> <body><h1>HTML5 Canvas 限定文本展示范圍、自動計算縮放字體大小</h1><div id"tips">0</div> <div id"content">良田千頃不過一日三餐廣廈萬間只睡臥榻三尺良田千頃不過一日三餐…

【Day53】代碼隨想錄之動態規劃_買賣股票ⅠⅡ

文章目錄 動態規劃理論基礎動規五部曲&#xff1a;出現結果不正確&#xff1a; 1. 買賣股票的最佳時機2. 買賣股票的最佳時機Ⅱ 動態規劃理論基礎 動規五部曲&#xff1a; 確定dp數組 下標及dp[i] 的含義。遞推公式&#xff1a;比如斐波那契數列 dp[i] dp[i-1] dp[i-2]。初…

學習git分支

學習git分支 [網頁練習](Learn Git Branching) 基礎篇 git commit Git 倉庫中的提交記錄保存的是你的目錄下所有文件的快照&#xff0c;就像是把整個目錄復制&#xff0c;然后再粘貼一樣&#xff0c;但比復制粘貼優雅許多&#xff01;Git 希望提交記錄盡可能地輕量&#xf…

【GStreamer】GstElement詳解:GStreamer 中最重要的對象

1、什么是元素GstElement? 每個解碼器、編碼器、解復用器、視頻或音頻輸出實際上都是一個GstElement。GstElement可以視為一個黑盒子:例如,對于解碼器元素,輸入為已編碼數據,輸出為解碼后的數據,解碼過程已由GstElement封裝好。 2、都有哪些元素GstElement? 2.1 源點…

概率基礎——幾何分布

概率基礎——幾何分布 介紹 在統計學中&#xff0c;幾何分布是描述了在一系列獨立同分布的伯努利試驗中&#xff0c;第一次成功所需的試驗次數的概率分布。在連續拋擲硬幣的試驗中&#xff0c;每次拋擲結果為正面向上的概率為 p p p&#xff0c;反面向上的概率為 1 ? p 1-p …

ZCC3221 輸入高耐壓 1A 線性鋰電池充電管理芯片(替代CE3221)

特性 :W 內置支持高壓輸入電流可調節的線性充電器&#xff1a; ■ 最高輸入 24V 耐壓&#xff0c;可承受高達 30V 的浪涌電壓 ■ 恒流下最大充電電流可達 1A&#xff0c;支持外部電阻實時配置充電電流 ■ 兼容 5VUSB 功率源和 AC 適配器&#xff0c;并提供熱插拔保護 ■…

GB/T 43565-2023 中小學合成材料面層籃球場地檢測

合成材料面層是指鋪裝在瀝青混凝土或水泥混凝土等基礎層上的高分子合成材料層&#xff0c;按照使用功能分為田徑產地&#xff0c;球類場地和其他活動場地&#xff0c;按照材料形態分為現澆型面層、預制型面層和人造草面層。 GB/T 43565-2023中小學合成材料面層籃球場地檢測項目…

python 驗證RSA密鑰生成加解密簽名驗簽算法實現

目錄 一、RSA加密、解密、簽名、驗簽(驗證簽名)&RSA算法原理 1、RSA加密、簽名區別: 2、對簽名和驗簽過程詳細理解: 2.1 簽名過程: 2.2 驗簽過程: 二、1024bit RSA Key生成 三、python 實現Public_key加密,Private_key解密 四、python 實現Private_Key簽名,使…

RM電控講義【HAL庫篇】

這段代碼中do while的作用&#xff1a; 宏定義中的語句塊&#xff1a;do { ... } while (0) 允許你在宏定義中創建一個語句塊&#xff0c;從而可以包含多條語句。這在宏定義中特別有用&#xff0c;因為宏只是簡單的文本替換&#xff0c;不像函數那樣有作用域和返回類型。因此&…

JBOSS EPA 7.X 接入Oracle數據源

獲取Oracle JDBC驅動程序&#xff1a; 訪問Oracle官方網站&#xff0c;下載適用于您的操作系統和Oracle數據庫版本的JDBC驅動程序文件&#xff08;通常為一個JAR文件&#xff09;。您可能需要一個Oracle賬戶來訪問這些文件。將下載的JAR文件保存到您的計算機上。 將驅動程序文件…

WordPress后臺自定義登錄和管理頁面插件Admin Customizer

WordPress默認的后臺登錄頁面和管理員&#xff0c;很多站長都想去掉或修改一些自己不喜歡的功能&#xff0c;比如登錄頁和管理頁的主題樣式、后臺左側菜單欄的某些菜單、儀表盤的一些功能、后臺頁眉頁腳某些小細節等等。這里boke112百科推薦這款可以讓我們輕松自定義后臺登錄頁…

2.20日學習打卡----初學Vue3

2.20日學習打卡 目錄: 2.20日學習打卡Vue是什么&#xff1f;安裝vue模板語法條件渲染列表渲染事件處理表單輸入綁定組件基礎Props組件交互自定義事件組件交互組件生命周期Vue引入第三方Axios網絡請求Axios網絡請求封裝網絡請求跨域解決方案路由配置路由傳遞參數嵌套路由配置Vue…

js設計模式:單例模式

作用: 保證一個類只有一個實例,并且提供一個全局的訪問位置。 可以用來實現全局的一些狀態管理或者獨一無二的數據 示例: class Wjt{constructor(name,idNumber,gender){this.name namethis.idNumber idNumberthis.gender gender}//可以直接使用Wjt調用的靜態方法static …

性能測試概述

1.性能測試介紹 好處: 有效的性能測試能給研發、運維團隊提供有效的容量規劃能力、系統風險識別、系統瓶頸識別、性能調優指導,保障盡量避免這些問題的發生。 例如: 假設:以下場景,不可用10分鐘,帶來的經濟損失 天貓雙十一峰值處理訂單58.3萬筆每秒 京東金融618戰報…

Linux Driver | 設備樹開發之初識設備樹

Linux Driver | 設備樹開發之初識設備樹 時間:2024年2月22日20:35:13 文章目錄 **Linux Driver** | 設備樹開發之初識設備樹參考1.設備樹開發2.`Linux`設備樹的由來3.`Linux`設備樹的由來-為什么會有設備樹4.設備樹的由來5.快速編譯設備樹---**DTC** (`device tree compiler`)…

C#,入門教程(29)——修飾詞靜態(static)的用法詳解

上一篇&#xff1a; C#&#xff0c;入門教程(28)——文件夾&#xff08;目錄&#xff09;、文件讀&#xff08;Read&#xff09;與寫&#xff08;Write&#xff09;的基礎知識https://blog.csdn.net/beijinghorn/article/details/124231282 static 是編程高頻詞之一。 讀了一…

2.21號qt

1.QMainWindow中常用的類 繼承于QMainWindow類&#xff0c;原因該類提供了QWidget沒有提供的成員函數。 菜單欄、工具欄、狀態欄、浮動窗口&#xff08;鉚接部件&#xff09;、核心部件 1.1 菜單欄 QMenuBar //創建菜單欄 QMenuBar 最多只能有一個 QMenuBar *mbar menu…