SparseDrive---論文閱讀

純視覺下的稀疏場景表示

算法動機&開創性思路

算法動機:

  1. 依賴于計算成本高昂的鳥瞰圖(BEV)特征表示。
  2. 預測和規劃的設計過于直接,沒有充分利用周圍代理和自我車輛之間的高階和雙向交互。
  3. 場景信息是在agent周圍提取,沒有考慮到自我車輛對周圍代理的影響,忽略了自我車輛在運動預測和規劃中的作用。
  4. 運動預測和規劃都被視為多模態問題,但現有方法只預測確定性的軌跡,沒有考慮到內在的不確定性。

開創性思路:為了解決以上問題,


? ? ? ? 1.通過稀疏場景表示和重新設計的預測與規劃任務,提高了自動駕駛系統的性能和效率,特別是在規劃安全性方面。
? ? ? ? 2.SparseDrive包含對稱的稀疏感知模塊和并行運動規劃器,通過有效的設計,實現了在所有任務中的性能提升,同時保持了更高的訓練和推理效率。
? ? ? ? 3.修改了運動預測和規劃之間的巨大相似性,串級模塊,提出了一種分層規劃選擇策略

主體結構

輸入:6圖感知,輸出:自車規劃模塊以及其他Agent規劃模塊

+---------------------+
|      SparseDrive    |
+---------------------+
|  use_grid_mask      |
|  use_deformable_func|
+---------------------+
|  img_backbone (ResNet)|
|  img_neck (FPN)     |
|  depth_branch       |
+---------------------+
|       head          |
+---------------------+
|  det_head (Sparse4DHead)|
|  map_head (Sparse4DHead)|
|  motion_plan_head (MotionPlanningHead)|
+---------------------+

包括特征提取(ImageEncoder),對稱稀疏感知(SymmetricSparsePerception),平行運動規劃器(ParallelMotionPlanner)

對稱稀疏感知,主要包括稀疏檢測,稀疏在線建圖,稀疏跟蹤模塊

圖像編碼:

給定多視圖圖像,圖像編碼器(包括主干網絡和頸部)首先將圖像編碼為多尺度特征圖,其中S是尺度數,N是camera圖數

對稱稀疏感知模塊:

如下圖,特征圖被聚合成2組實例,來學習駕駛場景稀疏表示,倆組實例分別代表周圍智能體Initialized Detection Instances 是數據集里的anchor,(x,y,z,lnw,lnh,lnl,sin yaw,cos yaw,vx,vy,vz)和地圖元素Initialized Map Instances (x0,y0,x1,y1...xNp-1,yNp-1)
Feature Maps是6張圖特征

平行運動規劃器:

自車Ego軌跡預測和其他Agent的軌跡預測應該合并成一個任務,具有相互影響
Ego Insitance初始化:和其他模Agent不一樣,在相機視角下,是處于盲區的,Ego的特征是采用前視視角下圖像特征圖,并且在ResNet在輸出多尺度特征取得最小特征圖后平均池化去作為Ego特征初始化,Ego Anchor對于x,y,yaw是每一幀定義好,但是速度,加速度會讓主車根據運動屬性使得模型學習shortcut,不利于學習主車自主交互,所以用T-1時刻狀態進行預測,作為輔助任務進行Loss監督

新的范式:
?

  1. 稀疏場景表示(Sparse Scene Representation)

    • SparseDrive采用了稀疏表示來學習駕駛場景的完整表示,這種表示通過對稱的稀疏感知模塊實現,該模塊統一了檢測、跟蹤和在線映射任務。
  2. 對稱稀疏感知模塊(Symmetric Sparse Perception Module)

    • 該模塊通過結構對稱性,將檢測、跟蹤和在線映射集成到一個模型架構中,學習場景的稀疏表示。
  3. 并行運動規劃器(Parallel Motion Planner)

    • SparseDrive的并行運動規劃器同時進行運動預測和規劃,考慮了自我車輛和周圍代理之間的高階和雙向交互。
  4. 層次化規劃選擇策略(Hierarchical Planning Selection Strategy)

    • 該策略包括一個碰撞感知重分模塊(Collision-Aware Rescore Module),用于從多模態軌跡提議中選擇一個合理且安全的軌跡作為最終規劃輸出。
  5. 端到端學習(End-to-End Learning)

    • SparseDrive采用多階段訓練方法,首先分別訓練稀疏感知模塊,然后在第二階段聯合訓練稀疏感知模塊和并行運動規劃器,實現端到端優化。
  6. 效率優化

    • 論文中提出的SparseDrive在保持高性能的同時,還實現了更高的訓練和推理效率。

通過這些設計,SparseDrive能夠在所有任務中實現比之前最先進方法更高的性能,同時在訓練和推理效率上也有顯著提升。具體來說,SparseDrive在nuScenes基準測試中超越了先前的最先進方法,尤其是在安全性關鍵指標碰撞率方面,同時保持了更高的訓練和推理效率

損失函數

Loss : L = Ldet + Lmap + Lmotion + Lplan + Ldepth

Stage1:從頭開始訓練對稱稀疏感知模塊,以學習稀疏場景表示

Stage2:稀疏感知模塊和并行運動規劃期一起訓練

性能對比

3D detection results,Multi-object tracking results ,Online mapping results

Prediction Results,Planning results

效率對比,平行運動規劃器中的各模塊消融實驗

總結:

A: 這篇論文提出了SparseDrive,一種新穎的端到端自動駕駛范式,旨在通過稀疏場景表示和優化的任務設計來提高自動駕駛系統的性能和效率。以下是論文的主要內容總結:

  1. 問題識別:傳統的自動駕駛系統采用模塊化設計,導致信息丟失和誤差累積。現有的端到端方法在性能和效率上,特別是在規劃安全性方面,仍有不足。

  2. SparseDrive范式:提出了SparseDrive,一種新的端到端自動駕駛范式,它利用稀疏表示來統一處理檢測、跟蹤、在線映射、運動預測和規劃任務。

  3. 關鍵組件

    • 對稱稀疏感知模塊:通過結構對稱性,同時處理檢測、跟蹤和在線映射任務。
    • 并行運動規劃器:同時進行運動預測和規劃,考慮自我車輛與周圍代理的交互。
  4. 層次化規劃選擇策略:提出了一種策略,通過碰撞感知重分模塊來選擇安全合理的軌跡。

  5. 端到端學習:采用分階段訓練方法,先分別訓練感知模塊,然后聯合訓練感知和規劃模塊,實現端到端優化。

  6. 實驗驗證:在nuScenes數據集上進行了廣泛的實驗,證明了SparseDrive在3D檢測、多目標跟蹤、在線映射、運動預測和規劃任務中的性能均優于現有最先進方法。

  7. 效率提升:SparseDrive在保持高性能的同時,顯著提高了訓練和推理的效率。

  8. 消融研究:通過消融實驗,展示了SparseDrive設計選擇的有效性,包括運動規劃器的設計、碰撞感知重分模塊和多模態規劃的重要性。

  9. 未來工作:論文指出了端到端模型在性能、數據集規模、安全性評估等方面的局限性,并提出了未來探索的方向。

  10. 代碼開源:論文承諾將SparseDrive的代碼開源,以促進未來研究。

SparseDrive通過其創新的設計和方法,在自動駕駛領域提供了一種有效的解決方案,推動了端到端自動駕駛技術的發展

本文來自互聯網用戶投稿,該文觀點僅代表作者本人,不代表本站立場。本站僅提供信息存儲空間服務,不擁有所有權,不承擔相關法律責任。
如若轉載,請注明出處:http://www.pswp.cn/diannao/79232.shtml
繁體地址,請注明出處:http://hk.pswp.cn/diannao/79232.shtml
英文地址,請注明出處:http://en.pswp.cn/diannao/79232.shtml

如若內容造成侵權/違法違規/事實不符,請聯系多彩編程網進行投訴反饋email:809451989@qq.com,一經查實,立即刪除!

相關文章

旅游特種兵迪士尼大作戰:DeepSeek高精準路徑優化

DeepSeek大模型高性能核心技術與多模態融合開發 - 商品搜索 - 京東 隨著假期的腳步日漸臨近,環球影城等備受矚目的主題游樂場,已然成為大人與孩子們心中不可或缺的節日狂歡圣地。然而,隨之而來的龐大客流,卻總讓無數游客在歡樂的…

android rtsp 拉流h264 h265,解碼nv12轉碼nv21耗時卡頓問題及ffmpeg優化

一、 背景介紹及問題概述 項目需求需要在rk3568開發板上面,通過rtsp協議拉流的形式獲取攝像頭預覽,然后進行人臉識別 姿態識別等后續其它操作。由于rtsp協議一般使用h.264 h265視頻編碼格式(也叫 AVC 和 HEVC)是不能直接用于后續處…

運維面試題(十四)

6.將日志從一臺服務器保存到另一臺服務器中的方法 1.使用 rsync 同步日志文件 2.使用 scp 手動或腳本化傳輸 3.配置日志服務(如 syslog 或 rsyslog )遠程傳輸 ? 4.編寫腳本定時上傳:結合 cron 定時任務和傳輸工具,編…

永磁同步電機控制中,滑模觀測器是基于反電動勢觀測轉子速度和角度的?擴展卡爾曼濾波觀測器是基于什么觀測的?擴展卡爾曼濾波觀測器也是基于反電動勢嗎?

滑模觀測器在PMSM中的應用: 滑模觀測器是一種非線性觀測器,利用切換函數設計,使得狀態估計誤差迅速趨近于零,實現快速響應和對外部干擾的魯棒性。 在永磁同步電機(PMSM)無傳感器控制中,滑模觀測…

【前端】Vue一本通 ESLint JSX

近幾天更新完畢,不定期持續更新,建議關注收藏點贊。 目錄 工具推薦vscode插件vue-devtoolsESLint JSX語法擴展簡介設計模式快速入門 vue/cli腳手架使用vue指令 工具推薦 工欲善其事,必先利其器。 vscode插件 Vetur:vue代碼高亮…

【adb】bat批處理+adb 自動亮屏,自動解鎖屏幕,啟動王者榮耀

準備adb 下載 需要確認是否安裝了adb.exe文件,可以在: 任務管理器 -->詳細信息–>找一下后臺運行的adb 安裝過anroid模擬器,也存在adb,例如:雷電安裝目錄 D:\leidian\LDPlayer9 單獨下載adb 官方下載地址:[官方網址] 下載目錄文件: 測試adb USB連接手機 首先在設置界…

微信小程序轉為App實踐篇 FinClip

參考下面鏈接先 開始實踐 微信小程序轉為App并上架應用市場_微信小程序生成app-CSDN博客 首先在FinClip 官網上下載應用 小程序開發工具下載_小程序sdk下載資源-FinClip資源下載|泰坪小程序開放平臺 下載到本地安裝 打開導入自己的小程序項目;導入時會解析自己的…

arco design框架中的樹形表格使用中的緩存問題

目錄 1.問題 2.解決方案 1.問題 arco design框架中的樹形表格使用中的緩存問題,使用了樹形表格的load-more懶加載 點擊展開按鈕后,點擊關閉,再次點擊展開按鈕時,沒有調用查詢接口,而是使用了緩存的數據。 2.解決方…

100個GEO基因表達芯片或轉錄組數據處理023.GSE24807

100個GEO基因表達芯片或轉錄組數據處理 寫在前邊 雖然現在是高通量測序的時代,但是GEO、ArrayExpress等數據庫儲存并公開大量的基因表達芯片數據,還是會有大量的需求去處理芯片數據,并且建模或驗證自己所研究基因的表達情況,芯片…

SAP ECCS標準報表在報表中不存在特征CG細分期間 消息號 GK715報錯分析

ECCS報表執行報錯: 在報表中不存在特征CG細分期間 消息號 GK715 診斷 未在報表中指定特征CG細分期間。但是,同時需要特征CG細分期間和其它特征。例如: 期間’需要用于擴展合并組。 系統響應 處理終止 步驟 調整報表定義。 報這個錯。 業務背景…

spring boot 文件下載

1.添加文件下載工具依賴 Commons IO is a library of utilities to assist with developing IO functionality. <dependency><groupId>commons-io</groupId><artifactId>commons-io</artifactId><version>2.6</version> </depe…

FastAPI 中定義接口函數參數,包含請求體參數、查詢參數、依賴注入參數的組合

FastAPI 中定義接口函數參數&#xff0c;包含請求體參數、查詢參數、依賴注入參數的組合。 ? 示例結構 async def chat(request: Request,data: ChatData,conversation_id: Optional[str] Query(None),current_user: User Depends(get_current_user), ):這表示你定義了一個…

實用類題目

1. 密碼強度檢測 題目描述&#xff1a;生活中&#xff0c;為保證賬戶安全&#xff0c;密碼需要有一定強度。編寫一個方法&#xff0c;接收一個字符串作為密碼&#xff0c;判斷其是否符合以下強度要求&#xff1a;長度至少為 8 位&#xff0c;包含至少一個大寫字母、一個小寫字…

MATLAB學習筆記(二) 控制工程會用到的

MATLAB中 控制工程會用到的 基礎傳遞函數表達傳遞函數 零極點式 狀態空間表達式 相互轉化畫響應圖線根軌跡Nyquist圖和bode圖現控部分求約旦判能控能觀極點配置和狀態觀測 基礎 傳遞函數表達 % 拉普拉斯變換 syms t s a f exp(a*t) %e的a次方 l laplace(f) …

基于YOLOv9的課堂行為檢測系統

基于YOLOv9的課堂行為檢測系統 項目概述 本項目是一個基于YOLOv9深度學習模型的課堂行為檢測系統&#xff0c;旨在通過計算機視覺技術自動識別和監測課堂中學生的各種行為狀態&#xff0c;幫助教師更好地了解課堂教學效果。 項目結構 課堂行為檢測/ ├── data/ │ ├──…

C 語言中的 volatile 關鍵字

1、概念 volatile 是 C/C 語言中的一個類型修飾符&#xff0c;用于告知編譯器&#xff1a;該變量的值可能會在程序控制流之外被意外修改&#xff08;如硬件寄存器、多線程共享變量或信號處理函數等&#xff09;&#xff0c;因此編譯器不應對其進行激進的優化&#xff08;如緩存…

java 洛谷題單【算法2-1】前綴和、差分與離散化

P8218 【深進1.例1】求區間和 解題思路 前綴和數組&#xff1a; prefixSum[i] 表示數組 a 的前 (i) 項的和。通過 prefixSum[r] - prefixSum[l - 1] 可以快速計算區間 ([l, r]) 的和。 時間復雜度&#xff1a; 構建前綴和數組的時間復雜度是 (O(n))。每次查詢的時間復雜度是 …

綠盟二面面試題

5000篇網安資料庫https://mp.weixin.qq.com/s?__bizMzkwNjY1Mzc0Nw&mid2247486065&idx2&snb30ade8200e842743339d428f414475e&chksmc0e4732df793fa3bf39a6eab17cc0ed0fca5f0e4c979ce64bd112762def9ee7cf0112a7e76af&scene21#wechat_redirect 1. 原理深度&…

線程安全學習

1 什么是線程 線程是cpu調度的最小單位&#xff0c;在Linux 下 實現線程的方式為輕量級進程&#xff0c;復用進程的結構體&#xff0c;使用clone函數創建 2 線程安全 所謂線程安全&#xff0c;更確切的應該描述為內存安全 #include <stdio.h> #include <pthread.h…

Linux紅帽:RHCSA認證知識講解(十 三)在serverb上破解root密碼

Linux紅帽&#xff1a;RHCSA認證知識講解&#xff08;十 三&#xff09;在serverb上破解root密碼 前言操作步驟 前言 在紅帽 Linux 系統的管理工作中&#xff0c;系統管理員可能會遇到需要重置 root 密碼的情況。本文將詳細介紹如何通過救援模式進入系統并重新設置 root 密碼。…