【論文閱讀】VAD: Vectorized Scene Representation for Efficient Autonomous Driving

一、介紹

VAD是華科團隊設計的一個端到端無人駕駛框架,針對傳統的無人駕駛框架的模塊化設計的問題,該算法使用向量化的策略進行了端到端的實現。傳統的模塊化設計使得感知模塊完全依賴于感知模塊的計算結果,這一解耦實際上從規劃模塊的角度損失了很多的信息,諸如語義信息。VAD采用向量化的策略進行了重新設計,從實驗結果上來看超過了上海實驗室提出的UniAD。

二、方法

VAD的模型以多視角的圖像作為輸入,編碼后提取BEV特征,該特征會被送到Transformer中提取兩類特征,這兩類特征后續應用到軌控模塊中。
在這里插入圖片描述

3.1 Vectorized Scene Learning

這一節主要是介紹特征提取的部分。首先論文并沒有介紹從多視角圖像到BEV圖像這個過程是如何實現的,應該是直接使用了現成的轉換模型。論文直接是從得到BEV視角后開始介紹的。這一部分實際上包括了兩種查詢:Ageng query和Map query。這里的query實際上就是Transformer里面的那個query,我們主要就是訓練這個query。

Map query

先給出結論, 這一個查詢輸入是BEV視角下的特征,輸出是場景中的向量化的實例特征,可以理解為“當前場景中的物體以及哪些點歸屬于這些物體”。這個實例特征作者起名叫做map vector,它是一個Nm×Np×2大小的矩陣,其中Nm表示場景中物體的數目、Np為一個物體占據的點的數目,最后的2則是說它在BEV視角下的位置。這一個模塊中算法主要關注三個內容:車道分割線、道路邊界以及人行橫道。簡單來說就是通過Transformer處理之后,最后轉換為一個三分類任務。

Agent query

與Map query類似,這一部分其實也是提取一類特征,主要是對場景中的物體的行進軌跡進行預測,這一預測會被用到后續的規劃中。這一部分的輸入依然是BEV視角下的特征,輸出的是一個大小為Na×Nk×Tf×2的矩陣,其中Na表示場景中物體的數量,Nk表示行駛狀態,Tf表示未來的時間戳,最后的2則是BEV視角下的坐標。我的理解是,這個矩陣表示了未來Tf時間內,Na個車輛的行駛狀態及位置。相當于在這個模塊內進行了所有交通參與者的狀態預測,利用這一預測結果來約束后面軌控模塊的行駛策略。

在這個模塊中,稍微補習了一下Transformer的內容,在Transformer的編碼器中,關鍵的三個值是query、key和value,其中query是我們訓練的結果,key和value則是輸入的變種。對于VAD中的查詢模塊,key和value都來源于BEV視角下的特征輸入。這里的過程如下圖:

在這里插入圖片描述
在這里插入圖片描述
在這里插入圖片描述
查詢的數量并不等于類別數量,查詢相當于多個卷積核,只負責特征的提取,而真正影響類別數量的是最后softmax層的結構。計算Key和Value的時候,映射矩陣Wk和Wv相當于一個降維的作用,負責對齊Key、Value以及Query的維度,這兩個映射矩陣也是模型需要學習的參數。計算注意力的時候,所涉及的維度變化為:
在這里插入圖片描述
在計算注意力之前,其實就已經存在一個展平的過程,原本BEV應該是H×W×C大小的,每張圖是H×W,一共有C張,在計算鍵值的時候就已經展平了,這樣子才可以與Wk和Wv進行計算,計算之后的鍵值變為D個長度為H×W的向量,拼成一個二維矩陣,key首先與query進行計算,得到相關性,這一相關性與value加權求和,得到大小為Nm×D的二維矩陣,表示D個長度為Nm的向量,可以解釋為Nm個關鍵信息,每個信息都是一個長度為D的向量。這些信息會通過MLP解碼進行后處理,將D維度調整為Np×2的維度,這樣子就可以恢復出地圖元素的位置以及包括的點。最終變成Vm:
在這里插入圖片描述

本文來自互聯網用戶投稿,該文觀點僅代表作者本人,不代表本站立場。本站僅提供信息存儲空間服務,不擁有所有權,不承擔相關法律責任。
如若轉載,請注明出處:http://www.pswp.cn/pingmian/71805.shtml
繁體地址,請注明出處:http://hk.pswp.cn/pingmian/71805.shtml
英文地址,請注明出處:http://en.pswp.cn/pingmian/71805.shtml

如若內容造成侵權/違法違規/事實不符,請聯系多彩編程網進行投訴反饋email:809451989@qq.com,一經查實,立即刪除!

相關文章

探索Java多線程的核心概念與實踐技巧,帶你從入門到精通!

各位看官早安午安晚安呀 如果您覺得這篇文章對您有幫助的話 歡迎您一鍵三連,小編盡全力做到更好 歡迎您分享給更多人哦 今天我們來學習多線程編程-"掌握線程創建、管理與安全": 上一節課程我們鋪墊了一系列的東西,引出來了我們的多…

互動多媒體項目 自行車互動

該項目為UE4 +自行車騎行速度 互動項目 結果預覽 : 1. 獲取自行車速度 這里使用的是Arduino單片機 + 霍爾傳感器 霍爾傳感器: 單片機完整代碼: #define HALL_PIN 2 // 霍爾傳感器連接到D2(中斷引腳) volatile unsigned long lastTime = 0; // …

STM32——GPIO介紹

GPIO(General-Purpose IO ports,通用輸入/輸出接口)模塊是STM32的外設接口的核心部分,用于感知外界信號(輸入模式)和控制外部設備(輸出模式),支持多種工作模式和配置選項。 1、GPIO 基本結構 STM32F407 的每個 GPIO 引腳均可獨立配置,主要特性包括: 9 組 GPIO 端口…

學習筆記:Python網絡編程初探之基本概念(一)

一、網絡目的 讓你設備上的數據和其他設備上進行共享,使用網絡能夠把多方鏈接在一起,然后可以進行數據傳遞。 網絡編程就是,讓在不同的電腦上的軟件能夠進行數據傳遞,即進程之間的通信。 二、IP地址的作用 用來標記唯一一臺電腦…

DeepSeek 醫療大模型微調實戰討論版(第一部分)

DeepSeek醫療大模型微調實戰指南第一部分 DeepSeek 作為一款具有獨特優勢的大模型,在醫療領域展現出了巨大的應用潛力。它采用了先進的混合專家架構(MoE),能夠根據輸入數據的特性選擇性激活部分專家,避免了不必要的計算,極大地提高了計算效率和模型精度 。這種架構使得 …

JetBrains學生申請

目錄 JetBrains學生免費授權申請 IDEA安裝與使用 第一個JAVA代碼 1.利用txt文件和cmd命令運行 2.使用IDEA新建項目 JetBrains學生免費授權申請 本教程采用學生校園郵箱申請,所以要先去自己的學校申請校園郵箱。 進入JetBrains官網 點擊立即申請,然…

LINUX網絡基礎 [五] - HTTP協議

目錄 HTTP協議 預備知識 認識 URL 認識 urlencode 和 urldecode HTTP協議格式 HTTP請求協議格式 HTTP響應協議格式 HTTP的方法 HTTP的狀態碼 ?編輯HTTP常見Header HTTP實現代碼 HttpServer.hpp HttpServer.cpp Socket.hpp log.hpp Makefile Web根目錄 H…

六十天前端強化訓練之第八天到第十四天——綜合案例:用戶管理系統

歡迎來到編程星辰海的博客講解 看完可以給一個免費的三連嗎,謝謝大佬! 目錄 一、知識體系詳解 1. 變量與作用域 2. 箭頭函數特性 3. 數組高階函數 4. DOM操作原理 5. 事件傳播機制 6. 閉包核心原理 7. 原型繼承體系 8. Promise工作流程 二、綜…

技術周總結 03.03 - 03.09 周日(Java監控 SpringAI)

文章目錄 一、03.05 周三二、03.08 周六openAI 的Spring開發 一、03.05 周三 jvisualvm java自帶的監控和故障排除工具 命令行執行后,會出現 JConsole 二、03.08 周六 openAI 的Spring開發 引入 spring-ai-openai-spirng-boot-starter 依賴 Spring AI http…

DeepSeek:中國AGI破局者的技術革命與生態重構

在AI領域被"算力霸權"與"技術壟斷"籠罩的今天,一家來自杭州的初創公司正以顛覆性創新撕開行業鐵幕。DeepSeek(深度求索)不僅重新定義了AGI技術研發范式,更通過開源生態構建引發全球AI產業格局的深度重構。 一…

manus本地部署使用體驗

manus部署 https://github.com/mannaandpoem/OpenManus git clone https://github.com/mannaandpoem/OpenManus.git 或者手工下載zip包解壓,包很小,只有幾百K。 cd OpenManus-main #創建python環境,有python3的可以用python3 python -m ven…

【統計至簡】【入門測試1】給定數據矩陣X,如何求其質心、中心化數據、標準化數據、格拉姆矩陣、協方差矩陣、相關系數矩陣

給定數據矩陣X,如何求其質心、中心化數據、標準化數據、格拉姆矩陣、協方差矩陣、相關系數矩陣。 ??設數據矩陣 X X X是一個 n p n\times p np的矩陣,其中 n n n是樣本數量, p p p是變量數量, X ( x i j ) X (x_{ij}) X(xij?…

CI/CD—Jenkins、Maven安裝

Jenkins簡介 Jenkins 是一款廣泛使用的開源持續集成和持續交付(CI/CD)工具,以下是對它的詳細介紹: 基本信息 起源與發展:Jenkins 最早起源于 Hudson 項目,后來從 Hudson 項目中分離出來獨立發展。自 2011 …

抽獎系統測試報告

項目鏈接: 管理員登錄頁面 項目功能: 管理員登錄: 登錄方式分為兩種: 手機號密碼登錄: 正確輸入密碼和手機號登錄 短信驗證碼登錄: 輸入手機號,等待驗證碼,輸入驗證碼登錄 管理員注冊: 登錄頁面點擊注冊按鈕即可注冊管理員身份 人員管理模塊: 人員管理模塊分為注冊…

【高級篇】大疆Pocket 3加ENC編碼器實現無線RTMP轉HDMI進導播臺

【高級篇】大疆Pocket 3加ENC編碼器實現無線RTMP轉HDMI進導播臺 文章目錄 準備工作連接設備RTMP概念ENCSHV2推流地址設置大疆Pocket 3直播設置總結 老鐵們好! 很久沒寫軟文了,今天給大家帶了一個干貨,如上圖,大疆Pocket 3加ENC編…

【 <一> 煉丹初探:JavaWeb 的起源與基礎】之 Servlet 與 JSP 的協作:MVC 模式的雛形

<前文回顧> 點擊此處查看 合集 https://blog.csdn.net/foyodesigner/category_12907601.html?fromshareblogcolumn&sharetypeblogcolumn&sharerId12907601&sharereferPC&sharesourceFoyoDesigner&sharefromfrom_link <今日更新> 一、Servl…

【不是廣告】華為昇騰的一小步,Pytorch的一大步

華為昇騰的一小步&#xff0c;Pytorch的一大步 關鍵詞 首個、中國首個、全球第十、最高級別&#xff01;看看這些字眼&#xff0c;就知道事情不簡單&#xff01; 書接上文《Pytorch的一小步&#xff0c;昇騰芯片的一大步》 在2023年10月4日PyTorch 2.1版本的發布博客上&…

python從入門到精通(二十六):python文件操作之Word全攻略(基于python-docx)

python文件操作之word技巧大全 word技巧基礎到高級操作大全A.準備工作1. 安裝python-docx庫2. 導入庫 B.基礎操作1. 創建Word文檔1.1 創建文檔對象1.2 添加word標題1.3 添加word段落1.4 設置段落樣式1.5 創建有序列表1.6 創建無序列表1.7添加word分頁1.8 添加word圖片1.9 添加w…

Debian二次開發一體化工作站:提升科研效率的智能工具

在科研領域&#xff0c;數據處理是實驗成功的關鍵環節之一。隨著實驗數據的復雜性和規模不斷增加&#xff0c;傳統的數據處理方法已經難以滿足科研人員的需求。這時&#xff0c;一體化工作站應運而生&#xff0c;成為科研實驗數據處理的 “智能大腦”。 一體化工作站&#xff…

linux學習(五)(服務器審查,正常運行時間負載,身份驗證日志,正在運行的服務,評估可用內存)

服務器審查 在 Linux 中審查服務器的過程包括評估服務器的性能、安全性和配置&#xff0c;以確定需要改進的領域或任何潛在問題。審查的范圍可以包括檢查安全增強功能、檢查日志文件、審查用戶帳戶、分析服務器的網絡配置以及檢查其軟件版本。 Linux 以其穩定性和安全性而聞名…