自動駕駛導航信號使用方式調研

1 總結

本文調研在給定導航信號后,如何在端到端架構下,利用導航信息引導軌跡生成。

目前主流的方案可以分為2種。一種是將導航作為“前置引導”深度融入軌跡生成過程(導航前置型);另一種則是將導航作為“后置評價”標準來篩選最優軌跡(導航后置型)。

但是兩者并不是割裂的,可以結合使用,導航前置可以縮小搜索范圍,節省算力,提高Precision;導航后置可以進一步約束軌跡形態,提高軌跡質量。

2 導航前置型

2.1 導航路徑型

  • 核心思想:用導航路徑信息和自車特征融合作為query,和場景特征(如BEV)交互,從而融合自車狀態/場景/導航目標,再解碼得到軌跡。
  • 優勢:顯式使用導航路徑點信息,引導車輛行駛
  • 劣勢:模型對導航路徑點坐標敏感,在路徑點坐標誤差大時,車輛可能駛入錯誤車道
  • 代表方案:UniAD

The planning head is a Transformer decoder. We design a planning query to predict the future trajectory. To incorporate the guidance from the route plan, we sample N reference points from the planned route and project them to the ego-vehicle coordinate. These reference points are then encoded by an MLP and added to the ego-vehicle’s state (velocity, acceleration, etc.) embedding to form the final planning query. The planning query then interacts with the occupancy forecast features via cross-attention to be aware of the future dynamic environment.

具體做法:

  1. 采用Dijskra算法計算到達目標的最短路徑,然后沿著該路徑均勻采樣10個參考點

The planned route is composed of 10 reference points uniformly sampled along the path length.

  1. 對參考點進行編碼,得到route_embedding;然后對自車狀態(包含物理尺寸,速度,加速度等)也進行編碼,得到ego_state_embedding。這2個同維度的embedding直接相加得到planning query。這一步融合了“我現在是什么狀態”和“我將要去哪里”。

…and added to the ego state embedding to form the final planning query.

  1. 將planning query和OCC(4維:時間,X,Y,Z)進行交互,關注導航路徑附近的障礙物/車道線信息,從而輸出豐富context的特征,采用prediction head進行解碼,就得到了軌跡(6個點,間隔0.5s,未來3s軌跡)。

For the planning task, we set the prediction horizon to 3 seconds with 6 predicted waypoints.

2.2 導航指令型

  • 核心思想:用導航指令信息和自車特征進行融合,和場景特征(如向量化場景表征)交互,再解碼得到軌跡。
  • 優勢:將導航視為“意圖”,而不是要遵行的路徑點,更加魯棒
  • 劣勢:沒有顯式的路徑點進行引導,可能存在指令理解偏差
  • 代表方案:VAD

具體做法:

  1. 將導航路徑簡化為指令。通過分析在導航路徑上的關鍵決策點,生成離散的控制指令(比如左轉/右轉/執行)。這一步避免依賴精確的導航路徑點,從而更加魯棒。

For each sample, we provide a high-level command from a sparse set of waypoints indicating the intended maneuver, e.g., turn left/right, go straight, or lane change. Specifically, we define 4 discrete commands, i.e., Follow Lane, Go Straight, Turn Left, and Turn Right.

  1. 將指令映射為對應的指令嵌入。

To incorporate the command, we first define a set of learnable embeddings {c(1), c(2), …, c(K)} for K commands. For a given command k, we obtain its embedding c(k).

  1. 將指令嵌入和自車狀態進行融合,實現上就是相加。

We also introduce a learnable ego query q(ego) to represent the ego vehicle. The initial planning query q(plan) is formed by adding the command embedding to the ego query: q(plan) = q(ego) + c(k).

  1. 融合后和障礙物/車道線進行cross attention,然后解碼得到軌跡。

This command-guided query then serves as the input to the planning decoder, which is a standard Transformer decoder. It iteratively interacts with the instance queries (representing other agents) and map queries (representing lanes) through self-attention and cross-attention layers to refine its representation and finally predict the trajectory.

3 導航后置型

3.1 神經網絡型

  • 核心思想:通過軌跡生成網絡輸出多條軌跡,然后采用軌跡評估網絡對其進行評分。其中導航信息強約束神經網絡。
  • 代表公司:Tesla

Tesla AI Day 2021 演講: 在運動規劃環節,Ashok Elluswamy 指出,他們使用神經網絡來預測“jerk”(加加速度)、“intervention”(被接管的可能性)等,這些都作為代價函數的一部分。整個評價體系是深度學習驅動的。

注意:特斯拉的導航信息可能在軌跡生成網路中存在弱引導作用。

3.2 規則型

  • 核心思想:針對輸出的多條軌跡,采用綜合了效率/安全等代價的函數進行整體評測。

  • 代表公司:華為,小鵬(應該并非最新方案)

  • 小鵬:CN113232873A《一種自動駕駛的路徑規劃方法、裝置、設備及存儲介質》

  • 華為:CN1138055724A -《一種運動規劃的方法和裝置》

【0065】 “可選地,在S102之后,該方法還包括:對所述多條候選軌跡進行評估,以從所述多條候選軌跡中選擇出目標軌跡。”
【0066】 “具體地,所述多個性能指標可以包括:所述候選軌跡的安全性指標、舒適性指標和效率指標中的至少一種。”
【0067】 “例如,所述安全性指標可以用于表征所述車輛按照所述候選軌跡行駛時的碰撞風險。”
【0068】 “例如,所述舒適性指標可以用于表征所述車輛按照所述候選軌跡行駛時的乘客乘坐體驗,例如,乘客感受到的沖擊、顛簸等。”
【0069】 “例如,所述效率指標可以用于表征所述車輛按照所述候選軌跡行駛時的通行效率,例如,到達目的地所需的時間。”

其中,效率指標中的一項即為“軌跡終點和導航路徑的貼合程度”

本文來自互聯網用戶投稿,該文觀點僅代表作者本人,不代表本站立場。本站僅提供信息存儲空間服務,不擁有所有權,不承擔相關法律責任。
如若轉載,請注明出處:http://www.pswp.cn/bicheng/94356.shtml
繁體地址,請注明出處:http://hk.pswp.cn/bicheng/94356.shtml
英文地址,請注明出處:http://en.pswp.cn/bicheng/94356.shtml

如若內容造成侵權/違法違規/事實不符,請聯系多彩編程網進行投訴反饋email:809451989@qq.com,一經查實,立即刪除!

相關文章

玳瑁的嵌入式日記D21-08020(數據結構)

雙向鏈表double link listtypedef struct dou_node { DATATYPE data; struct dou_node *prev; struct dou_node *next; }DouLinkNode;雙向鏈表:節點 數據 NEXT PREV . 手撕代碼(增加刪除) 增加,刪除的操作, 需要 tmp 停止待操作節點的前一…

Uipath查找元素 查找子元素 獲取屬性活動組合使用示例

Uipath 查找元素 查找子元素 獲取屬性組合使用示例使用場景案例介紹項目流程圖附加瀏覽器查找元素查找子元素遍歷循環獲取屬性點擊元素使用場景 在實際場景中,有時需RPA自動點擊某組范圍元素或獲取某組范圍元素的值,如需獲取指定的父元素,再…

【MongoDB與MySQL對比】

MongoDB 與 MySQL 全方位對比分析在現代軟件開發中,數據庫的選擇直接影響系統性能、擴展性和開發效率。MongoDB 和 MySQL 作為兩種主流數據庫,分別代表了 NoSQL 和關系型數據庫的典型,各自在不同場景中發揮著重要作用。本文將拋開代碼示例&am…

Spring AI開發指導-對話模型

對話模型接口描述Spring AI基于Spring Cloud的架構體系,定義了一系列可擴展的API接口,支持對接不同類型的AI大模型的核心功能,這些API接口支持同步編程模式或者異步編程模式:接口ModelModel是同步編程模式接口,其參數支…

Win11 下卸載 Oracle11g

目錄 1、停止服務 2、啟動 Universal install 應用 3、執行 deinstall.bat 腳本 4、刪除注冊表相關數據 5、刪除環境變量中的oracle相關路徑 6、刪除安裝文件 7、刪除C盤中的相關Oracle文件 8、刪除 Oracle 數據存放目錄 9、檢查 10、重裝oracle可能還會碰到的問題 &…

深入剖析Spring Boot應用啟動全流程

目錄 前言 啟動流程概覽 一、第一階段:初始化SpringApplication 二、第二階段:運行SpringApplication 三、第三階段:環境準備 四、第四階段:創建應用上下文 五、第五階段:準備應用上下文 六、第六階段&#xf…

Matplotlib 可視化大師系列(三):plt.bar() 與 plt.barh() - 清晰對比的柱狀圖

目錄Matplotlib 可視化大師系列博客總覽Matplotlib 可視化大師系列(三):plt.bar() 與 plt.barh() - 清晰對比的柱狀圖一、 柱狀圖是什么?何時使用?二、 函數原型與核心參數plt.bar(x, height, ...) - 垂直柱狀圖plt.ba…

基于 FastAPI 和 OpenFeature 使用 Feature Flag 控制業務功能

模擬業務場景:多租戶系統跨域轉賬,需要控制某租戶下某用戶是否可以在某域轉賬 open_feature_util.py import typing from abc import abstractmethod, ABCMeta from typing import Sequencefrom openfeature.evaluation_context import EvaluationContex…

Stm32通過ESP8266 WiFi連接阿里云平臺

本文將介紹stm32如何通過WiFi來連接阿里云,上傳數據和接收指令。要先與阿里云建立TCP連接,然后再通過MQTT協議交互。 大體流程:1、在阿里云網頁上創建產品和設備;2、stm32通過WiFi連接云平臺;3、MQTT連接阿里云&#…

北京-測試-入職甲方金融-上班第三天

今日上班時間9-20.18,再加42分鐘就可以拿到75塊錢了,但我想回家,所以下班今天上午有人事舉辦的入職培訓,下午有業務培訓,培訓完領導給我安排了兩個需求。慌死,嚇死,我都不懂,業務和工…

Java基礎第2天總結

使用switch時注意事項:表達式類型只能是byte、short、int、char,JDK5開始支持枚舉,JDK7開始支持String,不支持double、float、long(精確度問題,小數有點不精確)。case給出的值不允許重復,且只能是字面量,不…

鴻蒙開發中的List組件詳解

目錄 引言 1.List組件基礎 2.List接口參數 1.space 2.initialIndex 3.scroller 3.ListView的屬性 1.listDirection 2.lanes 3.divider 4.scrollBar 4.布局與約束 5.ListItem生命周期 1.使用ForEach創建ListItem 2.使用LazyForEach創建ListItem 3…

2026界計算機專業畢業的有福了!(開題報告任務書)

開題報告 我們以基于Java的婚紗店管理系統為案例進行指導。 任務書: 首先是畢設的立題依據,這個主要描寫一些簡潔大體的大白話,描述一下你為什么要做這個題目的畢設。 那就需要你描述一下現階段社會面婚紗店的運營情況,寫一些…

安全、高效、可靠的物理隔離網絡安全專用設備———信刻光盤安全隔離與文件單向導入系統!

著各種數據傳輸、儲存技術、信息技術的快速發展,保護信息安全是重中之重。軍工企業、政府、部隊及企事業單位等利用A網與B網開展導入/導出相關工作已成為不可逆轉的趨勢。針對于業務需要與保密規范相關要求,涉及重要秘密信息,需做到完全的物理…

JetPack 與 PyTorch 版本對應及資源詳情

下載鏈接 JetPack 版本適配 PyTorch 版本發布日期可下載資源(.whl 安裝包 / 文檔)JP 6.1PyTorch 2.5.0a0(構建號:872d972e41.nv24.08.17622132)2024/10/01- torch-2.5.0a0872d972e41.nv24.08.17622132-cp310-cp310-li…

【c++進階系列】:萬字詳解多態

🔥 本文專欄:c 🌸作者主頁:努力努力再努力wz 💪 今日博客勵志語錄: 你以為自己在孤獨地爬坡嗎?看看身后吧——那些被汗水浸濕的腳印,早已連成一道向上的階梯 ★★★ 本文前置知識&am…

AI+預測3D新模型百十個定位預測+膽碼預測+去和尾2025年8月23日第168彈

從今天開始,咱們還是暫時基于舊的模型進行預測,好了,廢話不多說,按照老辦法,重點8-9碼定位,配合三膽下1或下2,殺1-2個和尾,再殺4-5個和值,可以做到100-300注左右。(1)定位…

分布式搜索(Elasticsearch)深入用法

目錄 數據聚合 聚合的種類 DSL實現聚合 桶聚合 度量聚合 RestAPI實現聚合 多條件聚合 自動補全 拼音分詞器 自定義分詞器 自動補全查詢 實現搜索框自動補全 數據同步 數據同步思路分析 實現elasticsearch與數據庫數據同步 集群 搭建ES集群 集群腦裂問題 集群…

java:接口與實現類

1. Java 基礎層面接口(Interface) 只是方法的定義/規范,里面沒有真正的邏輯。例如:public interface IBookService {boolean save(Book book); }👉 這里只說明了:我要有一個 save 方法,但“怎么…

Chrome 插件開發實戰:從入門到進階

1.1 Chrome 插件的魅力與應用場景Chrome 插件是增強 Chrome 瀏覽器功能的得力助手,能實現廣告攔截、密碼管理、標簽管理等實用功能。在日常辦公中,我們可以借助插件提升效率,如自動填充表單、快速保存網頁內容;在瀏覽網頁時&#…