端到端自動駕駛系統關鍵技術

一、感知決策一體化模型架構

單一神經網絡整合全流程

端到端神經網絡能夠直接將傳感器輸入映射為控制輸出,消除了傳統模塊化架構中感知、規劃、控制等獨立模塊之間的割裂。傳統架構中,感知模塊負責識別環境信息,決策模塊根據感知結果進行路徑規劃和決策制定,控制模塊再根據決策執行車輛的操作,各模塊之間存在信息傳遞損耗和延遲。而端到端架構通過一個單一的神經網絡模型,將整個流程整合在一起,使傳感器采集到的數據能夠直接用于生成車輛的控制指令,大大提高了系統的響應速度和整體性能。

例如,特斯拉 FSD v12 采用純視覺感知模型,通過多個攝像頭采集車輛周圍的視覺信息,這些信息直接輸入到一個深度神經網絡中,經過網絡的處理和計算,最終輸出車輛的轉向角度以及加速或制動指令,實現從輸入到輸出的端到端閉環,讓車輛能夠根據實時視覺信息做出精準的駕駛決策。

模型架構創新

  • BEV+Transformer:將多攝像頭數據轉換至鳥瞰視角(BEV),結合注意力機制動態捕捉道路拓撲關系。鳥瞰視角能夠提供更全面的周圍環境信息,類似于從空中俯瞰道路和車輛周圍的情況,有助于更好地理解復雜的道路布局和交通參與者之間的關系。注意力機制則可以根據不同的駕駛場景和任務,動態地關注道路上的關鍵區域和重要信息,從而提升車輛在復雜路口等場景下的通行能力。
    以華為 ADS 3.0 為例,在城市復雜路口場景下,通過 BEV+Transformer 架構,系統能夠準確地捕捉到各個方向來車、行人、非機動車等交通參與者的運動狀態和位置關系,實現了路口通行成功率提升至 98%。這意味著車輛在通過復雜路口時,能夠更精準地做出避讓、轉彎或直行等決策,減少因決策失誤導致的通行延遲或安全隱患。

  • 占用柵格網絡(Occupancy):通過 3D 體素建模識別異形障礙物。傳統的目標檢測方法通常使用邊界框來標識和定位障礙物,但對于一些形狀不規則或較小的異形障礙物(如掉落的輪胎、油桶、塑料袋等),邊界框檢測可能會出現漏檢或誤檢的情況。占用柵格網絡將空間劃分為一個個 3D 體素單元,對每個體素單元進行占用狀態的判斷,從而能夠更精確地識別出這些異形障礙物的形狀、大小和位置,解決了傳統檢測方法的局限性。
    在高速公路上,如果車輛前方有掉落的輪胎,占用柵格網絡可以準確地檢測到這個異形障礙物,并及時為車輛的決策系統提供信息,使車輛能夠提前采取制動或避讓措施,有效避免潛在的碰撞事故。

二、多模態數據融合技術

傳感器協同感知

融合攝像頭、激光雷達、毫米波雷達等多種傳感器的數據,可以構建一個冗余感知體系。不同傳感器具有各自的優勢和局限性,攝像頭能夠提供豐富的視覺紋理和顏色信息,用于識別交通標志、車道線、行人等;激光雷達可以生成高精度的三維點云數據,精確測量物體的距離和形狀;毫米波雷達則在測距、測速方面表現出色,且在惡劣天氣條件下仍能保持較好的工作性能。通過將這些傳感器的數據進行融合,可以相互補充和驗證,提高系統對周圍環境感知的準確性和魯棒性,尤其在濃霧、強光等惡劣天氣條件下,能夠確保車輛依然能夠可靠地感知周圍環境。

Mobileye 的復合 AI 系統(CAIS)就是一個典型案例。該系統以攝像頭為核心,同時輔以低成本的固態激光雷達,成本降至 1200 元,但通過傳感器融合技術,實現了厘米級的探測精度。這意味著即使在復雜環境下,車輛也能夠精確地感知到周圍物體的位置和距離,為后續的決策和控制提供更精準的數據支持,有效提升了自動駕駛系統的安全性和可靠性。

時空對齊與特征級融合

為了實現多模態數據的有效融合,需要通過時空同步算法對齊多傳感器數據的時間戳與空間坐標。因為不同傳感器采集數據的時間和頻率可能不完全一致,存在時間上的偏差,同時它們的坐標系也可能不同,所以必須先將這些數據在時間和空間上進行對齊,使其具有可比性和可融合性。在此基礎上,再利用深度學習模型提取跨模態特征,例如將視覺紋理信息(來自攝像頭)與點云深度信息(來自激光雷達)相結合,形成更豐富、更具判別力的特征表示,從而提高對環境物體的識別和理解能力。

例如,在一個包含行人和車輛的復雜交通場景中,經過時空對齊后,系統可以將攝像頭捕捉到的行人的外觀、動作等視覺紋理特征與激光雷達測量到的行人的距離、形狀等深度信息進行融合。通過深度學習模型提取融合后的特征,能夠更準確地識別出行人的位置、運動方向和速度,以及車輛的類型、行駛狀態等信息,為自動駕駛車輛的決策系統提供更全面、準確的環境感知結果,幫助車輛更好地規劃行駛路徑和做出安全的決策。

三、大模型驅動與訓練優化

AI 大模型賦能決策

  • 模仿學習:通過大量的千萬級人類駕駛視頻來訓練模型,使其能夠學習到人類駕駛員在各種場景下的駕駛行為和決策模式,從而具備擬人化的決策能力。這些人類駕駛視頻涵蓋了各種不同的路況、交通條件和駕駛場景,模型在學習過程中可以逐漸理解在何種情況下應該采取何種駕駛操作,例如在路口如何轉彎、在高速公路上如何超車、在擁堵路段如何跟車等。
    小鵬 XNGP 系統通過訓練超過 1000 萬段真實路況視頻,讓模型學習到豐富的駕駛經驗,使其在實際駕駛過程中能夠做出更貼近人類駕駛員的決策,如在復雜的城市道路中靈活避讓障礙物、平順地通過路口等。這種模仿學習的方式能夠有效提升自動駕駛系統的智能化水平和用戶體驗。

  • 強化學習:強化學習是一種通過與環境進行交互,根據獎勵信號來優化模型決策策略的學習方法。在端到端自動駕駛中,地平線征程 6 芯片針對 Transformer 架構進行了優化,能夠更高效地支持強化學習的計算需求。這使得模型可以在動態博弈場景(如加塞、擁堵跟車等復雜交互場景)中,實時地根據當前的交通狀況和車輛之間的相互關系,做出最優的決策,并通過不斷的學習和訓練來提升決策的準確性和適應性。
    在高速公路上遇到前車突然加塞的情況,經過強化學習的自動駕駛模型能夠根據實時的車速、車距、周圍車輛的運動狀態等信息,迅速判斷出是采取減速避讓還是保持原速行駛等不同的應對策略,并根據實際的行駛結果和設定的獎勵機制(如行駛安全性、舒適性、效率等指標)來不斷調整和優化決策策略,從而在未來的類似場景中做出更合理的決策。

數據閉環與迭代

端到端自動駕駛系統的數據閉環包括真實路測、仿真訓練和 OTA 更新三個關鍵環節,形成一個持續迭代優化的閉環。

  • 首先,在真實路測過程中,車輛會行駛在各種實際道路上,采集大量真實的駕駛數據,特別是長尾場景(如施工區、違章行人等罕見但關鍵的場景)的數據。這些數據能夠為模型的訓練提供豐富多樣的樣本,幫助模型更好地學習和適應各種復雜的現實情況。
  • 然后,利用虛擬仿真平臺生成極端案例(如傳感器失效、GPS 丟失等罕見但危險的場景),這些場景在真實路測中可能很難遇到,但在仿真環境中可以方便地構造和模擬。通過在仿真平臺上對這些極端案例進行訓練,可以提前發現模型的潛在問題和不足之處,并有針對性地進行優化和改進。
  • 最后,通過車云協同的方式,將優化后的算法和模型通過 OTA(Over-The-Air)技術快速更新到車輛上,實現系統的快速迭代升級。例如,蔚來 NOP+ 系統通過 OTA 更新后,將地庫泊車成功率提升至 95%,這表明經過數據閉環的迭代優化,車輛在特定場景下的性能得到了顯著提升。

例如,某自動駕駛車輛在真實路測中遇到了一個施工區域,施工區的道路布局和交通標志與常規道路有很大不同,車輛的自動駕駛系統在該場景下的表現可能不夠理想,采集到了相關數據。這些數據回傳到云端后,研發人員在仿真平臺上對該施工場景進行模擬和擴展,生成更多的相關訓練數據,并對模型進行針對性的訓練和優化。優化后的模型通過 OTA 推送到車輛上,當車輛再次遇到類似的施工場景時,就能夠更準確地識別和應對,提高了行駛的安全性和可靠性。

四、高可靠性執行與驗證體系

技術方向及核心能力

  • 線控底盤:線控底盤能夠實現微米級轉向和制動控制,確保車輛對高精度指令的精準執行。傳統的機械式底盤控制可能存在一定的滯后性和精度誤差,而線控底盤通過電子信號直接控制轉向和制動系統,能夠更快速、更精確地響應自動駕駛系統的控制指令,從而提高車輛的操控性能和行駛穩定性。
    吉利的線控底盤響應誤差小于 0.1°,這意味著當自動駕駛系統發出轉向指令時,車輛的實際轉向角度與指令要求的角度之間的偏差極小,能夠確保車輛按照預期的軌跡行駛,無論是進行精確的車道保持還是復雜的避障操作,都能提供可靠的支持。

  • 冗余設計:為了提高系統的可靠性,端到端自動駕駛系統采用冗余設計,包括雙備份傳感器和計算單元。這樣,即使其中一個傳感器或計算單元出現故障,另一個備份單元仍能接管工作,確保車輛的安全運行。這種冗余設計類似于飛機上的關鍵系統備份,能夠在單點故障發生時,維持系統的基本功能,降低因硬件故障導致的事故風險。
    蔚來的全冗余系統通過了 ASIL-D 功能安全認證,ASIL-D 是汽車安全完整性等級中的最高等級,這表明蔚來的冗余設計在功能安全方面達到了極高的標準,能夠有效保障車輛在各種復雜工況下的安全運行,為乘客提供可靠的出行保障。

  • 仿真驗證平臺:構建千萬公里級虛擬里程的仿真驗證平臺,能夠覆蓋 95% 的長尾場景。通過仿真平臺,可以在虛擬環境中高效地測試和驗證自動駕駛系統的性能,模擬各種極端工況和罕見場景,提前發現潛在問題并進行優化,大大降低了在真實道路上測試的風險和成本。
    華為的仿真平臺能夠將極端場景的生成效率提升 5 倍,這意味著可以在更短的時間內生成更多的極端場景案例,為自動駕駛系統的測試和訓練提供充足的數據支持。例如,在仿真平臺上可以模擬暴風雨天氣下的高速公路行駛、復雜的山區道路行駛、城市中的突發交通事故等場景,全面驗證自動駕駛系統在這些場景下的應對能力和安全性。

關鍵挑戰與應對

  • 黑箱決策風險:端到端自動駕駛系統的決策過程往往被視為 “黑箱”,難以直接解釋其決策依據。為了應對這一挑戰,可以通過注意力熱力圖等可視化技術來顯示模型在決策時關注的關鍵區域和因素。例如,特斯拉 FSD v12 在避讓障礙物時,能夠顯示障礙物避讓權重的注意力熱力圖,讓研發人員和用戶能夠直觀地了解模型是如何根據周圍環境信息做出避讓決策的,從而提高系統的可解釋性和用戶對系統的信任度。
  • 算力瓶頸:端到端自動駕駛系統的大模型對算力要求極高,為了突破這一瓶頸,可以采用分布式計算的方式。例如,華為昇騰 610 芯片支持 500+ TOPS 算力,通過分布式計算架構,將計算任務分配到多個芯片上并行處理,能夠顯著提高模型的推理效率,滿足自動駕駛系統對實時性的嚴格要求。

技術趨勢

端到端自動駕駛技術正向 “輕地圖化” 和 “車路云協同” 的方向演進。

  • 輕地圖化:傳統自動駕駛系統對高精地圖的依賴程度較高,但高精地圖的制作和更新成本較高,且在一些動態變化頻繁的場景下可能無法及時反映道路的實際情況。輕地圖化的目標是減少對高精地圖的依賴,通過增強車輛自身的感知和決策能力,使車輛能夠在僅有普通地圖或無地圖的情況下,依然能夠準確地進行環境感知和路徑規劃。這將提高自動駕駛系統的適應性和通用性,降低系統對地圖數據的依賴和更新成本。
  • 車路云協同:通過 V2X(Vehicle-to-Everything)實時交互技術,實現車輛與車輛、車輛與道路基礎設施、車輛與云端之間的信息共享和協同優化。車路云協同可以提供更全面的交通信息,幫助車輛提前了解前方道路狀況和交通信號變化,優化全局路徑規劃,提高行駛效率和安全性。例如,當車輛行駛在高速公路上時,通過與路邊的智能交通設施通信,可以提前獲取前方路段的擁堵信息、施工信息等,并及時調整行駛路線;同時,云端平臺可以對大量車輛的行駛數據進行分析和處理,為車輛提供更精準的交通預測和路徑規劃建議。

以上講解涵蓋了端到端自動駕駛系統的關鍵技術,包括感知決策一體化模型架構、多模態數據融合、大模型驅動與仿真驗證等方面的內容,并結合實例進行了詳細闡述,希望能幫助你更好地理解和掌握這一領域的知識。

本文來自互聯網用戶投稿,該文觀點僅代表作者本人,不代表本站立場。本站僅提供信息存儲空間服務,不擁有所有權,不承擔相關法律責任。
如若轉載,請注明出處:http://www.pswp.cn/news/912790.shtml
繁體地址,請注明出處:http://hk.pswp.cn/news/912790.shtml
英文地址,請注明出處:http://en.pswp.cn/news/912790.shtml

如若內容造成侵權/違法違規/事實不符,請聯系多彩編程網進行投訴反饋email:809451989@qq.com,一經查實,立即刪除!

相關文章

Vue Vue-route (2)

Vue 漸進式JavaScript 框架 基于Vue2的學習筆記 - Vue-route重定向和聲明式導航 目錄 Vue-route路由 重定向 首頁默認訪問 不存在匹配 聲明式導航 路由原理 使用示例 自定義class類 Tag設置 版本4路由 改變 示例 總結 Vue-route路由 重定向 首頁默認訪問 希望訪…

Mabl 基于云端的智能化自動化測試平臺

??親愛的技術愛好者們,熱烈歡迎來到 Kant2048 的博客!我是 Thomas Kant,很開心能在CSDN上與你們相遇~?? 本博客的精華專欄: 【自動化測試】 【測試經驗】 【人工智能】 【Python】 </

Linux/Dog

Dog Enumeration nmap 第一次掃描發現系統對外開放了22、80端口&#xff0c;端口詳細信息如下 ┌──(kali?kali)-[~/Desktop/vegetable/HTB] └─$ nmap -sC -sV -p 22,80 -oA nmap 10.10.11.58 Starting Nmap 7.95 ( https://nmap.org ) at 2025-06-26 03:36 EDT Nmap s…

青少年編程與數學 02-022 專業應用軟件簡介 01 設計與創意類軟件:Adobe Creative Cloud

青少年編程與數學 02-022 專業應用軟件簡介 01 設計與創意類軟件&#xff1a;Adobe Creative Cloud **一、Adobe公司介紹**&#xff08;一&#xff09;Adobe的創立與早期發展&#xff08;二&#xff09;Adobe的市場地位與影響力&#xff08;三&#xff09;Adobe的創新文化 **二…

【亞馬遜防關聯攻略】多店鋪運營如何做好環境隔離?

在亞馬遜跨境電商中&#xff0c;多店運營的最大風險是賬號關聯。亞馬遜規定&#xff0c;同一賣家在同一站點只能擁有一個店鋪。平臺會通過多種方式追蹤注冊信息、設備和網絡環境等&#xff0c;如果發現關聯因素&#xff0c;所有關聯賬號可能被批量封禁&#xff0c;這會導致資金…

She‘s Coming !

#好書推薦《一本書講透汽車功能安全&#xff1a;標準詳解與應用實踐》 #功能安全應用指南 #功能安全實踐參考寶典 Finally, shes coming ! 她來得有點晚&#xff0c;但 “好飯不怕晚”。 她就是剛出爐的新書《一本書講透汽車功能安全&#xff1a;標準詳解與應用實踐》 京東…

如何用廢棄電腦變成服務器搭建web網站(公網訪問零成本)

文章目錄 &#x1f4bb; 如何用廢棄電腦變成服務器搭建 Web 網站&#xff08;公網訪問零成本&#xff09;一、背景與目標? 本文目標&#xff1a; 二、準備工作&#xff08;軟硬件需求&#xff09;&#x1f9f1; 1. 硬件需求&#x1f9f0; 2. 軟件環境準備 三、快速搭建一個 Fl…

〔從零搭建〕指標體系平臺部署指南

&#x1f525;&#x1f525; AllData大數據產品是可定義數據中臺&#xff0c;以數據平臺為底座&#xff0c;以數據中臺為橋梁&#xff0c;以機器學習平臺為中層框架&#xff0c;以大模型應用為上游產品&#xff0c;提供全鏈路數字化解決方案。 ?杭州奧零數據科技官網&#xf…

Vue3 中watch和computed

Vue 3 中 computed 與 watch 深度解析 在 Vue 3 組合中&#xff0c;響應式工具的類型安全使用至關重要。以下是詳細說明 一、watch 偵聽器 1. 基礎類型監聽 <template><div>實際參數1{{count}}</div><div><button click"count">點…

.NET測試工具Parasoft dotTEST:全兼容RMS的測試解決方案

隨著項目規模擴大&#xff0c;需求管理變得復雜&#xff0c;如何高效追溯需求與測試的關聯性成為一大挑戰。Parasoft dotTEST 提供了一套強大的需求追溯解決方案&#xff0c;不僅能自動關聯單元測試結果與需求&#xff0c;還能兼容幾乎所有需求管理系統&#xff08;RMS&#xf…

基于Jeecgboot3.8.1的vue3版本前后端分離的flowable流程管理平臺

初步遷移完成了基于jeecgboot3.8.1的vue3版本的前后端流程管理平臺,基于flowable6.8.0,同時支持bpmn流程設計器與仿釘釘流程設計器。 功能類似于3.6.3,但增加了一些以下功能: 1、支持多租戶 2、支持并行網關的任意跳轉、退回與駁回 3、流程表達式 這里流程表達式定義四…

IP 限流 vs. URI 限流

背景&#xff1a; 昨天調程序的時候遇到了一個 BUG&#xff0c;前端無法將文件正確傳給后端&#xff0c;后端報錯 EOFException&#xff08;EOF 代表 End Of File&#xff09;就是在程序嘗試從一個數據流中讀取數據時&#xff0c;發現已經到達了數據流的末尾&#xff0c;但它卻…

2025年Java常見面試題(持續更新)

數據庫事務特性。原子性、一致性、隔離性、持久性如何防止SQL注入&#xff1a;使用#不要使用$符號&#xff1b;對所有的入參做校驗&#xff1b;使用存儲過程&#xff1b;執行預處理語句和參數化查詢&#xff1b;最低權限原則&#xff1b;微服務拆分的原則&#xff1a;微服務的拆…

Spring AI ——在springboot應用中實現基本聊天功能(ChatModel)

文章目錄 前言項目版本依賴引入配置key信息編寫測試接口注入ChatModel并普通返回注入ChatModel并流式返回自定義模型對象并直接返回總結前言 在Spring AI 中,CchatClient 是一個所有大模型通用性的調用方式,對絕大多數大模型的功能點都具備封裝和見解調用性。 但這一點在部…

78、系統工程生命周期階段及方法

一、系統工程生命周期的七大階段 系統工程生命周期涵蓋從概念萌芽到系統退役的全過程&#xff0c;通常分為以下七個階段&#xff0c;每個階段具有明確目標與核心任務&#xff1a; 1.探索性研究階段 目標&#xff1a;識別利益相關者需求&#xff0c;探索技術可行性。任務&…

二十九、【用戶體驗篇】個人中心:用戶資料展示與密碼修改

二十九、【用戶體驗篇】個人中心:用戶資料展示與密碼修改 前言準備工作第一部分:后端實現 - 個人中心 API1. 修改 `UserDetailSerializer` 以支持密碼修改2. 在 `api/views.py` 中添加 `UserMeView` 和 `PasswordChangeView`3. 注冊個人中心相關 API 路由4. 后端初步測試第二…

STEP-BACK PROMPTING:退一步:通過抽象在大型語言模型中喚起推理能力

摘要 我們提出了 STEP-BACK PROMPTING&#xff0c;這是一種簡單的提示技術&#xff0c;可以讓LLM進行抽象&#xff0c;從包含具體細節的實例中推導出高層次概念和第一性原理。利用這些概念和原理來引導推理過程&#xff0c;LLM在朝向正確解答路徑上顯著提升了推理能力。我們在…

Paimon vs. HBase:全鏈路開銷對比

Paimon 在特定場景&#xff08;如流式 Lookup Join&#xff09;下&#xff0c;會為了極致的查詢性能而引入額外的存儲&#xff08;本地磁盤 LookupFile&#xff09;和計算&#xff08;構建 LookupFile&#xff09;開銷。但這是一種用一次性的、可控的開銷&#xff0c;換取后續持…

本地的包名導致的AttributeError: module ‘langchain‘ has no attribute ‘verbose‘

你遇到的 AttributeError: module langchain has no attribute verbose 問題&#xff0c;確實可能是因為你的本地文件或目錄名與 langchain 官方包沖突&#xff0c;導致 Python 在導入時優先加載了你的本地文件而非真正的 langchain 庫。 問題原因 Python 模塊加載機制&#xf…

玄機——某學校系統中挖礦病毒應急排查

本篇文章主要記錄某學校長期未運營維護的程序&#xff0c;被黑客發現了漏洞&#xff0c;但好在學校有全流量設備&#xff0c;抓取到了過程中的流量包 需要你進行上機以及結合流量分析&#xff0c;排查攻擊者利用的漏洞以及上傳利用成功的木馬 文章目錄 靶機介紹1.使用工具分析共…