自動駕駛SLAM又一開源巔峰之作!深挖時間一致性,精準構建超清地圖

論文標題:

DTCLMapper: Dual Temporal Consistent Learning for Vectorized HD Map Construction

論文作者:

Siyu Li, Jiacheng Lin, Hao Shi, Jiaming Zhang, Song Wang, You Yao, Zhiyong Li, Kailun Yang

導讀:

本文介紹了一種用于自動駕駛高精地圖構建的新方法,該方法利用了鳥瞰視角(BEV)場景理解中的時間一致性學習,在保證建圖質量的同時,避免了傳統時間融合方法中的特征冗余問題。??【深藍AI】編譯

1. 背景簡介

高清地圖(HD Map)是自動駕駛技術不可或缺的基石,它賦予系統對周圍靜態環境的精確認知,從而確保導航的準確性和安全性。目前,主要有兩種類型的高清地圖:語義地圖和矢量地圖。語義地圖通常采用網格形式,在二維平面上展示道路信息,而矢量地圖則利用幾何點和線條來精確描述道路的輪廓。盡管兩種地圖各有其應用場景,但矢量地圖在存儲效率和精確度方面均展現出了明顯的優勢,這對于自動駕駛系統中的實時感知任務至關重要。

近年來的研究表明,實時的鳥瞰圖(BEV)融合技術能夠有效應對視覺信息的稀疏性問題。然而,現有的時間融合策略似乎并未顯著提升矢量化高清地圖的質量。融合后的BEV特征與地圖實例的特征匹配度不高,導致矢量點難以精確地定位到其原始位置,進而影響了檢測的準確性。經過深入分析,作者認為,這些方法主要依賴于簡單的時間特征融合,而未能充分利用對象間的差異性和相似性。

在這里插入圖片描述
▲圖1|當前時序融合與提出的一致性學習解決方案的區別??【深藍AI】編譯

2. 方案提出

為了應對上述挑戰,作者提出了DTCLMapper框架,該框架包含兩個協同工作的一致性學習組件:實例一致學習(ICL)和地圖一致學習(MCL)。這兩個組件相互補充,共同推動框架的性能提升。ICL組件由矢量點預選模塊(VPPSM)和聚合實例特征一致學習(AIFCL)組成。

VPPSM負責為實例中的一致性學習提供精確的實例特征,而AIFCL則致力于通過增強稀疏實例的一致性來提升整體性能。MCL組件則通過利用實例之間的一致性幾何位置信息來增強模型的一致性和泛化能力。

框架采用了矢量化地圖的柵格化方法來實現一致性,同時引入了地圖占用損失作為評估機制。這種機制不僅確保了空間關系的保持,還有助于改進模型的一致性和泛化能力,從而在自動駕駛領域中實現更精準的感知和決策。

在這里插入圖片描述
▲圖2|不同時序融合方法的結果??【深藍AI】編譯

3. 方法詳析

■3.1. 框架

DTCLMapper框架集成了圖像骨干網絡、多視圖變換器、BEV解碼器和多任務頭:

●多視圖圖像由預訓練的骨干網絡編碼,生成深度特征,這些特征通過視圖變換器聚合成BEV嵌入;

●變換器模塊采用BEVFormer和LSS等經典方法;

●BEV解碼器利用Deformable DETR技術。解碼器輸入包括BEV嵌入、實例查詢、初始參考點和點查詢;

●任務頭通過線性層和激活函數預測實例的標簽和邊框。

在這里插入圖片描述
▲圖3|提出的DTCLMapper架構概覽??【深藍AI】編譯

■3.2. 實例一致性學習(ICL)

ICL模塊由兩部分組成:矢量點預選模塊(VPPSM)和聚合實例特征一致性學習(AIFCL)。

●VPPSM致力于提供精確的實例特征,以增強實例的一致性學習;

●AIFCL則通過對比學習聚合的實例特征,提升稀疏實例的一致性表達。

其中,用于對比學習的正樣本是指來自不同時間幀但屬于同一實例的特征,而負樣本則是來自不同實例或錯誤匹配的特征。這種方法有助于提高同一實例在不同時間幀上的特征一致性,從而增強模型在處理稀疏視覺信息時的魯棒性和準確性。

◆矢量點預選擇模塊(VPPSM)

VPPSM模塊的設計旨在提高每個實例矢量點的回歸精度。該模塊通過以下幾個步驟實現:

●輸入特征處理:從BEV嵌入特征中提取與實例相關的特征。這些特征代表了場景中每個實例的幾何和語義信息。

●預選矢量點:對每個實例的初始矢量點進行篩選,選擇最能代表實例形狀和位置的矢量點。

●精細調整:使用已篩選的矢量點作為基礎,通過進一步的特征處理和調整,優化每個矢量點的位置,以提高矢量點的回歸精度。

VPPSM通過這一系列步驟,確保了矢量點的選擇和調整過程更加精確,從而為后續的一致性學習提供了可靠的基礎。

在這里插入圖片描述
▲圖4|矢量點預選模塊(VPPSM)示意圖??【深藍AI】編譯

◆聚合實例特征一致性學習(AIFCL)

AIFCL模塊通過對比學習(Contrastive Learning)來增強實例的一致性。具體流程如下:

●特征聚合:將來自不同時間幀的同一實例特征聚合在一起,形成一個綜合特征表示。

●對比學習:通過選擇正樣本和負樣本進行對比學習。正樣本是指來自不同時間幀的同一實例特征,而負樣本則是不同實例或錯誤匹配的特征。

●一致性增強:通過對比學習的過程,增強同一實例在不同時間幀中的特征一致性,減少特征漂移,提高實例表示的穩定性。

AIFCL模塊通過這種方式,確保實例特征在時間上的一致性,從而提高了矢量化高精地圖構建的準確性和穩定性。

■3.3. 地圖一致性學習(MCL)

MCL模塊通過利用「實例間的一致性幾何位置信息」來提升模型性能,借助于「矢量化地圖的柵格化網格地圖」來實施一致性約束。MCL采用地圖占用損失作為評估工具,以確保空間關系的準確性,從而增強模型的一致性和泛化能力。

◆設計思路

MCL模塊旨在通過全局幾何和狀態的一致性約束,進一步增強地圖的整體一致性和泛化能力。其設計思路包括:

●全局幾何一致性:利用實例間的幾何關系,確保各實例在全局地圖中的位置和形狀保持一致。

●狀態一致性:通過評估實例的占用狀態,確保地圖中實例的空間排列和占用關系準確反映實際情況。

◆實現方法

●網格地圖柵格化:將矢量化地圖轉換為網格地圖,以便于全局一致性的計算和評估。網格地圖提供了一種便捷的表示方式,使得幾何和狀態的一致性檢查更為直觀,且更易于實現。

●地圖占用損失:定義一種損失函數,評估實例在網格地圖中的占用狀態。該損失函數衡量實例間的空間關系,確保全局幾何一致性。

●自監督學習:利用自監督學習方法,強化模型的全局一致性。自監督學習無需額外標注,通過對輸入數據自身的結構和分布進行學習,提高模型的泛化能力。

MCL模塊通過這些方法,確保地圖中各實例的全局幾何和狀態一致性,從而提高矢量化高清地圖的整體質量和泛化能力。

4. 實驗結果

在公共數據集nuScenes和Argoverse上的廣泛實驗結果表明,作者提出的方法在高清地圖構建方面取得了顯著的提升,在平均精度(mAP)上分別達到了61.9%和65.1%的優異表現。

在這里插入圖片描述
▲表1|nuScenes數據集上的結果(*表示數據是通過開源實現的)??【深藍AI】編譯

在這里插入圖片描述
▲表2|Argoverse數據集上的結果(*表示數據是通過開源實現的)??【深藍AI】編譯

在這里插入圖片描述
▲表3|提出的模塊的消融實驗結果??【深藍AI】編譯

在這里插入圖片描述
▲表4|不同視圖轉換方法的結果??【深藍AI】編譯

在這里插入圖片描述
▲表5|實例學習中關鍵嵌入數量的結果??【深藍AI】編譯

在這里插入圖片描述
▲表6|占用損失的消融實驗結果??【深藍AI】編譯

在這里插入圖片描述
▲表7|不同時序融合方法的結果??【深藍AI】編譯

在這里插入圖片描述
▲表8|不同方法效率的結果。“VT”表示透視圖和鳥瞰圖之間的轉換方法;“Trans”表示Transformer結構;“SA”表示自注意力??【深藍AI】編譯

在這里插入圖片描述
▲圖5|nuScenes驗證數據集上的可視化結果??【深藍AI】編譯

在這里插入圖片描述
▲圖6|Argoverse驗證數據集上的可視化結果??【深藍AI】編譯

在這里插入圖片描述
▲圖7|矢量點回歸的可視化??【深藍AI】編譯

在這里插入圖片描述
▲圖8|HD網格地圖合并效果的比較??【深藍AI】編譯

在這里插入圖片描述
▲圖9|網格地圖合并的分析??【深藍AI】編譯

5. 總結

本文詳細介紹了DTCLMapper框架,它由兩個核心模塊組成:實例一致性學習(ICL)和地圖一致性學習(MCL)。ICL模塊通過矢量點預選和聚合實例特征一致性學習,強化了實例特征在時間維度上的一致性。而MCL模塊則通過全局的幾何和狀態一致性約束,確保了地圖的整體一致性和泛化能力。這兩個模塊的協同作用顯著提高了矢量化高精地圖的構建精度和質量。

作者計劃進一步優化和擴展DTCLMapper框架,以適應更復雜的駕駛環境和處理更大規模的數據集。此外,作者建議各位學者去探索更多的自監督學習方法和多任務學習策略,以增強模型的泛化能力和適應性。

編譯|Deep藍同學

審核|Los

移步公眾號【深藍AI】,第一時間獲取自動駕駛、人工智能與機器人行業最新最前沿論文和科技動態👇
深藍AI·賦能智自動駕駛與人工智能

本文來自互聯網用戶投稿,該文觀點僅代表作者本人,不代表本站立場。本站僅提供信息存儲空間服務,不擁有所有權,不承擔相關法律責任。
如若轉載,請注明出處:http://www.pswp.cn/web/42353.shtml
繁體地址,請注明出處:http://hk.pswp.cn/web/42353.shtml
英文地址,請注明出處:http://en.pswp.cn/web/42353.shtml

如若內容造成侵權/違法違規/事實不符,請聯系多彩編程網進行投訴反饋email:809451989@qq.com,一經查實,立即刪除!

相關文章

突發!馬斯克3140億參數Grok開源!Grok原理大公開!

BIG NEWS: 全球最大開源大模型!馬斯克Grok-1參數量3410億,正式開源!!! 說到做到,馬斯克xAI的Grok,果然如期開源了! 就在剛剛,馬斯克的AI創企xAI正式發布了此前備受期待大模型Grok-1,其參數量達…

硅紀元視角 | 虛擬神經科學的突破:AI「賽博老鼠」誕生

在數字化浪潮的推動下,人工智能(AI)正成為塑造未來的關鍵力量。硅紀元視角欄目緊跟AI科技的最新發展,捕捉行業動態;提供深入的新聞解讀,助您洞悉技術背后的邏輯;匯聚行業專家的見解,…

企業需要什么樣的MES?

MES(英文全稱:Manufacturing Execution System),即制造執行系統,是面向車間生產的管理系統。它位于上層計劃管理系統(如ERP)與底層工業控制(如PCS層)之間,是制…

【Linux】:服務器用戶的登陸、刪除、密碼修改

用Xshell登錄云服務器。 1.登錄云服務器 先打開Xshell。彈出的界面點。 在終端上輸入命令ssh usernameip_address,其中username為要登錄的用戶名,ip_address為Linux系統的IP地址或主機名。 然后輸入密碼進行登錄。 具體如下: 找到新建會話…

Windows與time.windows.com同步time出錯(手把手操作)

今天我來針對Windows講解Time同步 時間問題 計算機的時間不同,過快或者過慢。(可以和自己的手機時間進行對比,手機的時間進行同步的頻率會比計算機更快,因此更精準)計算機time過快和過慢,會導致使用過程中…

想實現隨時隨地遠程訪問?解析可道云teamOS內網穿透功能

在數字化時代,無論是個人還是企業,都面臨著數據共享與遠程訪問的迫切需求。 比如我有時會需要在家中加班,急需訪問公司內網中的某個關鍵文件。 然而,由于公網與內網的天然隔閡,這些需求往往難以實現。這時&#xff0c…

代碼隨想錄 鏈表章節總結

移除鏈表元素 && 設計鏈表 學會設置虛擬頭結點 翻轉鏈表 leetcode 206 https://leetcode.cn/problems/reverse-linked-list/description/ 方法一:非遞歸新開鏈表 頭插法:創建一個新的鏈表,遍歷舊鏈表,按順序在新鏈表使…

AIGC | 在機器學習工作站安裝NVIDIA CUDA? 并行計算平臺和編程模型

[ 知識是人生的燈塔,只有不斷學習,才能照亮前行的道路 ] 0x02.初識與安裝 CUDA 并行計算平臺和編程模型 什么是 CUDA? CUDA(Compute Unified Device Architecture)是英偉達(NVIDIA)推出的并行計算平臺和編…

idea提交代碼或更新代碼一直提示token然后登陸失敗無法提交或者更新代碼

最近因為換了電腦需要對開發環境做配置, 遇到了這個問題, 應該是因為我們用到了gitlab,默認的最新的idea會有gitlab插件 強制錄入gitlab的token,如果gitlab不支持token的驗證那么問題就來了 , 不管怎么操作都無法提交或…

FPGA之術語

FPGA之術語 IOSTANDARDDIFF_SSTL12:LVCMOS33:sys_clk_p/n:rst_n:UART時鐘JTAG:GPIOONFIPCIe IOSTANDARD 在電子工程領域,DIFF_SSTL12和LVCMOS33是兩種不同的電氣標準,用于定義信號的電壓級別和特性。 IOSTANDARD是一個在FPGA(現場可編程門陣…

Spring MVC深入理解之源碼實現

1、SpringMVC的理解 1)談談對Spring MVC的了解 MVC 是模型(Model)、視圖(View)、控制器(Controller)的簡寫,其核心思想是通過將業務邏輯、數據、顯示分離來組織代碼。 Model:數據模型,JavaBean的類,用來進行數據封裝…

【cocos2dx】【iOS工程】如何保存用戶在游戲內的繪畫數據,并將數據以圖像形式展示在預覽界面

【cocos2dx】【iOS工程】如何保存用戶在應用內的操作數據,并將數據以圖像形式展示在預覽界面 設備/引擎:Mac(11.6)/Mac Mini 開發工具:Xcode(15.0.1) 開發需求:如何保存用戶在應用…

富格林:抓住正規穩健出金思路

富格林指出,凡事要學會抓住正規思路避繁就簡,才會順利達到終點。在現貨黃金市場中,投資者必須學會抓對正規趨勢,才是走向盈利出金的根本保障。以下是富格林投資總結的幾個觀點和建議,希望能幫助投資者實現穩健出金。 …

算法基礎之分治法

算法原理 對于一個規模為 n n n 的子問題,若該問題可以容易地解決則直接解決,否則將其分解為 k k k 個規模較小的子問題,這些子問題相互獨立且與原問題形式相同。遞歸地解決這些子問題,然后將各子問題的解合并得到原問題的解&a…

單鏈表詳解(2)

三、函數定義 查找節點 //查找結點 SLTNode* SLTNodeFind(SLTNode* phead, SLTDataType x) {assert(phead);SLTNode* pcur phead;while (pcur){if (pcur->data x){return pcur;}pcur pcur->next;}return NULL; } 查找節點我們是通過看數據域來查找的,查…

Arm64 基礎指令集介紹

按照字母排序順序: ● ADC:帶進位加法。 ● ADCS:帶進位加法,設置標志位。 ● ADD (extended register):擴展寄存器加法。 ● ADD (immediate):立即數加法。 ● ADD (shifted register):移位寄存…

【MySQL05】【 undo 日志】

文章目錄 一、前言二、undo 日志(回滾日志)1. 事務 id2. undo 日志格式2.1 INSERT 對應的 undo 日志2.2 DELETE 對應的 undo 日志2.3 UPDATE 對應的 undo 日志2.3.1 不更新主鍵2.3.2 更新主鍵 2.3 增刪改操作對二級索引的影響2.4 roll_pointer 3. FIL_PA…

Windows 網絡重置

netsh int ip reset 命令是用于重置 Windows 操作系統中的網絡設置和配置的命令。 在網絡故障排除、修復網絡連接問題以及清除可能存在的網絡配置沖突時非常有用。 命令詳解: netsh: 用于配置各種網絡設置 int: 用于管理網絡接口 ip: 用于管理網絡接口的 IP 配…

layui項目中的layui.define、layui.config以及layui.use的使用

第一步:創建一個layuiTest項目,結構如下 第二步:新建一個test.js,利用layui.define定義一個模塊test,并向外暴露該模塊,該模塊里面有兩個方法method1和method2. 第三步:新建一個test.html,在該頁面引入layui.js&#x…

基于FPGA的LDPC編譯碼算法設計基礎知識

基于FPGA的LDPC編譯碼算法設計基礎知識 數字電路(數電)知識模擬電路(模電)知識1. 放大器1.1. 晶體管放大器1.2. 運算放大器1.3. 管子放大器(真空管放大器)微處理器/單片機知識其他相關知識 基于FPGA的算法設…