GaussianLSS

背景

BEV感知能夠聚合多個傳感器輸入得到統一的空間表征,在3D感知、下游應用以及跨模態融合中發揮重要作用。現有的BEV感知分為2D反投影(LSS)以及3D投影(BEVFormer),其中3D投影依賴于3D體素的投影,這導致BEV網格分辨率不能太大,否則計算代價高。本文提出了基于2D反向投影方法,在準確度與計算效率間取得平衡并滿足實時性要求。

相關工作

投影方法

對于3D投影來說,相比于2D反投影它是計算密集型的,對網格分辨率有較高要求,限制了在現實場景下的可擴展性。
對于2D反投影來說,LSS提出將2D特征抬升到3D空間中,但他依賴于準確的深度估計,深度估計錯會傳播到BEV表征中,因此后續的BEVStereo、BEVDepth都引入了深度損失作為輔助損失。雖然它們使用了概率深度估計來soft的抬升特征,但是還是缺乏顯式的深度不確定性的表示,在復雜場景下很難處理深度模糊性的問題。GaussianLSS通過計算概率深度分布的方差來建模深度不確定性,從而降低了對于準確深度的依賴轉為捕獲圍繞均值深度的空間范圍。

不確定性建模

不確定性建模就是在建模或預測時不是給出一個準確的值,而是給出預測結果+結果的信心程度。評估不確定性的方法包含以下幾種:

  • 預測分布的方差。計算概率分布的方差,從而在輸出中提供直接反映信心程度的信息。
  • 基于MLP的不確定評估。它是通過多層的MLP網絡得到一個不確定性分數,又或者是輸出一個分布的參數u與σ,其中σ作為方差衡量不確定性。
  • 貝葉斯網絡。使用分布的先驗建模不確定性。
    在這篇論文中,則是通過分布的方差來建模不確定性從而提升BEV表征,尤其是在深度模糊的情況下。

主要工作

深度不確定性建模

LSS的主要問題:1、離散深度導致稀疏BEV,空間覆蓋率低。2、不穩定的深度分布,softmax得到的深度概率即使兩個bin靠近也可能大不相同,從而導致BEV特征不一致,這是由于softmax會是大的更大,小的更小,深度值輕微的不同可能導致不成比例的深度關注度。
本文是在預測的深度分布的基礎上計算它的均值與方差,使用錯誤容忍因子得到[u-kσ,u+kσ]的范圍,這個范圍考慮了深度不確定性,實現更靈活可靠的深度投影。
在這里插入圖片描述

3D不確定性變換

對得到的深度范圍點,通過內外參轉換到自車坐標系下,計算出每個像素對應的均值與協方差,公式如下:
μ3d=∑i=0B?1Pi(p)?pi3d \mu _{3d} = \sum _{i=0}^{B-1} P_i(p) \, p^{3d}_i μ3d?=i=0B?1?Pi?(p)pi3d?
Σ=∑i=0B?1Pi(p)?(pi3d?μ3d)(pi3d?μ3d)T \Sigma = \sum_{i=0}^{B-1} P_i(p) \, (p^{3d}_i - \mu_{3d})(p^{3d}_i - \mu_{3d})^TΣ=i=0B?1?Pi?(p)(pi3d??μ3d?)(pi3d??μ3d?)T
使用馬氏距離定義置信范圍,利用了上面使用過的錯誤容忍系數,公式如下:
(x?μ3d)TΣ?1(x?μ3d)≤k2(x - \mu_{3d})^T \Sigma^{-1} (x - \mu_{3d}) \leq k^2(x?μ3d?)TΣ?1(x?μ3d?)k2

BEV Features Splatting

在這里插入圖片描述

對于提取的特征分別輸出context,opacity與depth,其中depth通過3D不確定性變換得到兩個參數作為后續的輸入,利用Gaussian Splatting投射到BEV視角。
FBEV(x)=∑i∈GBEVFiαiexp?(?12(x?μi)?Σi?1(x?μi))F_{BEV}(x) = \sum_{i \in G_{BEV}} F_i \alpha_i \exp\left(-\frac{1}{2} (x - \mu_i)^\top \Sigma_i^{-1} (x - \mu_i)\right)FBEV?(x)=iGBEV??Fi?αi?exp(?21?(x?μi?)?Σi?1?(x?μi?))
此外考慮到相鄰像素深度上的差異性,使用了多尺度BEV進行處理,最后進行上采樣。

實驗結果

在這里插入圖片描述
在這里插入圖片描述

總結

GaussianLSS通過創新性地結合深度不確定性建模與高效的多尺度BEV特征渲染,成功解決了深度模糊性的固有挑戰。這種方法不僅在基于反投影的方法中實現了最先進的性能,還在降低計算資源需求方面表現出色,使其特別適合自動駕駛的實時應用場景。
GaussianLSS的成功證明了顯式不確定性建模在提升空間感知任務性能中的價值,為未來BEV感知系統的發展提供了新的研究方向。

本文來自互聯網用戶投稿,該文觀點僅代表作者本人,不代表本站立場。本站僅提供信息存儲空間服務,不擁有所有權,不承擔相關法律責任。
如若轉載,請注明出處:http://www.pswp.cn/news/919353.shtml
繁體地址,請注明出處:http://hk.pswp.cn/news/919353.shtml
英文地址,請注明出處:http://en.pswp.cn/news/919353.shtml

如若內容造成侵權/違法違規/事實不符,請聯系多彩編程網進行投訴反饋email:809451989@qq.com,一經查實,立即刪除!

相關文章

衛生許可證識別技術:通過OCR與NLP實現高效合規管理,提升審核準確性與效率

在食品安全、公共衛生管理日益重要的今天,衛生許可證成為企業合規經營的關鍵憑證。傳統人工審核方式效率低、易出錯,而衛生許可證識別技術應運而生,正逐步革新監管與合規流程。下面深入解析這項技術的核心要素。核心技術原理衛生許可證識別本…

【habitat學習一】Habitat-Lab 配置鍵文檔詳解(CONFIG_KEYS.md)

該文件是 Habitat-Lab(Facebook Research 開發的 Embodied AI 模擬框架)的核心配置文檔,詳細定義了 Habitat 配置系統(基于 OmegaConf)中所有可配置參數的層級結構、默認值、取值范圍及功能說明。以下內容嚴格按文件結…

AI-調查研究-55-機器人 百年進化史:從Unimate到人形智能體的技術躍遷

點一下關注吧!!!非常感謝!!持續更新!!! 🚀 AI篇持續更新中!(長期更新) AI煉丹日志-31- 千呼萬喚始出來 GPT-5 發布!“快的…

【python實用小腳本-190】Python一鍵刪除PDF任意頁:輸入頁碼秒出干凈文件——再也不用在線裁剪排隊

Python一鍵刪除PDF任意頁:輸入頁碼秒出干凈文件——再也不用在線裁剪排隊 PDF刪頁, 零依賴腳本, 命令行秒用, 小白神器, 瑞士軍刀 故事開場:一把瑞士軍刀救了你 周一早高峰,老板發來 200 頁 PDF: “把第 18、25、37 頁刪掉&#x…

RH134 運行容器知識點

1. 相比較虛擬機,容器有哪些技術優勢?答:輕量級:容器共享宿主操作系統的內核,比虛擬機更輕量級,啟動速度更快,資源占用更少。高效性:容器可以快速部署和擴展,適合于微服務…

亞矩陣云手機智能定位:助力Snapchat矩陣賬號的本地化內容運營穿透技術

——構建跨地理圍欄的智能社交營銷網絡**??一、技術架構&#xff1a;動態定位引擎與多維度穿透體系??動態定位引擎??多源信號融合定位?&#xff1a;集成GPS/基站/WiFi三角定位技術&#xff0c;通過亞矩陣云手機底層驅動注入真實坐標數據&#xff08;誤差<5米&#xf…

數據處理和統計分析 —— Pandas 基礎(附數據集)

目錄 一、概述 &#xff08;一&#xff09;series 1、組成 2、創建方式 3、Series常用屬性 &#xff08;二&#xff09;DataFrame 1、組成&#xff1a; 2、構建方式 &#xff08;三&#xff09;數據導入和導出 二、加載數據集 加載部分數據 loc / iloc 三、分組和聚合計算 需求…

github 如何在 readme 顯示Star History

在GitHub的README文件中顯示Star History&#xff08;星標歷史&#xff09;圖表&#xff0c;可以通過以下幾種方式實現&#xff1a; 使用Star History服務 你可以使用Star History服務來生成并嵌入星標歷史圖表 。具體步驟如下&#xff1a; 訪問 Star History 網站: https:/…

安全防范方案

一、基于地理位置的訪問控制&#xff08;核心方案&#xff09; 原理&#xff1a;通過內置GeoIP數據庫或第三方IP庫識別訪問源國家/地區&#xff0c;動態攔截非目標區域IP。 配置步驟&#xff1a; 啟用GeoIP模塊 登錄管理控制臺 → 安全策略 → 地理位置策略 → 加載MaxMind Ge…

Python爬蟲實戰:研究optimesh庫,構建Github網格數據采集系統

1. 引言 1.1 研究背景與意義 在計算機輔助設計(CAD)、有限元分析(FEA)、計算流體力學(CFD)等領域,網格作為離散化連續空間的基礎載體,其質量直接影響數值模擬的精度與效率。高質量的網格應具備單元形狀規則、分布均勻、邊界貼合度高等特征,而低質量網格可能導致計算…

利用Qwen大模型進行c++11并發庫的學習,與時俱進!!!!

文章目錄 1、學習新的東西可以借助ai和官方文檔 1.1 會問問題 異步編程教程 1. std::future 2. std::shared_future 3、std::promise 4、4. std::packaged_task 5. std::async 6. std::future_status 和等待函數 綜合代碼 總結 1、學習新的東西可以借助ai和官方文檔 因為別人寫…

曲面/線 擬合gnuplot

1. 下載gnuplot windows 版&#xff0c;安裝&#xff0c;&#xff08;別的綠色的可能下載即用&#xff0c;推薦下面鏈接這款&#xff09; gnuplot - Browse Files at SourceForge.net 2. 準備數據&#xff0c;存成data.dat或者其它文件名稱&#xff0c;放桌面 數據內容如下…

CentOS Linux 7 (Core)上部署Oracle 11g、19C RAC詳細圖文教程

一、部署參考鏈接&#xff1a; 墨天輪數據庫社區 - 樂知樂享&#xff0c;同心共濟 實戰篇&#xff1a;一步步教你 Linux 7 安裝 Oracle 11GR2 RAC 實戰篇&#xff1a;Linux7 安裝 Oracle 19C RAC 詳細圖文教程 Linux7 安裝 Oracle 19C RAC 詳細圖文教程

WebSocket DevTools 開發調試工具完全指南 – 實時監控、消息攔截、性能分析一站式解決方案

概述 WebSocket DevTools 是一款專為 WebSocket 連接調試而設計的瀏覽器開發者工具擴展。它提供了實時監控、消息攔截、連接管理等功能&#xff0c;幫助開發者快速定位和解決 WebSocket 相關問題。 主要特性 &#x1f50d; 實時監控&#xff1a;實時顯示 WebSocket 連接狀態…

常見的光源頻閃控制方式

一、光源頻閃的優勢消除運動模糊&#xff0c;提升成像質量 光源以極短脈沖&#xff08;微秒級&#xff09;與相機曝光嚴格同步&#xff0c;實現“瞬時凍結”高速運動物體。增強特征對比度&#xff0c;提高缺陷檢出率 頻閃模式下&#xff0c;LED可短時超負荷工作&#xff0c;峰值…

讀From GPT-2 to gpt-oss: Analyzing the Architectural Advances(續)

序 本篇由來&#xff0c;在COC上我當面感謝了組委會和姜寧老師&#xff0c;隨即被姜寧老師催稿&#xff0c;本來當天晚上寫了一個流水賬&#xff0c;感覺甚為不妥。于是決定慢慢寫&#xff0c;緩緩道來。要同時兼顧Show me the code&#xff0c;Show me the vide。希望能形成一…

6-7 TIM編碼器接口 [江科協STM32]

一、引入&#xff08;1&#xff09;編碼器接口的好處&#xff1a;節約軟件資源&#xff1a;外部中斷計次&#xff0c;程序頻繁進入中斷&#xff0c;則軟件資源會被簡單頻繁的工作給占用&#xff0c;效率不高使用定時器的編碼器接口&#xff0c;再配合編碼器&#xff0c;就可以測…

01數據結構-交換排序

01數據結構-交換排序1.冒泡排序1.1基礎冒泡排序1.1.1基礎冒泡排序代碼實現1.2冒泡排序的一次優化1.2.1冒泡排序的第一次優化代碼實現1.3冒泡排序的二次優化1.3.1 冒泡排序的二次優化代碼實現2.快速排序2.1雙邊循環法2.1.1雙邊循環法的代碼實現2.2單邊循環法2.2.1單邊循環法代碼…

MySQL架構和儲存引擎

MySQL服務器整體架構如下&#xff1a;連接層&#xff1a;連接層的作用是處理客戶端的連接&#xff0c;如何管理連接的。網絡端口和連接管理線程&#xff1a;網絡端口&#xff1a;一臺服務器可以連接網絡上多個端口的客戶連接&#xff0c;只需要開放多個端口&#xff0c;只需要在…

詳解flink java基礎(一)

文章目錄1.流式處理flink介紹2.Flink SQL介紹3. Flink Runtime4.使用flink集成kafka5.使用Flink SQL進行有狀態流處理6.Event time & Watermarks7. flink Checkpoints & recovery1.流式處理flink介紹 實時服務依賴流式處理: flink優點: 高性能豐富的特性&#xff1a…