基于NeRF/Gaussian的全新SLAM算法

什么是SLAM?

SLAM,即同時定位與地圖構建技術,SLAM可以讓機器人、無人機和其他自動化系統能夠在未知環境中同時進行自我定位和環境映射。

圖片

為什么是NeRF-Based SLAM?

圖片

傳統CG將輸入圖像重新投影再融合到新的視圖攝像機中,利用幾何結構來進行重投影。在很多情況下,傳統CG方法重建地圖都能有相當好的效果,但是對于地圖上的未知區域,進行三維重建恢復就有些困難了。

深度學習很早就在應用在重建方面。Volumetric 表達由Soft3D提出,隨后與Volumetric ray-marching 相結合的深度學習技術出現,這是一種基于連續可微密度場的Geometry(幾何)表示方法。

神經輻射場引入了Importance Sampling(重要性采樣)和Positional Encoding(位置編碼),使得三維重建的質量得到顯著提升;同時NeRF神經渲染算法大大減少了傳統三維重建中生成的偽影,在大多數情況下效果都比傳統算法好。目前重建圖像質量最好的是Mip-NeRF360。

此外,將SLAM技術融入到深度學習中,更容易使得所有算法能夠統一到一個框架中,方便不同算法之間的數據傳輸和通信,方便了上下游兄弟部門的協同合作。比如建好的地圖可以用于語義標注,從而接到BEV感知中訓練,又或者可以生成 Occupancy 網格,交給規控部門去做路徑的規劃和智能體的控制。

圖片

為什么是Gaussian-Based SLAM?

圖片

基于NeRF的SLAM算法采用全局地圖和圖像重建損失函數,通過可微分渲染捕獲稠密的光度信息,具有高保真度。但是用Implicit Neural Representation(隱式神經表達)對場景建模導致了許多問題:

  • query過程(可以理解為射線渲染)需要大量的采樣,渲染方法成本很高

  • 用了大型多層MLP,運算量大,占用內存高

  • 不容易編輯

  • 不能顯式地對空間幾何建模

  • 導致“遺忘”問題

SLAM技術通常部署在機器人身上,性能尤為關鍵。后續出現了一系列解決NeRF重建效果和性能的論文,基于3D高斯輻射場的SLAM有以下好處:

  • 快速渲染和豐富的優化:Gaussian Splatting可以以高達400 FPS的速度渲染,使其比隱式表達更快地可視化和優化。

  • 有明確空間范圍的建圖:現有地圖的空間邊界可以通過在之前觀察到的部分場景中添加高斯函數來控制。給定一個新的圖像幀,我們可以通過渲染剪影識別場景的哪些部分是新內容(在地圖的空間邊界之外)。這對于Tracking任務很重要,因為我們只想將已經建好圖的部分與新圖像幀進行比較。隱式表達就不行了,因為在對未知區域建圖優化的時候,全局的優化會影響到神經網絡。

  • 顯式地圖:我們可以通過添加更多的Gaussian函數來任意地增加地圖容量。而且這種顯式的表達讓我們可以編輯場景中的某些部分,同時仍然允許真實的渲染。隱式方法不能輕易地增加其容量或編輯其所表示的場景。

課程大綱

圖片

圖片

課程亮點

  • 本門課程從理論和代碼實現兩方面展開,帶你從零入門NeRF/Gaussian Based SLAM的原理學習、論文閱讀、代碼梳理等

  • 理論層面,從線性代數入手到傳統的計算機圖形學,讓大家明了現代三維重建的理論基礎和源頭

  • 代碼層面通過多個練習手把手教會大家復現計算機圖形學、NeRF相關工作

學后收獲

  • 入門基于NeRF/Gaussian的SLAM領域

  • 學會如何在快速抓取一篇論文的關鍵點和創新點

  • 如何快速跑通一篇論文的代碼并結合代碼掌握論文的思想

  • 逐行NeRF代碼進行解析,掌握每個實現細節,并手動復現并作改進

課程設置

  • 系統要求:Linux

  • 編程語言:Python

  • 基礎要求:有Python、PyTorch基礎

適合人群

  • 對一篇新論文配套開源代碼無從下手的小白

  • SLAM定位建圖、NeRF三維重建小白

  • 從事三維重建工作的人員可參考

  • NeRF論文的初始閱讀者

  • 對SLAM、NeRF感興趣的學員

開課時間

2024年2月24日晚上8點(周六),每周更新一章節。

課程答疑

本課程答疑主要在本課程對應的鵝圈子中答疑,學員學習過程中,有任何問題,可以隨時在鵝圈子中提問。

圖片

▲長按購買課程,前50名,享早鳥價,立減70元

圖片

▲長按添加小助理微信:cv3d007,咨詢更多

備注:以上圖片和視頻部分來自網絡,如果侵犯了您的權益,還請聯系刪除!

本文來自互聯網用戶投稿,該文觀點僅代表作者本人,不代表本站立場。本站僅提供信息存儲空間服務,不擁有所有權,不承擔相關法律責任。
如若轉載,請注明出處:http://www.pswp.cn/news/711593.shtml
繁體地址,請注明出處:http://hk.pswp.cn/news/711593.shtml
英文地址,請注明出處:http://en.pswp.cn/news/711593.shtml

如若內容造成侵權/違法違規/事實不符,請聯系多彩編程網進行投訴反饋email:809451989@qq.com,一經查實,立即刪除!

相關文章

InfiniBand 200Gbps QSFP56 高速線纜/光纜和光模塊解決方案

隨著數據中心和人工智能迅速發展,對高速、低延遲和低功耗的數據傳輸需求變得至關重要。飛速(FS)提供針對各種高性能計算場景量身定制的各種InfiniBand線纜和光模塊產品。本文旨在概述飛速(FS)200G InfiniBand HDR 光纜…

深圳地鐵12號線綠色出行新時代,格力中央空調助力節能飛躍

深圳地鐵12號線,作為城市交通的重要組成部分,其運行貫穿著前海、南山、寶安、西鄉等多個區域,承載著數以萬計的乘客,是深圳市民出行的重要選擇。在這條城市動脈上,一項革命性的變革正在悄然發生——綠色出行的新時代正…

MSCKF2講:JPL四元數與Hamilton四元數

MSCKF2講:JPL四元數與Hamilton四元數 文章目錄 MSCKF2講:JPL四元數與Hamilton四元數2 JPL四元數2.1 定義與區別2.2 JPL四元數的乘法2.3 反對稱矩陣2.4 Ω ( ω ) \Omega(\omega) Ω(ω)矩陣2.5 JPL四元數與旋轉矩陣的轉換2.6 JPL四元數導數2.7 JPL四元數…

SpringCloud搭建微服務之Consul服務注冊與發現

1. Consul介紹 Consul是由HashiCorp公司使用Go語言開發的一款開源工具,主要用于實現分布式系統的服務發現和服務配置,其內置了服務注冊與發現框架、分布式一致性協議實現、健康檢查、Key-Value存儲、多數據中心方案。Consul具有高可移植性,支…

Java多線程系列——Executor

目錄 Executor框架概覽 核心組件 1. 任務(Task) 2. 線程池(ThreadPool) 3. 任務調度 4. 任務執行與結果檢索 使用案例 實際應用場景 總結 Java的多線程編程是Java語言提供的核心特性之一,允許開發者有效地管理…

【數倉】Hadoop軟件安裝及使用(集群配置)

一、環境準備 1、準備3臺虛擬機 Hadoop131:192.168.56.131Hadoop132:192.168.56.132Hadoop133:192.168.56.133 本例系統版本 CentOS-7.8,已安裝jdk1.8 2、hosts配置,關閉防火墻 vi /etc/hosts添加如下內容&#x…

ip獲取+歸屬地實現

1.背景 現在的社交平臺一般都需要展示用戶的歸屬地,這個功能有下面二個主要功能點,接下來我們來介紹下具體實現。 IP 獲取 IP 轉歸屬地 2.ip獲取 2.1 Http請求 對于controller的請求,我們只需要寫個攔截器,將用戶的ip設置進上下文即可,非常方便。 @Override public bo…

生成式AI設計模式:綜合指南

原文地址:Generative AI Design Patterns: A Comprehensive Guide 使用大型語言模型 (LLM) 的參考架構模式和心理模型 2024 年 2 月 14 日 對人工智能模式的需求 我們在構建新事物時,都會依賴一些經過驗證的方法、途徑和模式。對于軟件工程師來說&am…

物聯網與智慧城市的融合:構建智能化、便捷化、綠色化的城市未來

一、引言 隨著科技的飛速發展和城市化的不斷推進,物聯網技術正逐步滲透到城市的各個領域,成為推動智慧城市建設的核心力量。物聯網與智慧城市的融合,不僅為城市治理提供了高效、智能的解決方案,也為市民的生活帶來了前所未有的便…

如何在Node.js中使用定時器

在Node.js中使用定時器是一項常見且重要的任務,特別是在需要執行定時任務或者輪詢操作的情況下。Node.js提供了多種方式來實現定時器功能,包括setTimeout、setInterval和setImmediate等方法。本篇博客將介紹如何在Node.js中使用這些定時器,并…

(數據結構)二叉樹

8.二叉樹 8.1概述 二叉樹是一種基本的非線性數據結構,它是由n(n>0)個節點構成的有限集合。在二叉樹中,每個節點最多有兩個子節點,通常被稱作左孩子(left child)和右孩子(right c…

把python完全卸載干凈

1.winR,輸入control回車,點擊程序和功能,在搜索框輸入python,右鍵點擊卸載 2、找到Python安裝路徑,把所有文件全部刪除。 安裝路徑可以打開CMD輸入:where python 3、強制刪除Python.exe 打開cmd&#xff…

科技企業如何做到FTP數據安全保護

在數字化浪潮的推動下,科技企業的數據已成為推動創新、提升效率、增強競爭力的核心資源。數據的重要性不言而喻,它不僅包含了客戶信息、市場分析、產品設計等關鍵信息,更是企業寶貴的資產。然而,隨著數據量的激增,數據…

視覺AIGC識別——人臉偽造檢測、誤差特征 + 不可見水印

視覺AIGC識別——人臉偽造檢測、誤差特征 不可見水印 前言視覺AIGC識別【誤差特征】DIRE for Diffusion-Generated Image Detection方法擴散模型的角色DIRE作為檢測指標 實驗結果泛化能力和抗擾動 人臉偽造監測(Face Forgery Detection)人臉偽造圖生成 …

LabVIEW最佳傳輸系統設計

LabVIEW最佳傳輸系統設計 介紹了基于LabVIEW軟件開發的最佳基帶傳輸系統和最佳帶通傳輸系統的設計。通過軟件仿真實現了脈沖成形濾波器和匹配濾波器的設計,證明了系統在消除碼間干擾和抗噪聲方面的優異性能。此設計不僅激發了學生的學習興趣,還有助于提…

智能家居控制系統(51單片機)

smart_home_control_system 51單片機課設,智能家居控制系統 使用及轉載請標明出處(最好點個贊及star哈哈) Github地址,帶有PPT及流程圖 Gitee碼云地址,帶有PPT及流程圖 ? 以STC89C52為主控芯片,以矩陣鍵…

Java必須掌握的繼承的概述

Java的繼承是面向對象編程中的一個核心概念,它允許一個類繼承另一個類的屬性和方法。這不僅有助于代碼的重用,還使得代碼的管理和維護變得更加容易。在準備大廠面試時,理解繼承的各個方面是非常重要的。以下是一些關于Java繼承的概述和可能出…

Linux基本指令(上)

在Linux中,將文件夾稱為目錄,后面的內容都與目錄相關。 1. ls指令 語法: ls [選項][目錄或文件] 功能:對于目錄,該命令列出該目錄下的所有子目錄與文件。對于文件,將列出文件名以及其他信息。 常用選項 …

MySQL的索引和B+tree結構

目錄 0.關于索引的常見面試題 1.什么是索引? 索引的優缺點 2.索引的數據結構,為什么InnoDb引擎使用Btree作為索引的數據結構? 分析怎樣的索引才是好的 二插搜索樹 紅黑樹 B-Tree BTree 哈希 為什么 InnoDB 存儲引擎選擇使用 Btree 索…

iTOP-3588開發板快速測試手冊Android12系統功能測試

RK3588是一款低功耗、高性能的處理器,適用于基于arm的PC和Edge計算設備、個人移動互聯網設備等數字多媒體應用,RK3588支持8K視頻編解碼,內置GPU可以完全兼容OpenGLES 1.1、2.0和3.2。RK3588引入了新一代完全基于硬件的最大4800萬像素ISP&…