NGM-SLAM:首創融合神經輻射場子圖的3DGS-SLAM,問鼎SOTA!

論文標題:

NGM-SLAM: Gaussian Splatting SLAM with Radiance Field Submap

論文作者:

Mingrui Li, Jingwei Huang, Lei Sun Aaron, Xuxiang Tian, Tianchen Deng, Hongyu Wang

導讀:

3DGS技術因其性能卓越而備受關注,3DGS-SLAM系統應運而生。然而,當前3DGS-SLAM系統通常在大場景表示、有效的閉環校正和場景泛化能力方面存在缺陷。為此,論文作者設計了NGM-SLAM,這是第一個利用神經輻射場子圖用于漸進式場景表示的GS-SLAM系統,有效地結合了神經輻射場和3DGS的優勢,實現了最先進的場景重建和跟蹤性能。??【深藍AI】編譯

1. 背景簡介

長期以來,SLAM技術一直是機器人學與AR/VR領域的核心議題。密集SLAM系統因廣泛的應用潛力而備受重視。傳統密集SLAM系統利用體素、點云和TSDF等顯式表示,在追蹤方面表現出色,但受限于高保真建模、空缺填補及紋理細節的處理,其應用范圍受到一定局限。神經隱式SLAM系統,基于NERF的隱式表示,顯著增強了SLAM系統的感知能力,但依舊面臨實時性、運行速度和內存需求的瓶頸。

近期,3DGS-SLAM系統在保持NERF-SLAM系統的建圖精度同時,在渲染速度和精度上取得了突破,挑戰了神經隱式 SLAM 在密集重建中的主導地位。然而,值得注意的是,與NERF相比,3DGS-SLAM系統依賴點云輸入,在空缺填補能力上有所欠缺,且未充分利用神經網絡的泛化能力。此外,它缺乏穩健的閉環檢測機制,導致在大場景中累積漂移問題凸顯,影響了地圖的穩定性和準確性。

2. 方案提出

針對上述挑戰,作者創新性地設計了融合神經子圖與3DGS表示的SLAM體系。

首先,構建以神經輻射場為基礎的子圖與一個全局關鍵幀索引。當達到地圖構建閾值時,基于前序子圖作為先驗,將會創建新的神經子圖,并實施高斯渲染。隨后,執行局部捆綁調整(BA),并在子圖間實施融合策略及高斯體修剪。閉環一旦被識別,即刻啟用實時由粗到細的閉環校正,通過調整對應錨框的地圖姿態,并運用全局BA及高斯渲染損失函數,以最小的計算成本有效修正累積漂移。

實驗結果表明,本方法在跟蹤和建圖方面實現了SOTA性能,并且可擴展到大規模場景。

在這里插入圖片描述
▲圖1|NGM-SLAM系統架構??【深藍AI】編譯

3. 細節解析

圖1展示了NGM-SLAM的系統架構。該系統包括跟蹤和建圖兩個模塊。在初始子圖開始建立后,跟蹤模塊持續估計相機姿態并檢測環路,同時將子圖的關鍵幀傳遞給建圖模塊。建圖模塊首先構造神經子圖,該神經子圖也用作多尺度GS(高斯拋雪球)子圖的先驗,并在子圖之間執行并行渲染。在子圖內執行局部束縛調整(BA)以校正姿態和建圖誤差,一旦檢測到閉環,就對所有錨框執行全局BA。最后,生成的GS地圖被縫合在一起。

■3.1 先驗神經子圖渲染

考慮到3DGS-SLAM系統在泛化推理能力上的不足,本文引入了基于數據驅動的增量神經子圖作為基礎監督機制,來填補空白并增強地圖表示。基于ORB特征點追蹤,僅在當前幀提取特征,減少了與子圖創建和空缺填充相關的漂移問題。通過設立局部與全局關鍵幀列表,優化了局部與全局BA流程,并在子圖積累至預設關鍵幀閾值時新建局部子圖。為優化地圖融合并減少融合誤差,借助DBOW模型評估關鍵幀間的共視關系,確保地圖結構的穩定性。

■3.2 多尺度高斯子圖渲染

利用神經子圖提供的先驗信息,采用一組各向異性3DGS分布來描繪場景,利用位置、不透明度、三階球諧系數、3D尺度及四元數描述的3D旋轉來豐富場景細節。通過多尺度渲染技術,解決了小高斯體渲染中的鋸齒問題,通過不同分辨率下的高斯體聚合,提高了渲染質量,同時在保證渲染速度的前提下,通過射線引導的高斯體修剪策略進一步提升了精度與效率。

■3.3 高效子圖融合策略

為適應大規模場景并有效管理內存資源,本文提出了一套高效的子圖融合機制。場景被劃分為多個局部子圖,每個子圖依據關鍵幀的空間位置進行定位。在每次局部BA后,地圖的中心姿態得到更新,以確保子圖間的良好對齊。為了避免子圖邊界處出現視覺上的重疊或縫隙,從每個子圖的邊緣剔除了多余的高斯體,從而減輕了拼接時可能出現的偽影現象。接下來,采用高斯聚合技術,將相鄰子圖邊界的較小高斯體合并為更大的單元,以實現無縫過渡。這一系列操作確保了子圖間的平滑拼接,即使在多次閉環校正和全局BA之后,也能維持地圖的一致性和完整性,同時控制了內存占用的增長。

■3.4 閉環檢測與全局優化

閉環檢測是確保地圖整體一致性的關鍵步驟。采用局部與全局相結合的策略,首先在每個子圖內部進行局部BA,專注于局部關鍵幀的校正。對于全局一致性,利用詞袋模型(BoW)來檢測全局關鍵幀之間的關聯性,一旦發現閉環條件滿足,即啟動一個由粗到精的全局調整流程。這一過程首先通過BA優化錨定子圖的姿態,接著執行子圖融合,以消除邊界漂移。在此之后,保持錨定子圖姿態固定,基于全局關鍵幀列表執行全局BA,進一步細化姿態調整,并再次進行子圖融合,以最終完成閉環校正。通過在整個過程中整合射線采樣,能夠指導高斯體的生成與融合,進而利用高斯渲染損失進一步細化地圖,確保了全局地圖的一致性和準確性,同時保持了系統的實時性。

4. 實驗

實驗結果表明,與現有基于3DGS的SLAM方法相比,本方法在多個維度上實現了顯著提升,不僅提高了跟蹤和建圖的精度,還優化了系統運行效率,特別是在處理大規模多房間序列時展現了其優越性能。

在這里插入圖片描述
▲圖2|展示了在Replica數據集房間序列上,單目與RGB-D重建技術的對比結果??【深藍AI】編譯

在這里插入圖片描述
▲圖3|展示了在Replica數據集四個大型公寓序列上的重建結果,證明了本方法有效避免了災難性遺忘,并且能夠實現背景的合理填充及場景的廣泛適應性??【深藍AI】編譯

在這里插入圖片描述
▲圖4|在ScanNet數據集的大規模多房間序列上,本方法展現了其在累積誤差校正方面,相較于傳統基于高斯拋雪球的方法有著更優的表現??【深藍AI】編譯

在這里插入圖片描述
▲表1|在Replica數據集的8個小房間序列上,本方法在平均PSNR(dB)、SSIM、LPIPS、ATE(cm)、跟蹤FPS、系統FPS和GPU使用情況等方面的表現??【深藍AI】編譯

在這里插入圖片描述
▲表2|在Replica數據集的5個大規模場景序列上,本方法在ATE RMSE(cm)性能方面的表現??【深藍AI】編譯

在這里插入圖片描述
▲表3|在ScanNet數據集的6個大規模場景序列上,本方法在ATE RMSE(cm)性能方面的表現??【深藍AI】編譯

在這里插入圖片描述
▲表4|在TUM RGB-D數據集上,本方法在ATE RMSE(cm)性能方面的表現??【深藍AI】編譯

在這里插入圖片描述
▲表5|在EuRoC數據集上,使用立體視覺相機輸入時,本方法在ATE RMSE(cm)性能方面的表現??【深藍AI】編譯

5. 總結

總的來說,作者提出的NGM-SLAM系統成功地將神經輻射場的表達力與3DGS的高效渲染能力相結合,通過創新性的子圖管理和閉環檢測策略,克服了大場景建圖和實時性要求的挑戰,并以其穩健的跟蹤性能和監督精度,展現出廣泛的應用前景,這無疑將開啟一股融合NeRF與3DGS技術的SLAM系統研究新浪潮。

編譯|Deep藍同學

審核|Los

移步公眾號【深藍AI】,第一時間獲取自動駕駛、人工智能與機器人行業最新最前沿論文和科技動態。

本文來自互聯網用戶投稿,該文觀點僅代表作者本人,不代表本站立場。本站僅提供信息存儲空間服務,不擁有所有權,不承擔相關法律責任。
如若轉載,請注明出處:http://www.pswp.cn/diannao/12833.shtml
繁體地址,請注明出處:http://hk.pswp.cn/diannao/12833.shtml
英文地址,請注明出處:http://en.pswp.cn/diannao/12833.shtml

如若內容造成侵權/違法違規/事實不符,請聯系多彩編程網進行投訴反饋email:809451989@qq.com,一經查實,立即刪除!

相關文章

uniapp微信小程序通過螢石云接入海康攝像機

需求:在uniapp微信小程序上查看海康威視的攝像機監控視頻和和操作攝像機拍攝方向 在螢石云接入海康攝像機設備,由于不同品牌設備在不同時間段接入方式可能不一致,具體接入方式查看官方文檔或咨詢官方客服。 海康攝像機官方客服熱線&#xf…

stack、queue、priority_queue以及仿函數

我們上次對std中的list進行實現,今天我們要實現stack、queue、priority_queue以及仿函數。 目錄 stack堆堆的框架構造函數push插入pop刪除size()大小empty()判斷空top()取棧頂的元素 queue隊列隊列框架問題: 這里我們為什么用deque? 插入刪除取頭數據取…

AI交互數字人賦能農業數字化、智能化推廣營銷

2024陵水荔枝文化節上“數字新農人”陵小荔身著黎族服飾、佩戴銀器亮相開幕式現場,AI交互數字人生動地以互動式推介和歌舞等形式,帶領賓客們了解陵水荔枝的發展歷程、產業布局、未來愿景等。如今,越來越多農產品品牌通過3D虛擬數字人定制&…

Redis和數據庫能做到強一致嗎?

在現代軟件系統中,數據一致性是至關重要的,特別是對于需要處理大量并發請求和實時數據的系統。Redis 和數據庫都是常見的數據存儲解決方案,但它們在保證數據一致性方面有著不同的特點和限制。 本文將深入探討 Redis 和數據庫是否能夠做到強一…

最詳細的提單知識總結 | 數字貿易綜合服務平臺 | 箱訊科技

在外貿交易中,國際物流是必不可少的一個步驟。國際物流掌控好,就等于把貨物牢牢握在手心,不怕貨財兩空。 本期將向大家介紹正本提單、電放提單、海運單三種國際海運放貨方式以及區分它們的方法。 超實用!外貿人趕緊收藏~ 正本提…

CTF例題:[SWPU2019]Web1(無列名注入)

網址:BUUCTF在線評測 搜索web1 啟動靶機 點擊鏈接進入題目 進入題目后發現有登錄和注冊接口,直接注冊登錄。 首先通過1進行測試,查看是否有注入點 出現報錯,說明可能存在注入點 然后繼續測試發現該服務器過濾了: or、…

vue(九) 生命周期 v3.0和v2.0對比,父子組件生命周期的執行順序

文章目錄 生命周期vue2.0生命周期1.圖示2.生命周期解釋說明3.代碼示例 vue3.0生命周期1.圖示2.生命周期解釋說明3.代碼示例 父子組件中生命周期執行順序v.3和v2.0生命周期對比 生命周期 每個 Vue 組件實例在創建時都需要經歷一系列的初始化步驟,比如設置好數據偵聽…

Android 獲取已安裝應用、包名、應用名、版本號、版本名

1、相關代碼 List<ApplicationInfo> installedApps getPackageManager().getInstalledApplications(0);for (ApplicationInfo appInfo : installedApps) {CharSequence getAppName getPackageManager().getApplicationLabel(appInfo);String appNamegetAppName.toStrin…

怎么做私域?先來了解私域運營模式!

現在&#xff0c;很多企業都在做私域&#xff0c;但仍舊有很多人會問&#xff1a;我的私域到底要怎么做&#xff1f; 關于這個問題&#xff0c;不同產品無論在消費頻次與客單價上&#xff0c;還是在決策鏈路的長度和復雜度上&#xff0c;都有巨大的差異&#xff0c;消費者需要…

前端 JS 經典:雙等號運算符的運算和轉換規則

1. 運算規則 兩端存在 NaN&#xff0c;返回 false NaN NaN; // false NaN 1; //false undefined 和 null 只有與自身比較&#xff0c;或者相互比較時&#xff0c;才返回 true&#xff0c;和其他原始類型比較都返回 false。 undefined null; // true undefined undefine…

flutter組件封裝技巧

這段代碼是一個用于創建一個&#xff08;GradeTag&#xff09;組件的類。這個組件可以根據輸入的年級和顏色創建一個具有不同顏色和百分比顯示的標簽。 實現原理&#xff1a; 使用GradeTag.origin構造函數來創建一個包含默認顏色和百分比的字符串。這個構造函數使用了assert來…

如何使用AspectJ做切面,打印jar包中方法的執行日記

最近在工作中遇到一個redis緩存中的hash key莫名其妙被刪除的問題&#xff0c;我們用了J2Cache&#xff0c;二級緩存用的是redis。hash key莫名其妙被刪除又沒有日志&#xff0c;就想到做一個切面在調用redis刪除hash key的方法的時候&#xff0c;打印日志&#xff0c;并且把調…

高德、百度開車導航APP是怎么知道紅綠燈倒計時的?

高德、百度開車導航APP之所以能夠知道紅綠燈的倒計時&#xff0c;這背后是一系列復雜的科技手段和數據分析的綜合運用。從交管部門提供的數據&#xff0c;到導航軟件自身通過大數據和算法進行的計算&#xff0c;每一個環節都為紅綠燈倒計時的準確呈現提供了支撐。 首先&#xf…

白酒:低酒精度白酒的消費特點與市場前景

低酒精度白酒的消費特點與市場前景是酒類市場的一個重要話題。隨著品質意識的提高和消費者口味的多樣化&#xff0c;低酒精度白酒逐漸受到越來越多的關注。云倉酒莊豪邁白酒作為白酒的品牌之一&#xff0c;其消費特點和市場前景值得深入探討。 首先&#xff0c;從消費特點來看…

基于YOLOv5的道路裂縫檢測,加入一種基于內容引導注意力(CGA)的混合融合提升2個多點

&#x1f4a1;&#x1f4a1;&#x1f4a1;本文主要內容:詳細介紹道路裂縫檢測整個過程&#xff0c;從數據集到訓練模型到結果可視化分析。 &#x1f4a1;&#x1f4a1;&#x1f4a1;通過加入一種基于內容引導注意力(CGA)的混合融合提升檢測性能&#xff0c; 特征融合創新 | 一…

WS2812C是一款將控制電路和RGB芯片集成在一個5050元器件封裝中的智能控制LED光源

一般說明 WS2812C是一款將控制電路和RGB芯片集成在一個5050元器件封裝中的智能控制LED光源。內部包括智能數字端口數據鎖存器和信號整形放大驅動電路。還包括一個精密的內部振蕩器和一個 12V電壓可編程恒流控制部分&#xff0c;有效保證像素點光源顏色高度一致。 …

決策規劃仿真平臺的搭建

以下內容筆記據來自于b站up主忠厚老實的老王&#xff0c;視頻&#xff1b;鏈接如下&#xff1a; 自動駕駛決策規劃算法第二章第一節 決策規劃仿真平臺搭建_嗶哩嗶哩_bilibili 使用到的軟件有matlab、prescan、carsim以及visual stadio。 我電腦上軟件的版本是matlab2022a&am…

2024.1IDEA 到2026年

鏈接&#xff1a;https://pan.baidu.com/s/1hjJEV5A5k1Z9JbPyBXywSw?pwd9g4i 提取碼&#xff1a;9g4i解壓之后,按照 操作說明.txt 操作; IntelliJ IDEA 2024.1 (Ultimate Edition) Build #IU-241.14494.240, built on March 28, 2024 Licensed to gurgles tumbles You have…

Python代碼:二、多行輸出

1、題目 將字符串 Hello World! 存儲到變量str1中&#xff0c;再將字符串 Hello Nowcoder! 存儲到變量str2中&#xff0c;再使用print語句將其打印出來&#xff08;一行一個變量&#xff09;。 2、代碼 import sys str1 Hello World! str2 Hello Nowcoder! print (str1,st…

詳細分清Session,Cookie和Token之間的區別,以及JWT是什么東西

Cookie Cookie是一種小型的文本文件&#xff0c;由網站在用戶訪問時存儲在其計算機或移動設備上&#xff0c;Cookie主要用于跟蹤、識別和存儲有關用戶的信息。 簡單來說Cookie就是用來存儲某些后端發送給前端的數據&#xff0c;例如我們登陸后&#xff0c;后端會返回一個登錄…