NeRF、3DGS、2DGS下三維重建相關方法介紹及以及在實景三維領域的最新實踐

一、引言

在計算機視覺與圖形學領域,三維重建技術正經歷從傳統幾何建模向智能化神經表征的范式轉變。近年來,隨著深度學習算法的迭代、傳感器技術的進步及計算硬件的升級,以神經輻射場(NeRF)和高斯潑濺(2DGS、3DGS)為代表的新型三維重建技術,正顛覆傳統方法對幾何結構的表征邏輯。上述技術不僅在理論上突破了顯式幾何建模的局限,更在實景三維建模、自動駕駛環境感知、元宇宙場景構建等前沿領域展現出不可替代的應用價值。

傳統三維重建依賴多視角立體視覺(MVS)與運動恢復結構(SfM)算法,通過點云配準、網格生成等步驟構建場景,但在復雜紋理場景細節捕捉、動態物體建模及大規模場景計算效率上存在顯著瓶頸。而 NeRF 技術通過神經網絡隱式表征三維場景,以光線追蹤與神經渲染實現照片級真實感圖像合成;2DGS 與 3DGS等高斯潑濺技術則借助高斯分布的可學習特性,通過高效 splatting 渲染技術,在保證模型精度的同時實現實時性優化 —— 這些創新為智慧城市、文化遺產保護、工業檢測等領域的三維建模提供了全新技術路徑。
當前,NeRF 與高斯潑濺技術已從實驗室走向產業化應用。本文將系統解析精細三維重建的核心方法演進邏輯,從技術原理、場景表征、建模流程到行業實踐,構建從理論到落地的完整知識體系。

二、三維場景的表征方式

(一)顯示幾何表示?

直接描述場景的幾何結構,適合精確建模和可視化。

(1)多邊形網格(PolygonMesh)??
結構特性:由頂點、邊和面組成的拓撲結構,任意多邊形可轉化為三角網格,包含精確的幾何坐標與面連接關系。
典型應用:游戲引擎(Unity/Unreal)、CAD 建模、影視動畫。
核心優勢:
渲染效率高,支持實時渲染與交互操作;
拓撲信息完整,便于模型編輯與布爾運算;
數據格式標準化(如 OBJ、FBX),跨平臺兼容性強。
技術局限:
復雜曲面建模需高密度細分,導致數據量激增;
非結構化網格獲取依賴專業建模軟件或復雜重建流程。
在這里插入圖片描述

(2)體素柵格(VoxelGrid)??
結構特性:將三維空間劃分為規則排列的立方體單元(體素),可采用八叉樹結構實現可變分辨率。
典型應用:3D 打印、機器人路徑規劃、粗略碰撞檢測。
核心優勢:
結構規整,天然適配深度學習 3D 卷積運算;
遮擋處理簡單,可直接用于空間占據狀態表示。
技術局限:
固定分辨率下細節表征能力有限,高分辨率模型內存消耗巨大;
缺乏拓撲信息,難以表示薄殼結構(如紙張、玻璃)。
在這里插入圖片描述

(3)點云(PointCloud)??
結構特性:由海量三維點組成的非結構化數據,每個點包含 X/Y/Z 坐標,可附加 RGB、法向量、反射強度等屬性。
典型應用:激光雷達環境掃描、文物數字化、工業質檢。
核心優勢:
直接來源于傳感器(如 LiDAR),數據獲取效率高;
靈活表征復雜曲面,無需拓撲連接關系。
技術局限:
非結構化數據處理難度大,需配準、降噪等預處理;
缺乏表面連續性信息,難以直接用于渲染。
在這里插入圖片描述

(二)隱式幾何表征[深度圖 (Depth Map)]

結構特性:二維圖像中每個像素記錄場景點到相機的距離,形成單視角深度信息。
典型應用:AR 交互(如手機攝像頭深度感知)、單目三維重建初始化。
核心優勢:
數據結構簡單,存儲成本低;
可通過 ToF 傳感器或立體匹配直接獲取;
適配 2D 卷積神經網絡處理。
技術局限:
僅表征單幀深度,與視角強綁定;
缺乏三維空間整體結構信息,難以重建復雜拓撲。

在這里插入圖片描述
小結:多邊形網格(PolygonMesh)、體素柵格(VoxelGrid)是建立在傳統三維重建方法(SfM、MVS)基礎上,主要依賴多視圖幾何,幾何精度較高,但難以捕捉光照與反射特性,且在紋理缺失或遮擋處易出現空洞、偽影。

(三)隱式神經表征

表征邏輯:通過神經網絡或連續函數擬合三維場景,通過神經輻射場(NeRF)或SDF(Signed Distance Function)、3dgs、2dgs隱式建模場景。無需顯式存儲幾何結構。
核心優勢:
理論上支持無限分辨率場景表征;
可通過神經渲染生成照片級新視角圖像;
天然適配復雜光照環境(如鏡面反射、軟陰影)。
技術挑戰:
訓練需海量多視角圖像,計算資源消耗大;
泛化能力有限,難以遷移到未訓練場景;
Nerf渲染速度受限于神經網絡推理效率。

三、nerf、3dgs、2dgs等新方法技術原理

(一)基于nerf的三維重建

NeRF(神經輻射場,NeuralRadianceField)是一種隱式神經表征技術,通過神經網絡將三維場景表示為連續的輻射場函數。
輸入與輸出:以空間點坐標(x,y,z)(x,y,z)(x,y,z)和視角方向(θ,φ)(θ,φ)(θ,φ)作為輸入,通過神經網絡映射為該點的顏色(RGB)(RGB)(RGB)和密度(σ)(σ)(σ),即函數關系為(x,y,z,θ,φ)→(RGB,σ)(x,y,z,θ,φ)→(RGB,σ)(x,y,z,θ,φ)(RGB,σ)
在這里插入圖片描述

場景表征邏輯: 區別于顯式幾何(如網格、點云),NeRF通過神經網絡隱式擬合整個場景的輻射場。它不直接存儲或操作三維幾何結構,而是通過模擬光線在場景中的傳播與積分過程來合成新視角圖像。

(二)基于高斯潑濺的三維重建

1.3DGS基本原理

3DGS(三維高斯Splatting)是一種顯式幾何表征技術,核心是使用可優化的三維高斯橢球集合直接表征場景。
三維高斯橢球表征:場景由大量分布在3D空間中的高斯橢球組成。每個高斯單元參數包括:三維位置(x,y,z)(x,y,z)(x,y,z)333x333協方差矩陣(在縮放和旋轉空間定義,控制橢球的形狀、大小和方向)、不透明度(ααα)、以及視角相關的顏色(通常用球諧函數系數SHcoefficientsSHcoefficientsSHcoefficients 表示)。每個橢球代表一小塊具有特定外觀(顏色、透明度)和幾何特性(位置、形狀、朝向)的場景區域。
在這里插入圖片描述

2.2DGS基本原理

3DGS 在捕捉復雜幾何形狀(尤其是薄壁表面)時存在局限性,其根本原因在于其基于體積化三維高斯橢球的基礎表征方式與物體表面的薄片性質存在內在沖突。已有研究表明,表面元素 (surfels)是一種能有效表征復雜物體表面的方法,并在 SLAM 領域得到成功應用。3DGS 使用橢球體作為基本單元,本質上是具有體積的模型。其渲染過程依賴于計算光線與高斯橢球相交處的“高斯值”貢獻。然而,當光線從不同角度入射時,該交點對應的深度值會發生變化,導致渲染出的深度信息不一致且不夠準確??。
針對上述問題,2DGS 的作者提出并實現了以下核心改進:使用帶有朝向信息的 2D 橢圓盤(即 surfels)取代橢球體,作為場景的基本表征單元。
在這里插入圖片描述

一句話總結:我們可以把多邊形網格(PolygonMesh)、體素柵格(VoxelGrid)等是“真是存在的”,而NeRF、高斯潑濺是通過電視屏幕去“看”,我們看到的是渲染出來的圖像

四、基于NeRF、高斯潑濺的實景三維建模技術路線

(一)開源實現

技術路線:視頻輸入→FFmpeg切幀→COLMAP稀疏重建→分項目技術分支(NeRF、3DGS、2DGS)→模型訓練→結果渲染。

1.FFmpeg項目

作用:視頻預處理的核心工具。?
詳細步驟/說明:?
輸入:原始視頻文件(如.mp4,.mov,.avi等)。?
抽幀:將視頻按設定的時間間隔(如每秒N幀)或關鍵幀提取成連續的靜態圖像序列(如.jpg,.png)。?
分辨率調整:降低圖像分辨率可以顯著加速后續COLMAP處理和模型訓練,。?
輸出:一個文件夾,包含按順序編號的、預處理后的圖像文件序列。這是整個重建流程的原始數據基礎。

2.COLMAP項目

作用:實現場景的稀疏三維重建,為后續的密集重建與模型訓練提供基礎數據,是整個建模流程中從二維圖像到三維信息轉化的關鍵一步。?
詳細步驟/說明:?
輸入:FFmpeg預處理后的圖像序列文件夾。?
特征提取與匹配:COLMAP首先對輸入圖像進行特征點檢測(如SIFT、SURF等),并在不同圖像間匹配同名特征點,構建圖像之間的對應關系。
運動恢復結構(SfM):基于匹配的特征點,COLMAP利用多視圖幾何原理,計算每張圖像的相機位姿(位置和姿態),并恢復場景的稀疏三維點云結構。此過程通過優化算法求解相機參數和三維點坐標,使得重投影誤差最小化。?
輸出:包含稀疏點云、相機參數(內參和外參)等信息的模型文件。其中,稀疏點云描繪了場景中部分關鍵位置的三維坐標,相機參數則記錄了每張圖像拍攝時的具體位置和姿態,這些數據為后續的NeRF、3DGS、2DGS模型訓練提供了重要的空間參考信息。

3.書生·天際 (NeRF, 大規模城市場景優化)

針對大規模城市級場景的nerf建模,書生·天際采用了基于網格表征的雙支結構模型。這個模型包含一個網格端和一個nerf端。網格端將場景分解成地面特征平面和垂直特征軸,而nerf端采用輕量mlp網絡重建訓練視角。為減少渲染計算量,書生·天際可有效地跳過空白空間,降低#九成以上采樣量,同時采用提前終止渲染的方式提高計算效率。
在這里插入圖片描述
項目鏈接:https://github.com/InternLandMark/LandMark

4.BlockGaussian (3DGS, 大規模分塊優化)

BlockGaussian:EfficientLarge-ScaleSceneNovelViewSynthesisviaAdaptiveBlock-BasedGaussianSplattin

項目鏈接:https://github.com/SunshineWYC/BlockGaussian
提出一種分而治之的框架,大幅提升了基于高斯潑濺的大規模場景重建和渲染的效率與質量,解決了傳統方法在處理海量數據時面臨的計算瓶頸和邊界偽影。
創新技術點:
內容感知動態分塊:根據場景不同區域的幾何與紋理復雜度,動態調整分區大小,平衡各區塊的計算負載,實現更均勻且高效的計算資源分配。
輔助點優化策略:在獨立優化每個區塊的Gaussians時,?針對性引入輔助點。這些輔助點有助于對齊區塊邊界處的真實監督信號(顏色、深度),顯著減少區塊孤立優化帶來的幾何不匹配和精度損失,提升最終合并后的全局重建精度。
偽視圖幾何約束:首創在區塊合并階段引入渲染偽視圖(如深度圖、法線圖)作為幾何約束。該約束能有效抑制分塊邊界處和孤立Gaussians(“浮動點”)引起的合并偽影和渲染退化??,確保全局場景的幾何連貫性與渲染質量。
顯著優勢:
效率飛躍:優化速度提升>5倍。質量提升:平均PSNR(峰值信噪比)提高1.21dB,渲染圖像更清晰銳利。
資源節約:能在單卡(24GBVRAM)上完成城市級等超大場景的完整重建與新視角合成,降低了硬件門檻。
克服傳統瓶頸:有效解決了大規模場景下分區、孤立優化、塊合并的全流程挑戰

5.CityGaussian V2(2DGS, 可擴展性、存儲與訓練優化)

CityGaussianSeriesforHigh-qualityLarge-ScaleSceneReconstructionwithGaussians

項目鏈接:https://github.com/Linketic/CityGaussian
攻克2DGS在大規模應用中的可擴展性(Scalability)與收斂性(Convergence)難題,致力于實現城市場景下高質量、高效率、存儲友好的高斯重建。
創新技術點
分解梯度驅動的致密化與深度回歸:提出一種新穎的致密化方法,通過分析梯度信息更精細化地判斷高斯的位置、尺度、旋轉變化需求。結合深度回歸預測,加速收斂過程并顯著減少模糊/漂浮偽影,得到更清晰、幾何一致的3D高斯表示。
伸長濾波器:針對2DGS在處理平坦或低紋理區域時高斯數量激增(“爆炸”)的問題,設計高效濾波器識別并移除顯著拉長(退化為平面片狀)的、低貢獻度的高斯,大幅減少存儲冗余和無效計算。
高效并行訓練管線優化:對整個訓練流程進行并行化重構和資源調度優化。
優勢:相比標準2DGS,獲得>10倍的模型存儲節省。訓練時間減少>25%。訓練期間顯存占用降低50%。

(二)廠商實踐

1.大勢智慧 - 重建大師7.0 (OPGS流程集成)

在既有2D正射與3D網格生產能力基礎上,無縫擴展OPGS成果生產流程。
基于空三Block成果直接進行3DGS重建,復用原始空間框架坐標系,確保成果無縫集成;與傳統3D重建路徑耗時持平(同等硬件配置),流程操作一致;輸出高質量3D OPGS成果,兼容多源數據融合建模需求,適用于城市級大規模場景。
在這里插入圖片描述

2.Mapmost - GIS融合 (坐標還原、空間量測)

聚焦地理信息屬性融合,解決3DGS模型空間應用瓶頸。
支持RTK/PPK無人機影像的真實坐標映射,輸出具備厘米級定位精度的3DGS模型;集成點選量測工具,支持模型表面距離、面積、體積的實時測算(如土方工程、設施間距);支持模型與WGS84/CGCS2000坐標系的動態適配,適配數字孿生平臺集成。

在這里插入圖片描述

3.Bentley - iTwin Capture (多源數據融合)

通過多源數據融合與高性能計算優化重建流程:
支持同步處理無人機影像、激光點云、飛思IIQ工業相機數據,通過SfM生成稀疏點云基座;支持鋼結構螺栓級精細建模(如橋梁栓接節點)、半透明材質渲染(玻璃幕墻),適配基礎設施高精度巡檢。
在這里插入圖片描述

五、開源項目實踐經驗

(一)數據準備

若為視頻,則使用FFmpeg轉為有序的照片。若為無人機影像、照片等,直接使用colmap進行稀疏重建即可。

1.FFmpeg安裝及使用(若需要)

(1)安裝步驟

下載安裝包
訪問 FFmpeg 官網(https://ffmpeg.org/download.html),根據 Windows 系統版本(32 位 / 64 位)選擇 “release-full” 版本(功能完整且更新)。
解壓文件
將下載的壓縮包(如 .7z 格式)解壓到指定文件夾,例如 C:\Program Files\FFmpeg,便于管理。
配置環境變量
找到解壓目錄下的 bin 文件夾,復制其完整路徑(如 C:\Program Files\FFmpeg\bin)。
右鍵點擊 “此電腦” → “屬性” → “高級系統設置” → “環境變量”。
在 “系統變量” 中找到 Path 變量,點擊 “編輯” → “新建”,粘貼 bin 路徑后保存。
驗證安裝
按 Win+R 打開 “運行”,輸入 cmd 打開命令提示符,輸入 ffmpeg -version。
若顯示版本信息(如 ffmpeg version 4.4 Copyright ? 2000-2021 the FFmpeg developers),則安裝成功。

(2)ffmpeg命令

ffmpeg -i input.mp4 -vf "setpts=0.2*PTS" input/input_%4d.jpg
-i input.mp4:指定輸入視頻文件為input.mp4
-vf "setpts=0.2*PTS":這是一個視頻過濾器選項,其中 setpts 指令用來設置幀的時間戳(Presentation TimeStamps)。這里的表達式 0.2*PTS表示將當前幀的時間戳乘以0.2,這意味著抽取出來的幀之間的間隔被拉長了5倍,所以生成的圖像序列將以視頻原始速度的五分之一進行播放。
input/input_%4d.jpg:這是輸出文件格式及路徑,其中 %4d是一個格式化占位符,它會被自增的整數所替換,確保每個輸出文件名是唯一的。例如,輸出的第一幀將會被保存為input/input_0001.jpg,第二幀為input/input_0002.jpg,依此類推。同時,輸出目錄被指定為input/目錄下。

2.colmap安裝及使用

(1)安裝

下載預編譯安裝包
訪問 COLMAP 發布頁面,找到適配 Windows 系統的最新預編譯 .zip 安裝包。下載后解壓到本地目錄。
配置環境變量
右鍵點擊 “此電腦” → “屬性” → “高級系統設置” → “環境變量”。
在 “系統變量” 中找到 Path,點擊 “編輯” → “新建”,添加 COLMAP 安裝目錄中的 bin 路徑(如 D:\colmap\bin)。
驗證安裝
打開命令提示符,輸入 colmap gui并回車。若成功啟動 COLMAP 圖形用戶界面,則安裝完成。

(2)colmap命令

使用colmap命令直接轉換數據
colmap automatic_reconstructor --workspace_path . --image_path ./images --sparse 1 --camera_model SIMPLE_PINHOLE --dense 0
colmap automatic_reconstructor: 這是調用COLMAP程序中的自動重建模塊,它會自動完成特征提取、匹配、重投影誤差優化和三角化等步驟,以生成場景的稀疏3D點云模型。
--workspace_path .: 指定了工作空間路徑為當前目錄(.),在這個路徑下,COLMAP將存儲中間結果以及最終的重建輸出文件。
--image_path ./images: 定義了圖像數據集所在的路徑,即所有參與重建的圖片都位于./images目錄下。
--sparse 1: 這個參數表示進行稀疏重建(與密集重建相對),即只構建出場景中的關鍵點及其對應關系,并通過這些信息生成一個由稀疏點云組成的三維模型。
--camera_model SIMPLE_PINHOLE: 指定使用的相機模型為“簡單針孔模型”(Simple Pinhole Model)。這意味著COLMAP在進行重建時將假設相機遵循的是最基礎的幾何投影模型,其中不包括像徑向畸變這樣的復雜因素。
--dense 0,減少不需要的計算操作。

(二)CityGaussianV2實現

1.安裝注意事項

需依據CityGaussian 官方安裝文檔完成基礎安裝,再補充以下庫
ninja 安裝:執行pip install ninja,用于高效構建 C++ 擴展模塊。
xformers 版本匹配:需嚴格對應 PyTorch 版本,例如pip install xformers==0.0.22,。
triton 安裝:執行pip install -U triton-windows,優化 CUDA 計算效率,提升訓練速度。

2.數據準備

使用FFmpeg、colmap章節準備數據,然后根據教程https://github.com/Linketic/CityGaussian/blob/main/doc/data_preparation.md進行數據進入CityGaussian的準備

(1)數據下采樣

數據下采樣:通過命令python utils/image_downsample.py data/your_scene/images --factor $DOWNSAMPLE_RATIO降低圖像分辨率,平衡精度與計算成本(建議下采樣倍率根據場景復雜度設為 2-4)

(2)生成深度模型

克隆深度估計庫:git clone https://github.com/DepthAnything/Depth-Anything-V2 utils/Depth-Anything-V2(無需安裝其依賴)。
下載預訓練模型:創建目錄utils/Depth-Anything-V2/checkpoints,并將depth_anything_v2_vitl.pth放入其中(在國內的HF-Mirror里面找)。
生成深度圖:執行python utils/estimate_dataset_depths.py data/your_scene -d $DOWNSAMPLE_RATIO,確保下采樣倍率與步驟 1 一致,輸入路徑指向原始圖像文件夾。

3.訓練

跟著https://github.com/Linketic/CityGaussian/blob/main/doc/run&eval.md一步一步走就行
1.相關的配置文件可以參看:https://blog.csdn.net/m0_53955985/article/details/146249200
2.記得將相關配置文件的【down_sample_factor】修改為你自己的倍率。

六、高斯潑濺與Mesh模型效果對比

這里引用:https://mp.weixin.qq.com/s/XyQW7OJGMx2V4EZBHTfMbg

(一)上面為Mesh,下面為高斯潑濺

在這里插入圖片描述
在這里插入圖片描述
在這里插入圖片描述
在這里插入圖片描述
在這里插入圖片描述
在這里插入圖片描述

(二)上面為高斯潑濺,下面為Mesh

在這里插入圖片描述
在這里插入圖片描述

1.清晰度。OSGB清晰度比3DGS要高,細節表現更加良好。如墻上的字跡、車牌等,OSGB都可以看到,而3DGS放大看是模糊的;
2.細節層次。3DGS更加逼真。對于細小的難以構建的模型,3DGS能夠表現出來,如電線、欄桿鐵架等,
3.場景效果。3DGS更加和諧。對于場景內的植被,OSGB都是一坨在一起,而3DGS可以將枝葉表現出來,與實際更接近;場景中金屬、木材、石塊等材質,更有質感,效果更加逼真。
4.數據大小。3DGS數據量相對較小。同樣的面積,3DGS的數據量不到OSGB的二分之一,存儲空間更小(通信塔OSGB大小為392M,3DGS僅為28.1M),傳輸速度更快。

七、高斯潑濺的多端集成

(鑒于 NeRF 技術受限于高渲染要求,難以在實際生產中應用,而高斯潑濺技術無需多次查詢神經網絡,可在終端設備實現實時渲染,以下將聚焦高斯潑濺技術展開討論。)

高斯潑濺技術憑借高效的渲染性能與細節捕捉能力,在多平臺應用開發中愈發關鍵。具體集成方向如下:

(一)游戲引擎加載

將 3D Gaussian Splatting 技術集成至 Unity、Unreal Engine 、blender等主流游戲引擎,可助力開發者通過 3DGS 的高效渲染與逼真視覺效果,打造更沉浸的高質量游戲體驗。
Unity 平臺:開發者 Aras Pranckevi?ius 提供了插件GSTestScene.unity,支持高斯潑濺模型的加載與渲染。
Unreal Engine 平臺:UE Gaussian Splatting插件具備以下優勢:
支持 3DGS 模型資源實時渲染,兼顧高性能與畫質;
利用八叉樹優化空間點數據,實現動態 LOD(Level of Detail)渲染;
提供自動碰撞生成功能,提升游戲交互體驗。
blender可以使用3DGS Render Blender Addon,使得用戶可以在 Blender 這一熟悉的環境中處理 3DGS 內容,編輯和優化點云,創建動畫和運動圖形,同時支持物體對光照的反應和產生陰影。
在這里插入圖片描述

(二)Web 引擎加載

當前已涌現多個支持 Web 端渲染高斯潑濺的開源庫,具體包括:
基于 WebGPU 的渲染器:gaussian-splatting-web;
純 WebGL 實現(不依賴外部庫):splat;
基于 Three.js 的渲染器:Gaussian Splats3D;
Web 端編輯器:super-splat;
Babylon.js 引擎內置高斯潑濺渲染支持。

(三)高斯潑濺與 GIS 的融合方案

高斯潑濺技術與地理信息系統(GIS)的融合,為大規模三維地理空間數據的高效管理、精準可視化及深度應用開辟了新路徑,突破了傳統三維模型在地理信息承載與空間分析上的局限,推動實景三維數據向地理信息級應用升級。
技術實現層面,Cesium 團隊已提出針對 glTF 格式的高斯擴展標準 KHR_gaussian_splatting(相關技術細節可參考https://github.com/CesiumGS/cesium/tree/splat-shader),為高斯潑濺模型與 GIS 系統的兼容提供了底層格式支撐。該擴展使高斯潑濺模型能直接承載地理坐標信息,實現與 GIS 空間框架的無縫對接。
在實際應用中,借助 GISBox 工具(訪問地址:http://gisbox.mkaua.cn/)可完成格式轉換與數據切片:將 ply 格式或 splat 格式的高斯潑濺模型,批量處理為符合 OGC 標準的 3D Tiles 數據。3D Tiles 作為主流的大規模三維地理數據傳輸與可視化格式,能適配各類 GIS 平臺(如 Cesium、ArcGIS),支持高斯潑濺模型在數字孿生城市、智慧園區等場景中,與地形、影像、矢量等多源地理數據協同展示,實現從實景重建到地理信息應用的全流程閉環。

八、總結

三維重建技術正從傳統顯式幾何建模向智能化神經表征快速演進,NeRF、3DGS、2DGS 等新型方法在理論突破與產業落地中展現出差異化價值:

從技術特性看,NeRF 作為隱式神經表征的代表,通過神經網絡擬合輻射場實現照片級新視角合成,在復雜光照與材質還原上具備天然優勢,但受限于神經網絡推理效率,渲染速度較慢且訓練依賴海量多視角數據與高計算資源,難以滿足實際生產中的實時性需求。
3DGS 與 2DGS 為代表的高斯潑濺技術則通過顯式幾何表征(三維高斯橢球或二維橢圓盤)突破了這一局限:3DGS 以可優化的高斯單元直接表征場景,兼顧細節捕捉與渲染效率,在細小結構(如電線、欄桿)和自然場景(如植被枝葉)的還原上更逼真,且數據量僅為傳統網格模型(如 OSGB)的 1/2 以下,顯著降低存儲與傳輸成本;2DGS 針對 3DGS 在薄壁表面建模的缺陷,引入帶朝向的 2D 橢圓盤,通過梯度驅動的致密化、伸長濾波器等創新,進一步解決了大規模場景中的可擴展性與存儲冗余問題,在城市場景重建中實現了精度、效率與存儲的平衡。

從產業實踐看,高斯潑濺技術已通過 BlockGaussian 的分塊優化、CityGaussian V2 的存儲壓縮,以及大勢智慧、Mapmost 等廠商的流程集成,逐步突破大規模場景重建的計算瓶頸與空間應用限制,在智慧城市、地理信息融合等領域形成落地能力;而 NeRF 受限于渲染性能,更多停留在實驗室研究與特定高精度場景(如文化遺產數字化)探索。

九、參考

https://zhuanlan.zhihu.com/p/26344567471
https://blog.csdn.net/qq_45752541/article/details/130072505
https://zhuanlan.zhihu.com/p/680669616
https://fansaorz.github.io/2024/05/11/2DGS%E8%AF%A6%E8%A7%A3/
https://blog.csdn.net/Darlingqiang/article/details/142773142
https://www.cnblogs.com/shanhaibi/p/18700933
https://blog.csdn.net/BigerBang/article/details/140301608
https://zhuanlan.zhihu.com/p/696911349

本文來自互聯網用戶投稿,該文觀點僅代表作者本人,不代表本站立場。本站僅提供信息存儲空間服務,不擁有所有權,不承擔相關法律責任。
如若轉載,請注明出處:http://www.pswp.cn/web/88202.shtml
繁體地址,請注明出處:http://hk.pswp.cn/web/88202.shtml
英文地址,請注明出處:http://en.pswp.cn/web/88202.shtml

如若內容造成侵權/違法違規/事實不符,請聯系多彩編程網進行投訴反饋email:809451989@qq.com,一經查實,立即刪除!

相關文章

rt thread studio 和 KEIL對于使用rt thread 的中間件和組件,哪個更方便

下面我從中間件/組件集成和開發體驗兩個角度,詳細對比 RT-Thread Studio 和 Keil MDK 的便利性:1. 中間件和組件集成 RT-Thread Studio 集成RT-Thread生態:內置RT-Thread的包管理器(RT-Thread Package Manager)&#x…

Spring Boot 項目開發實戰:入門應用部分原理示例講解

前言Spring Boot 作為當前 Java 開發領域最流行的框架之一,以其 "約定優于配置" 的理念極大簡化了企業級應用的開發流程。本文將基于《Spring Boot 項目開發教程(慕課版)》中的資產管理系統項目,深入解析 Spring Boot 的…

ByteBrain x 清華 VLDB25|時序多模態大語言模型 ChatTS

資料來源:火山引擎-開發者社區 近年來,多模態大語言模型(MLLM)發展迅速,并在圖像、視頻、音頻等領域取得了突破性成果。然而,相較于這些研究較為成熟的模態,時間序列這一類型的數據與大模型結合…

WPF學習筆記(25)MVVM框架與項目實例

MVVM框架與項目實例一、MVVM框架1. 概述2. 核心組件與優勢一、MVVM項目1.普通項目2. MVVM架構3. MVVM項目實例1. 項目準備2. LoginViewModel與Login2. MainWindowViewModel4. MVVM項目優化1. BaseViewModel2. RealyCommand3. 效果展示總結一、MVVM框架 1. 概述 官方文檔&…

MySQL實操

## 基于MySQL#先啟動MySQL服務#第一次登錄[rootlocalhost ~]# mysql -uroot -P3306#密碼登錄[rootlocalhost ~]# mysql -uroot -pEnter password: Welcome to the MySQL monitor. Commands end with ; or \g.Your MySQL connection id is 9Server version: 8.0.41 Source dist…

ez_rust_writeup

一道簡單的[[rust逆向]] #rust逆向 #位運算 題目信息 文件名:ezrust.exe 題目附件:https://wwfj.lanzoul.com/iczMR30k5j4h 密碼:bueq 題目分析 1. 初步分析 這是一道Rust編寫的逆向題目。通過IDA分析可以看到,這是一個典型的flag驗證程序。 …

【QT】-隱式轉換 explicit用法

通俗易懂的解釋:隱式轉換 vs 顯式轉換 什么是隱式轉換? 隱式轉換就是編譯器偷偷幫你做的類型轉換,你甚至都沒意識到它發生了。 例子: cpp 運行 double x = 5; // 隱式:int → double(5 變成 5.0) int y = x * 2.5; // 隱式:double → int(截斷小數部分) 構造函數的隱…

Django核心知識點詳解:JSON、AJAX、Cookie、Session與用戶認證

1. JSON數據格式詳解1.1 什么是JSON?JSON(JavaScript Object Notation)是一種輕量級的數據交換格式,具有以下特點:獨立于語言,幾乎所有編程語言都支持易于人閱讀和編寫易于機器解析和生成基于文本&#xff…

[特殊字符] Python 實戰 | 批量統計中文文檔詞頻并導出 Excel

本文展示如何用 Python 腳本: 批量讀取文件夾中的多篇中文文檔; 用 jieba 分詞并統計詞頻(過濾停用詞與單字符); 將各文檔詞頻輸出為對應 Excel 文件; 是文本分析、內容審查、報告編寫中的實用技巧。 &…

共享打印機(詳細操作+常見問題:需輸入用戶名密碼、無法連接等)

文章目錄一、設置打印機共享的準備工作二、Windows系統下打印機共享設置1. 啟用主機打印機共享2. 客戶端添加共享打印機三、我所遇到的問題及解決方法客戶機遇到輸入用戶名、密碼錯誤代碼 0x0000011b一、錯誤代碼 0x0000011b 的含義二、解決方法添加打印機沒成功其他問題此次打…

在 Windows 系統上配置 [go-zero](https://go-zero.dev) 開發環境教程

💻 在 Windows 系統上配置 go-zero 開發環境教程 本教程將詳細介紹如何在 Windows 系統上配置 go-zero 微服務框架的開發環境,包括依賴安裝、路徑配置、常見問題等。 🧱 一、前置環境安裝 1. 安裝 Go 下載地址:https://go.dev/…

開源=白嫖?

國內有一個非常濃重的思想,開源,開源就是免費,就是白嫖,就是不花錢,白給。那么什么是開源?“源代碼”是軟件中大多數計算機用戶從未見過的部分;它是計算機程序員可以操縱的代碼,以改變一個軟件(…

2048-控制臺版本

2048控制臺版 文章目錄2048控制臺版實現效果:在這里插入圖片描述庫函數使用:初始化變量功能函數實現:狀態判斷函數int Judge();數字生成函數 bool CtreateNumber()打印游戲界面 void…

提取出Wallpaper Engine壁紙的mpkg類靜態壁紙

github 地址 https://github.com/notscuffed/repkg先下載軟件2853…26目錄這樣獲取有的直接mp4格式,就不能用這方法準備好后 cmd 進入repkg目錄 執行 repkg extract ./294...333/scene.pkg

AI健康小屋“15分鐘服務圈”:如何重構社區健康生態?

AI健康小屋作為“15分鐘服務圈”的核心載體,通過技術賦能與場景重構,正推動社區健康生態從被動治療向主動預防、從單一服務向全周期管理轉型。那我們應該如何重構社區健康生態呢?服務模式創新1.全時段覆蓋AI健康小屋通過分時段服務滿足不同群…

[netty5: WebSocketFrame]-源碼分析

WebSocketFrame WebSocketFrame 是 Netty 中用于表示 WebSocket 消息幀的抽象基類,封裝了幀的內容、分片標志和擴展位信息,供各類具體幀(如文本、二進制、控制幀)繼承使用。 public abstract class WebSocketFrame extends Buffer…

【加解密與C】非對稱加解密(三)ECC橢圓曲線

ECC橢圓曲線的基本概念橢圓曲線密碼學(Elliptic Curve Cryptography,ECC)是一種基于橢圓曲線數學的公鑰密碼體制。與傳統的RSA相比,ECC在相同安全級別下使用更短的密鑰,計算效率更高,適用于資源受限的環境。…

力扣網編程150題:加油站(貪心解法)

一. 簡介 前面一篇文章使用暴力解法來解決力扣網150 題目:加油站。文章如下: 力扣網編程150題:加油站(暴力解法)-CSDN博客 暴力解法就是遍歷了所有元素作為起始點的可能,算法時間復雜度為 O(n*n)&#x…

windwos 設置redis長久密碼不生效

1、設置長久密碼redis.windows.conf 文件修改對應的設置密碼2、啟動時設置對應的加載配置文件

物聯網(IoT)領域存在多種協議

物聯網(IoT)領域存在多種協議,主要是因為不同的應用場景對通信的需求差異很大,包括實時性、帶寬、功耗、設備兼容性、安全性等。以下從協議多樣性的原因和你提到的具體協議(如 dc3-driver-* 模塊)展開說明&…