CVPR優秀論文 | DashGaussian:在200秒內優化三維高斯點繪制

本文選自gongzhonghao【圖靈學術SCI論文輔導】

關注我們,掌握更多頂會頂刊發文資訊


1.導讀

圖片

1.1 論文基本信息

  • 論文標題DashGaussian: Optimizing 3D Gaussian Splatting in 200 Seconds

  • 作者Youyu Chen、Junjun Jiang、Kui Jiang、Xiao Tang、Zhihao Li、Xianming Liu、Yinyu Nie

  • 作者單位哈爾濱工業大學、華為諾亞方舟實驗室

  • 發表信息arXiv:2503.18402v2 [cs.CV] 26 Mar 2025

  • 論文鏈接https://arxiv.org/abs/2503.18402

2.論文速讀

研究者們提出了一種名為DashGaussian的優化方法,能夠顯著加快3D高斯繪制(3DGS)的訓練速度。該方法通過合理分配計算資源,在不犧牲渲染質量的前提下,將3DGS模型的優化時間縮短至200秒。DashGaussian通過動態調整渲染分辨率和高斯原語數量,有效減少了優化過程中的計算復雜度。

3.研究背景及相關工作

3.1 研究背景

3D高斯繪制(3DGS)是一種利用高斯原語進行場景建模的方法,能夠在保持與NeRF相當的渲染質量的同時,顯著減少優化時間。然而,現有的3DGS方法在優化過程中仍面臨計算效率低下的問題,尤其是在處理大規模場景時。

3.2 相關工作

3.2.1? ?新視圖合成

NeRF作為新視圖合成領域的里程碑工作,雖然在視覺質量上取得了顯著成果,但優化單個場景需要數小時。3DGS作為一種替代方案,通過減少優化時間,提高了場景建模的效率。

3.2.2 ??3DGS優化加速

現有的加速方法主要分為工程優化算法優化兩大類。工程優化通過改進渲染流程來提高計算效率,而算法優化則通過剪枝冗余的高斯原語來減少參數數量。然而,這些方法在加速的同時,往往會導致渲染質量的下降。

圖片

4.DashGaussian:3DGS優化的動態調度方案

DashGaussian通過動態調整渲染分辨率高斯原語數量,有效減少了3DGS優化過程中的計算復雜度。具體來說,該方法將3DGS優化過程視為逐步擬合訓練視圖中不同頻率成分的過程,并提出了一個基于頻率的分辨率調度方案。此外,DashGaussian還設計了一個與分辨率增長同步的高斯原語數量調度器。

4.1 問題表述

優化3DGS時,使用不同分辨率的圖像進行訓練是一個挑戰,因為這可能導致3D混疊問題。根據圖像處理理論,低分辨率圖像與高分辨率圖像之間的主要區別在于高分辨率圖像中包含而低分辨率圖像中缺失的高頻成分。因此,逐步提高渲染分辨率相當于逐步擬合3DGS到訓練視圖中的更高頻率成分。

4.2 頻率引導的分辨率調度器

基于上述理論,DashGaussian提出了一個場景自適應的頻率引導分辨率調度方案。該方案根據訓練視圖的頻率成分自適應地調整渲染分辨率,從而在優化過程中逐步增加分辨率。

圖片

4.3 分辨率引導的高斯原語調度器

DashGaussian進一步提出了一個分辨率引導的高斯原語調度器。該調度器根據當前的渲染分辨率動態調整高斯原語的數量,以實現計算冗余和擬合質量之間的最佳平衡。

5. 實驗

5.1 數據集和評估指標

研究者們在Mip-NeRF 360、Deep Blending和Tanks & Temples等真實世界數據集上進行了實驗。評估指標包括平均PSNR、SSIM和LPIPS,以及優化時間。

5.2 與快速優化方法的比較

DashGaussian在優化速度上顯著優于現有的快速優化方法。例如,在Mip-NeRF 360數據集上,DashGaussian將3DGS的優化時間縮短至200秒,同時保持了較高的渲染質量。

圖片

5.3 對不同3DGS骨干網絡的增強效果

DashGaussian可以輕松集成到各種3DGS骨干網絡中,顯著提高優化速度。實驗結果表明,DashGaussian在不同骨干網絡上均實現了平均45.7%的加速。

5.4 消融研究

研究者們對DashGaussian的各個模塊進行了消融研究。結果表明,分辨率調度器和高斯原語調度器均對優化速度和渲染質量有顯著影響。

6.結論

DashGaussian通過合理分配計算資源,顯著加快了3DGS的優化過程。該方法不僅提高了優化效率,還保持了渲染質量。DashGaussian可以作為即插即用的優化策略,集成到任何3DGS骨干網絡中。未來,研究者們將探索將該方法應用于更大規模、更具挑戰性的場景重建任務。


?本文選自gongzhonghao【圖靈學術SCI論文輔導】

關注我們,掌握更多頂會頂刊發文資訊

本文來自互聯網用戶投稿,該文觀點僅代表作者本人,不代表本站立場。本站僅提供信息存儲空間服務,不擁有所有權,不承擔相關法律責任。
如若轉載,請注明出處:http://www.pswp.cn/news/917691.shtml
繁體地址,請注明出處:http://hk.pswp.cn/news/917691.shtml
英文地址,請注明出處:http://en.pswp.cn/news/917691.shtml

如若內容造成侵權/違法違規/事實不符,請聯系多彩編程網進行投訴反饋email:809451989@qq.com,一經查實,立即刪除!

相關文章

知識蒸餾 - 基于KL散度的知識蒸餾 HelloWorld 示例 采用PyTorch 內置函數F.kl_div的實現方式

知識蒸餾 - 基于KL散度的知識蒸餾 HelloWorld 示例 采用PyTorch 內置函數F.kl_div的實現方式 flyfish kl_div 是 Kullback-Leibler Divergence的英文縮寫。 其中,KL 對應提出該概念的兩位學者(Kullback 和 Leibler)的姓氏首字母“div”是 div…

C語言基礎_補充知識、數據類型轉換、選擇結構

0、補充知識: 原碼、反碼、補碼的知識: 計算機中原碼轉補碼,正數不變,負數是符號位不變,其余各位取反碼加一。負數的補碼轉原碼應該是補碼減一然后再取反,為什么負數的補碼轉原碼是補碼取反然后再加一&…

ubuntu自動重啟BUG排查指南

當 Ubuntu 系統意外重啟時,排查原因需要從系統日志、硬件狀態和定時任務等多個方面入手。 示例:通過日志檢查重啟原因 last -x | head | tac 此命令顯示最近的關機和重啟記錄。如果記錄中包含 shutdown 或 crash,則可能是人為操作或系統故障導…

2. JS 有哪些數據類型

總結 基礎類型(7 種):number, string, boolean, null, undefined, symbol, bigint引用類型(對象及其子類):object, array, function, date, regexp, map, set 等 判斷方式推薦: 基礎類型&#x…

pipeline方法關系抽取--課堂筆記

Pipeline方法課堂筆記 一、Pipeline方法原理 pipeline方法是指在實體識別已經完成的基礎上再進行實體之間關系的抽取. pipeline方法流程: 先對輸入的句子進行實體抽取,將識別出的實體分別組合;然后再進行關系分類. 注意:這兩個子過…

linux系統離線環境安裝clickhouse客戶端

1、下載離線安裝包: 方式1:網站直接下載 鏈接:https://packagecloud.io/altinity/clickhouse 注意要下載同一版本的四個包 方式2:夸克網盤分享 鏈接:https://pan.quark.cn/s/7e77e6a1bc5f 2、將本地下載的安裝包上傳…

GPT-5的誕生之痛:AI帝國的現實危機

目錄 前言 一、“俄里翁”的隕落:一場夢碎的代際飛躍 二、扎克伯格的“抄家式”突襲 三、天才的詛咒:當AI聰明到無法與我們對話 四、燒錢的無底洞與微軟的影子 結語:AI帝國的黃昏,還是黎明前的黑暗? &#x1f3a…

探索設計模式的寶庫:Java-Design-Patterns

在軟件開發領域,設計模式是解決常見問題的經典方案,它們如同建筑師的藍圖,為開發者提供了經過驗證的最佳實踐。今天我要向大家介紹一個GitHub上的明星項目——java-design-patterns,這是一個全面、實用且持續更新的設計模式寶藏項…

JavaScript中的作用域、閉包、定時器 由淺入深

1. JavaScript中的作用域是什么? 作用域(Scope)是程序中定義變量的區域,它決定了變量的可訪問性(可見性)。在JavaScript中,作用域主要分為三種:全局作用域、函數作用域和塊級作用域&…

倉庫管理系統-11-前端之頭部區域Header的用戶登錄和退出功能

文章目錄 1 登錄功能 1.1 登錄頁面(Login.vue) 1.1.1 頁面布局 1.1.2 初始化數據 1.1.3 confirm方法 1.1.4 UserController.java(登錄接口) 1.1.5 Login.vue 1.2 登錄頁面的路由 1.2.1 創建路由文件(router/index.js) 1.2.2 注冊路由器(main.js) 1.2.3 路由視圖(App.vue) 2 退出…

【VLNs篇】07:NavRL—在動態環境中學習安全飛行

項目內容論文標題NavRL: 在動態環境中學習安全飛行 (NavRL: Learning Safe Flight in Dynamic Environments)核心問題解決無人機在包含靜態和動態障礙物的復雜環境中進行安全、高效自主導航的挑戰,克服傳統方法和現有強化學習方法的局限性。核心算法基于近端策略優化…

飛算科技:以自主創新引領數字科技浪潮,飛算JavaAI賦能產業智能化升級

技術創新已成為企業突破瓶頸、實現跨越式發展的核心驅動力。作為國家級高新技術企業,飛算數智科技(深圳)有限公司(簡稱“飛算科技”)憑借其深厚的互聯網科技、大數據與人工智能技術積淀,以及在民生產業、中…

51單片機按鍵復位電路電壓隨著電容放電升高的分析

一、引言在單片機系統中,復位電路是一個至關重要的組成部分,它確保了單片機在特定情況下能夠恢復到初始狀態,從而避免程序運行錯誤或系統崩潰。對于51單片機而言,按鍵復位電路是一種常用的復位方式,它通過手動按下復位…

JVM學習日記(十五)Day15——性能監控與調優(二)

好了我們這一篇繼續來說命令行監控指令,上一篇說了4個比較重要的指令,其中用的比較多的也就是jstat和jmap了。 jhat:堆轉儲分析工具 他是JDK自帶的分析工具,分析我們上一篇說的jmap轉存的內存快照,??內置了一個微型…

Docker國內鏡像列表

Docker 鏡像源列表(8月3日更新-長期&免費)_docker國內鏡像源-CSDN博客

Orange AI 管理平臺單體版安裝教程(Docker Compose 部署)

Orange AI 管理平臺單體版安裝教程(Docker Compose 部署) 本文介紹如何通過 Docker Compose 快速安裝 Orange AI 管理平臺單體版,適用于本地開發和測試環境。步驟簡單,適合初學者和有一定運維經驗的用戶。 一、環境準備 已安裝 …

PHP的魔術方法

一、介紹 ?PHP魔術方法是以雙下劃線__開頭的一組特殊方法,用于在對象生命周期、屬性訪問、方法調用等場景中實現自動化操作。?簡化面向對象編程。 二、17個現有的魔術方法 (一)、對象生命周期相關 1、__construct() 類的構造函數方法&a…

vue2實現類似chatgpt和deepseek的AI對話流打字機效果,實現多模型同時對話

實現多模型同時對話功能特點:1、抽離對話框成單獨組件ChatBox.vue,在新增模型對比窗口時可重復利用2、通過sse與后臺實時數據流,通過定時器實現打字效果3、適應深度思考內容輸出,可點擊展開與閉合4、可配置模型參數,本…

電腦上不了網怎么辦?【圖文詳解】wifi有網絡但是電腦連不上網?網絡設置

一、問題背景 你有沒有遇到過這種情況:電腦右下角的網絡圖標明明顯示連接正常,可打開瀏覽器就是加載不出網頁,聊天軟件也刷不出新消息? 這種 "網絡已連接但無法上網" 的問題特別常見,既不是沒插網線&#xf…

思途Spring學習 0804

SpringBoot 核心概念與開發實踐SpringBoot 是一個基于 Spring 框架的快速開發腳手架,通過約定大于配置的原則簡化了傳統 Spring 應用的初始化配置。其核心目標是整合 Spring 生態(如 SSM)并支持微服務架構開發。控制反轉(IoC&…