【論文閱讀筆記】TransparentGS:當高斯濺射學會“看穿”玻璃,如何攻克透明物體重建難題?

文章目錄

  • TransparentGS: Fast Inverse Rendering of Transparent Objects with Gaussians
    • Info
    • Abstract
    • Introduction
    • Method
      • 預備知識
        • 3D GS的概念不再贅述
        • 渲染方程
      • 透明高斯
      • Gaussian Light Field Probes
      • 多階段重建
    • 實驗
      • 結果和評估
    • 消融實驗
    • 應用
      • 討論和限制
    • 結論


TransparentGS: Fast Inverse Rendering of Transparent Objects with Gaussians

Info

會議 【TOG 2025】

作者 南京大學、南開大學、浙江大學

Project地址 https://letianhuang.github.io/transparentgs/

Abstract

本文聚焦于使用 3D GS 實現反射和折射場景的新視角合成,提出了一種名為 TransparentGS 的方法。它是一個基于3D-GS、用于快速重建透明物體的逆向渲染管線。主要貢獻包含三個方面:

  • 設計了一種高效的透明物體表示方法:我們設計了“透明高斯基元”(transparent Gaussian primitives),它通過一種“延遲折射”(deferred refraction)策略,實現了對高光折射的模擬。
  • 統一環境光與鄰近內容的編碼:我們利用“高斯光場探針”(Gaussian light field probes, GaussProbe),在一個統一的框架內,同時對環境光和鄰近物體內容進行編碼。
  • 提出了一種減少視差誤差的算法:我們提出了一種名為“基于深度的迭代式探針查詢”(depth-based iterative probes query, IterQuery)的算法,以減少我們這種基于探針框架中的視差(parallax)錯誤。

圖 1 TransparentGS是一種基于3D-GS的新型逆向渲染流水線,專門設計用于在各種光照和觀察條件下重構透明物體。它能夠在1小時內提供高質量的重構結果,實現實時的新視圖合成,并方便地對具有挑戰性的透明物體場景進行重新渲染。與最先進的方法相比,它在近處內容(間接光)的情況下,實現了高逼真度的折射(藍框)和反射(綠框),從而為由多個物體組合而成的場景中的復雜次級光線效果鋪平了道路。

Introduction

從不同視角的多張二維圖像重建三維場景并合成新視角一直是計算機圖形學和視覺中的一項長期任務。隨著深度學習的出現,神經輻射場(NeRF)及其變體在解決這一任務中引領了趨勢,它們通過使用隱式場的體積渲染實現了照片級真實感的視覺質量。最近,隨著對實時渲染需求的不斷增加,三維高斯濺射(3D-GS)提供了一種更高效的顯式表示,能夠通過將輻射場建模為三維高斯原語來實現實時渲染。

然而,直到現在,在任意光照條件下重建透明物體并實現實時新視角合成仍然具有挑戰性。這一挑戰源于透明物體在不同視點下頻繁出現的變化,主要由于光線穿過材料時反射和折射的復雜相互作用。因此,NeRF中的具有方向編碼的多層感知機(MLP)和3D-GS中的球面諧波函數(SH)在準確建模鏡面反射和折射方面都面臨困難。

目前,針對透明物體的最有效重構方法是基于隱式神經表示的 [Bemana et al. 2022; Gao et al. 2023; Li et al. 2020; Sun et al. 2024]。然而,這些方法以訓練過程中的顯著計算開銷而聞名,并且如表1所述,它們也不支持實時渲染。基于3D-GS的方法在3D重構和新視角合成方面提供了高效率 [Wu et al. 2024b],但現有方法各自存在局限性。特別是這些方法 [Jiang et al. 2024; Ye et al. 2024] 原本是為反射場景設計的,無法輕易應用于透明物體。當透明物體周圍有附近物體時,困難程度進一步加大。由于基于光柵化的公式,3D-GS受到理想針孔相機的限制,缺乏對折射和相互反射等次級光線效應的支持 [Huang et al. 2024; Moenne-Loccoz et al. 2024]。

在本文中,我們提出了TransparentGS,一個新穎的逆向渲染框架,該框架基于3D-GS,能夠高效地管理在各種光照和視角條件下的透明物體,同時支持與鄰近內容的折射和相互反射。在此框架中,透明物體由透明高斯原語建模,這些原語明確編碼了3D高斯中的幾何和材料屬性。這些新原語便于集成到專門的物理基礎延遲渲染流水線中,從而實現網格和高斯的整合,以處理次級光線效果。為了處理場景中的環境光和鄰近內容,我們引入了高斯光場探針(GaussProbe),通過在透明物體周圍放置稀疏的緩存集來捕捉每個透明物體的局部光場。這些探針可以基于最佳投影策略快速烘焙和更新 [Huang et al. 2024]。為了解決探針固有的視差問題并增強折射/相互反射的細節,我們設計了一種基于深度的迭代探針查詢算法(IterQuery),該算法在經過幾次迭代后能實現可信的結果。與之前的工作相比,我們的新框架具有幾個優勢,如表1所列。特別地,我們在一小時內實現了透明物體的快速逆向渲染及次級光線效果,能夠實時合成透明場景的新視圖以及復雜的次級光線效果,如圖1所示。

 表 1 透明物體重構方法在訓練時間(A)、渲染時間(B)以及支持環境光(C)、鄰近內容(間接光)(D)、高頻折射細節(E)、準確的反射-折射解耦(F)、彩色折射(G)和重新渲染(例如,重新照明或材料編輯 [Khan et al. 2006])(H)方面的比較。

與之前的工作相比,我們的新框架有幾個優點,如表1所示。特別是,我們在一小時內實現了首個快速反向渲染,能夠處理透明物體的次級光線效應,從而實現透明場景和復雜次級光線效應的實時新視角合成,如圖1所示。總之,本工作的貢獻如下:

  • 我們設計了一種高效的透明物體表示,透明高斯原語,使得通過延遲折射策略實現鏡面折射成為可能。
  • 我們利用高斯光場探針(GaussProbe)在統一框架內編碼環境光和附近內容。
  • 我們提出了一種基于深度的迭代探針查詢算法(IterQuery),以減輕我們基于探針的框架中的視差誤差。

Method

在本節中,我們介紹了我們的方法TransparentGS,旨在快速逆渲染透明物體。如圖2所示,我們的TransparentGS由兩部分組成。第一部分是透明物體的表示,透明高斯原語,包含遵循3D高斯點云(3D-GS)[Kerbl et al. 2023]的形狀屬性。為了增強折射的表示能力,我們通過額外屬性擴展了原語,包括法線和雙向散射分布函數(BSDF)[Bartell et al. 1981]的參數。為了利用原語渲染詳細的高光折射,我們采用了一種延遲折射方法。第二部分是我們提出的高斯光場探針(GaussProbe),它不僅表示類似于環境貼圖的環境光,還表示來自附近內容的間接光。為了消除視差問題,我們開發了一種基于深度的迭代探針查詢(IterQuery)算法,專門用于高斯光場探針。

預備知識

我們透明高斯流水線的概述。每個三維場景首先通過SAM2 [Ravi et al. 2024] 結合GroundingDINO [Liu et al. 2024] 被分離為透明物體和不透明環境。對于透明物體,我們提出了透明高斯原語,它明確編碼了三維高斯中的幾何和材料屬性。這些屬性被光柵化為后續延遲著色的貼圖。對于不透明環境,我們使用原始的3D-GS進行恢復,并將其烘焙到圍繞透明物體的高斯探針中。然后,通過我們的迭代查詢算法對高斯探針進行查詢,以計算反射和折射。

3D GS的概念不再贅述
渲染方程

L = ∫ Ω L i n ( x , ω i n ) f ( x , ω , ω i n ) ∣ ω i n ? n ∣ d ω i n . (3) L = \int_{\Omega} L_{in} (\mathbf{x}, \omega_{in}) f (\mathbf{x}, \omega, \omega_{in}) |\omega_{in} \cdot \mathbf{n}| d\omega_{in}. \tag 3 L=Ω?Lin?(x,ωin?)f(x,ω,ωin?)ωin??ndωin?.(3)

雙向散射分布函數,?? 是陰影結果,??in 是入射輻射,n 是表面法線,?? 和 ?? i n ??_{in} ??in? 分別是出射方向和入射方向。?? 表示表面點 x 的雙向散射分布函數(BSDF),可以進一步細分為雙向反射分布函數(BRDF)和雙向透射分布函數(BTDF)

透明高斯

在3D-GS中,球面諧波 [Kerbl et al. 2023] 難以準確捕捉鏡面反射和折射中外觀的高頻變化,這導致了過擬合,從而在新視角中造成退化,或者結果高度模糊。為了解決這個問題,我們提出了一種新的表示,透明高斯原語,它涉及基于物理的渲染流水線,而不是直接計算球面諧波。參數化。如圖2所示,我們將表面幾何體參數化為法線n,將表面材料參數化為粗糙度??和金屬度??。對于透明物體,考慮表面的傳輸和折射是至關重要的。因此,我們利用兩個額外的材料參數:透明度??和折射率(IOR) ??。透明度??用于在不透明材料和透明材料之間進行插值。此外,為了保持高運行性能,我們保留了原始3D-GS [Kerbl et al. 2023] 的形狀參數用于??混合和光柵化。

不透明度屬性在三維生成系統(3D-GS)中發揮著關鍵作用,即使對于不透明物體,因為三維生成系統依賴于體積??混合。對于透明物體,僅僅使用較低的不透明度來表示透明性將無法準確表現其表面,這反過來又使得計算折射和反射變得困難。因此,我們引入了一個額外的參數??,以便于在計算機圖形學中的應用,例如材料編輯。

表面反射和折射。在本文中,我們通過兩個分離的BSDF明確表示表面反射和折射:
f = ( 1 ? t ) f r + t f t f = (1 - t)f_r + tf_t f=(1?t)fr?+tft?
其中 ?? ?? ??_?? fr? 表示雙向反射分布函數(BRDF), ?? ?? ??_?? ft? 表示雙向透射分布函數(BTDF)。對于不透明材料,當 ?? = 0 時,我們遵循 Cook-Torrance 模型 [1981]。而對于金屬或透明物體的反射成分,當 ?? = 0 ?? = 0 ??=0 時,我們將其視為完美鏡面反射:
f r = F δ ( ω ? ω r ) ∣ ω i n ? n ∣ , with ω r = 2 ( ω i n ? n ) n ? ω i n f_r = F \frac{\delta(\omega - \omega_r)}{|\omega_{in} \cdot \mathbf{n}|}, \quad \text{with} \quad \omega_r = 2(\omega_{in} \cdot \mathbf{n})\mathbf{n} - \omega_{in} fr?=Fωin??nδ(ω?ωr?)?,withωr?=2(ωin??n)n?ωin?
其中 ?? ?? ??_?? ??r? 表示分析反射方向,?? 表示 Dirac Delta函數,而 Fresnel 項 ?? 可以使用 Schlick 近似 [Schlick 1994] 進行近似。同樣,對于透明物體的透射成分,當 ?? = 0 時,我們僅考慮完美的鏡面折射

f t = ( 1 ? F ) δ ( ω ? ω t ) ∣ ω i n ? n ∣ (6) f_t = (1 - F) \frac{\delta(\omega - \omega_t)}{|\omega_{in} \cdot \mathbf{n}|} \tag 6 ft?=(1?F)ωin??nδ(ω?ωt?)?(6)

其中 ?? ?? ??_?? ??t? 指的是折射方向。如圖 2 所示,解析的折射方向是根據斯涅爾定律獲得的。

延遲折射 使用3D-GS進行反向渲染的一個關鍵方面是著色方案。通常,著色策略可以分為兩種類型:前向著色和延遲著色。“前向”指的是首先進行著色,然后進行??混合,而“延遲”則相反。先前的研究強調了操作順序對鏡面反射的影響。受到一些關于延遲反射的研究啟發 [Wu et al. 2024a; Ye et al. 2024],我們探討了在處理鏡面折射時采用延遲著色的可能性。具體而言,我們使用公式(3)和公式(6)推導透射顏色:

L t = ∫ Ω L i n ( x , ω i n ) ( 1 – F ) δ ( ω – ω t ) d ω i n = ( 1 – F ) L i n ( x , ω t ) . (7) L_t = \int_{\Omega} L_{in} (\mathbf{x}, \omega_{in}) (1 – F) \delta (\omega – \omega_t) d\omega_{in} = (1 – F) L_{in} (\mathbf{x}, \omega_t). \tag 7 Lt?=Ω?Lin?(x,ωin?)(1–F)δ(ωωt?)dωin?=(1–F)Lin?(x,ωt?).(7)

由于??混合是一種線性的操作,而方程(7)相對于法線n并不是線性的,因此操作順序對折射有顯著影響。前向折射對高斯的陰影結果進行了平均。與前向折射相比,延遲陰影在捕捉具有鏡面折射的透明物體方面更為擅長,因為它對光照進行了單次采樣,如圖3所示。在我們的延遲折射策略中(見圖2),我們采用了一種基于點的??混合方法,類似于方程(2),以聚合所有由基元攜帶的反射和折射相關屬性。例如,帶有α加權的法線的計算公式為:

N = ∑ i = 1 N T i α i n i (8) \mathcal{N}=\sum_{i=1}^{N} T_{i}\alpha_{i}\mathbf{n}_{i} \tag 8 N=i=1N?Ti?αi?ni?(8)

此外,與基于環境光的反射相比,我們還需要整合光線的入射點以進行折射和反射。然而,僅僅整合原始圖形的中心??會忽略它們的各向異性,從而導致誤差。我們采用了一種更精確的策略來計算入射點。考慮到原點 o c a m o_{cam} o

本文來自互聯網用戶投稿,該文觀點僅代表作者本人,不代表本站立場。本站僅提供信息存儲空間服務,不擁有所有權,不承擔相關法律責任。
如若轉載,請注明出處:http://www.pswp.cn/web/86311.shtml
繁體地址,請注明出處:http://hk.pswp.cn/web/86311.shtml
英文地址,請注明出處:http://en.pswp.cn/web/86311.shtml

如若內容造成侵權/違法違規/事實不符,請聯系多彩編程網進行投訴反饋email:809451989@qq.com,一經查實,立即刪除!

相關文章

某視頻網站運維工程師面試題

某視頻網站運維工程師面試題 1、 簡單寫下Xeon和Itanium這兩個產品的本質區別? 2、 ECC內存每Bank的顆粒數是單數還是雙數的? 3、 假如有5塊1T的硬盤,要求組合成盡量多的實際使用空間并至少容忍壞2盤而不影響raid組工作。請問有幾種模式來組…

Java底層原理:深入理解JVM性能調優與監控

一、JVM性能調優概述 JVM性能調優是Java應用優化的重要環節,通過合理配置JVM參數,可以提高Java應用的性能和穩定性。JVM性能調優的主要目標是減少垃圾回收的頻率和時間,提高線程的運行效率,優化內存的使用。 (一&…

Joblib庫多進程/線程使用(一):使用generator參數實現邊響應邊使用

進程與線程的基本概念 特性進程 (Process)線程 (Thread)定義 操作系統分配資源的基本單位(獨立的內存空間) 多進程可真正并行(利用多核 CPU) 進程內的執行單元(共享進程資源)獨立性完全獨立,崩…

css上下滾動文字

效果圖 取得是數組里的數據 上下滾動切換 css .notice-new {background: #222222;border-radius: 19rpx;margin-top: 28rpx;font-size: 24rpx;color: white;font-weight: 500;padding: 0 20rpx;height: 55rpx;line-height: 55rpx;overflow: hidden;.notice-scroll-wrapper {pos…

概念篇: 01-帶你認識Dockerfile

在本篇文章中,我們將帶你認識 Dockerfile —— 構建 Docker 鏡像的"藍圖"。我們會介紹它的基本概念和常用指令,幫助你理解如何使用它來打包你的應用。 簡單了解 Docker(背景知識) 在我們深入 Dockerfile 之前&#xf…

技術倫理之爭:OpenAI陷抄襲風波,法院強制下架宣傳視頻

在AI巨頭OpenAI宣布以65億美元天價收購蘋果前設計總監Jony Ive的硬件公司IO僅一個月后,一場抄襲指控將這家科技明星企業推上風口浪尖。 源自谷歌X實驗室的初創企業IYO將OpenAI告上法庭,指控其竊取智能耳塞核心技術,并通過巨額收購試圖掩蓋抄襲…

前沿解讀:缺陷如何操控二維半導體中的電子摩擦耗散超快動力學

摩擦能耗約占全球一次能源損耗的1/3,在微納器件中尤為突出。二維半導體(如WS?)因其獨特的電子特性成為研究熱點,但電子摩擦的動態機制因電子行為的超快特性長期難以捕捉。近期清華團隊在Nature Communications發表的研究[1]&…

什么是物聯網 (IoT)?

你家是否安裝了智能恒溫器?或者你屬于三分之一的美國健身追蹤器用戶,通過設備記錄運動習慣?如果是,你已在使用物聯網技術。這項技術不僅融入日常生活,更深刻改變著組織的運營方式。物聯網通過多種技術連接數字與物理世…

[特殊字符] Windows 查看端口占用及服務來源教程(以 9018 端口為例)

下面是一份詳細的 Windows 系統中排查 某端口(如 9018)被哪個程序占用 并確定其具體服務來源的完整教程,適合用于日常運維、開發部署排障等場景。 🎯 Windows 查看端口占用及服務來源教程(以 9018 端口為例&#xff09…

異步爬蟲 原理與解析

先遍歷100遍一個程序 import requests import logging import timelogging.basicConfig(levellogging.INFO, format%(asctime)s - %(levelname)s: %(message)s) TOTAL_NUMBER 100 BASE_URL https://ssr4.scrape.center/start_time time.time() for id in range(1,TOTAL_NUM…

vscode管理go多個版本

#1.下載go安裝包 https://developer.aliyun.com/mirror/golang/?spma2c6h.25603864.0.0.55ea7c45IsI4GM # 2.創建 sdk 目錄(如果不存在) mkdir -p ~/sdk # 3.解壓下載的 go1.16.15 到 ~/sdk/ tar -C ~/sdk -xzf go1.16.15.linux-amd64.tar.gz # 4.重…

香港維爾利健康科技集團推出AI輔助醫學影像訓練平臺,助力醫護人才數字化轉型

香港維爾利健康科技集團近日正式發布其自主研發的“AI輔助醫學影像訓練平臺(V-MedTrain)”,這一創新平臺的上線,標志著醫學影像教育邁入智能化輔助教學新時代。依托人工智能與大數據分析技術,香港維爾利健康科技集團在…

互聯網+醫療,醫療服務的全方位革新

近年來,互聯網醫療行業迅速崛起,為醫療健康服務帶來了翻天覆地的變革。新模式、新業態層出不窮,不僅大幅提升了醫療健康服務的可及性,也使得群眾就醫體驗更為舒適、便捷。互聯網技術的廣泛應用,不僅改變了醫療核心業務…

酒店智能門鎖系統常見問題解決方法——東方仙盟

重做系統后 usb發卡器與注冊時發卡器不一致 解決發方法: 用總卡重新注冊軟件,要可以開房間的總卡 房號不存在 2聲---正確提示,表示是設置卡 3聲---門鎖已反鎖,解決方法:用能開反鎖的卡或解除反鎖 6聲---房號不對,解決方法&#…

從零開始理解百度語音識別API的Python實現

大家好!今天我要給大家詳細講解一個使用百度語音識別API的Python代碼。這個代碼可以將音頻文件轉換成文字,非常適合做語音轉文字的應用。我會從最基礎的概念開始講起,確保沒有任何編程基礎的朋友也能理解。 翻譯 一、代碼概覽 這段代碼主要…

中小企業適用的幾種會議簽到工具

對企業行政來說,會議簽到是件小事,但處理不好,會直接拖慢會議流程、影響管理效率、降低參會體驗。尤其是面對人數多、時間緊、場地臨時變動等情況,靠傳統紙筆或簡單Excel管理,往往應對乏力。 實際上,簽到看…

android 11.0 打開ALOGV ALOGI ALOGD日志輸出的方法

1.前言 在11.0的系統rom定制化開發中,在某些時候,需要打印ALOGV,ALOGI等TAG日志,在系統中,默認是關閉這些日志的, 防止日志打印過多,系統過于卡頓,但是有時候會為了調試,需要打開日志開關,所以就需要在系統源碼中查看哪里 需要打開日志的開關,來實現日志的打印解決…

語言大模型or時序大模型?原理、應用與未來發展

引言 隨著人工智能技術的飛速發展,大規模預訓練模型已成為當前研究的熱點。其中,語言模型和時序大模型作為兩類重要的模型架構,分別在自然語言處理和時間序列分析領域展現出卓越的性能。然而,這兩類模型在基本原理和應用場景上存…

【Excel數據分析】花垣縣事業單位出成績了,用Excel自帶的M語言做一個數據分析

這里寫自定義目錄標題 花垣縣事業單位出成績了,用Excel自帶的M語言做一個數據分析需求 花垣縣事業單位出成績了,用Excel自帶的M語言做一個數據分析 Power Query M 語言,簡稱 M 語言,全名叫 Power Query Formula Language。 需求…

微處理器原理與應用篇---音頻采集與串口傳輸功能的系統設計

這段內容是基于 STM32F407VGT6 單片機,實現音頻采集與串口傳輸功能的嵌入式系統設計方案,包含硬件架構、軟件邏輯和代碼實現,核心是通過 ADC 采集音頻、串口收發指令與數據 ,以下分模塊拆解: 一、系統設計概述 硬件&…