【EGSR2025】材質+擴散模型+神經網絡相關論文整理隨筆(二)

High-Fidelity Texture Transfer Using Multi-Scale Depth-Aware Diffusion

這篇文章可以從一個帶有紋理的幾何物體出發,將其身上的紋理自動提取并映射到任意的幾何拓撲結構上(見下圖紅線左側);或者從一個白模幾何對象出發,將任意類型的紋理映射到其身上(見下圖紅線右側):
在這里插入圖片描述
該文章主要應用預訓練的擴散模型來搭建了一個3D紋理遷移框架。具體來說,作者們設計了一個多尺度的生成框架來從粗糙到精細地優化UV maps,同時為了確保多視角下的一致性,該文章使用了深度信息作為幾何上的引導,同時提出一個新的一致性損失來進一步限制顏色的一致性以及減少artifacts。實驗結果證明這個多尺度的框架不僅產生了高質量的紋理遷移結果,還能很好地處理復雜形狀并保持正確的語義對應關系。

下圖展示了這篇文章的overview:
圖1
第一個階段,先在兩個不同的尺度上生成粗糙的目標UV map,生成過程中以reference物體的多視角圖像和深度maps({I}ref和{D}ref),和target物體的深度maps({D}tar【1】)作為條件。
第二個階段,精煉的高分辨率的紋理細節。

【1】博主注:這里原文中對應位置的符號寫成了{D}ref,應該是標注錯誤了,如果作者看到,請及時修正。

下面在下圖中介紹紋理生成細節:
在這里插入圖片描述
(a)先將多個視角下的圖像{I}ref、{I}lowtar通過編碼器Encoder各自編碼到latent空間,然后對其通過DDIM逆向加噪到第T 步,隨后和深度maps{D}ref、{D}tar concatenate到一起,作為TexTrans模塊的輸入,最終生成紋理遷移后的多個視圖的結果。目標物體的幾何默認是已知的,這時候由于還知道了不同視角下的生成結果(可以看成rendering結果),那么就可以通過可微渲染來優化出粗糙的紋理map Tcoarsetar來了(理論上camera和light也應該是已知的,我估計是作者架設了已知,反正采用的是合成數據集)。
(b)這個階段的核心是深度感知的自注意力特征注入,也就是上圖(b)部分,我們來看看是怎么個回事兒:使用深度信息的引導將紋理或者外觀從源物體遷移到目標物體上,生成的過程將會迭代兩次,對應不同尺度的圖像分辨率。第一次迭代過程中,采用ZTref(也就是參考圖像多視圖經過編碼器Encoder得到的隱向量)來進行初始化目標物體的多個視圖。參考下面這個圖,來理解是怎么將reference物體的紋理遷移到目標物體的:
在這里插入圖片描述
首先,在圖(b)中我們能清晰的看到,作者使用了兩個controlnet-based diffusion model分別以reference物體和target物體的多視圖圖像為輸入,分別以他們的深度圖為條件,來進行降噪處理。但是呢,可以清楚的看到處理reference物體的diffusion model交叉注意力部分引出來一個箭頭,指向了處理target物體的diffusion model的交叉注意力部分,這里就是對應上面這個圖的核心部分。這個模塊的作用就是把reference物體的紋理給搞過來。那你可能想了,這么搞不會破壞掉target這邊生成時的幾何形狀嗎?嘿,還真不會,因為在訓練時target的這部分還輸入了深度信息,只要深度信息作為條件,基本上很難修改生成過程的整體輪廓、結構了,所以作者說這部分既能保證全局信息,還能專注于每個單獨視角的細節。本質上是幾何的深度信息為擴散模型提供了整體形狀強先驗,而交叉注意力模塊中部分注意力矩陣的復用只是為了把紋理信息遷移過來。

本文來自互聯網用戶投稿,該文觀點僅代表作者本人,不代表本站立場。本站僅提供信息存儲空間服務,不擁有所有權,不承擔相關法律責任。
如若轉載,請注明出處:http://www.pswp.cn/diannao/90989.shtml
繁體地址,請注明出處:http://hk.pswp.cn/diannao/90989.shtml
英文地址,請注明出處:http://en.pswp.cn/diannao/90989.shtml

如若內容造成侵權/違法違規/事實不符,請聯系多彩編程網進行投訴反饋email:809451989@qq.com,一經查實,立即刪除!

相關文章

深度學習圖像分類數據集—玉米粒質量識別分類

該數據集為圖像分類數據集,適用于ResNet、VGG等卷積神經網絡,SENet、CBAM等注意力機制相關算法,Vision Transformer等Transformer相關算法。 數據集信息介紹:玉米粒質量識別分類:[crush, good, mul] 訓練數據集總共有3…

Unity VR手術模擬系統架構分析與數據流設計

Unity VR手術模擬系統架構分析與數據流設計 前言 本文將深入分析一個基于Unity引擎開發的多人VR手術模擬系統。該系統采用先進的網絡架構設計,支持多用戶實時協作,具備完整的手術流程引導和精確的工具交互功能。通過對系統架構和數據管道的詳細剖析&…

【Spring Boot】Spring Boot 4.0 的顛覆性AI特性全景解析,結合智能編碼實戰案例、底層架構革新及Prompt工程手冊

Spring Boot 4.0 的顛覆性AI特性全景解析,結合智能編碼實戰案例、底層架構革新及Prompt工程手冊一、Spring Boot 4.0 核心AI能力矩陣二、AI智能編碼插件實戰(Spring AI Assistant)1. 安裝與激活2. 實時代碼生成場景3. 缺陷預測與修復三、AI引…

audiobookshelf-web 項目怎么運行

git clone https://github.com/audiobookshelf/audiobookshelf-web.git cd audiobookshelf-web npm i 啟動項目 npm run dev http://localhost:3000/

掃描文件 PDF / 圖片 糾斜 | 圖片去黑邊 / 裁剪 / 壓縮

問題:掃描后形成的 PDF 或圖片文檔常存在變形傾斜等問題,手動調整頗為耗時費力。 一、PDF 糾斜 - Adobe Acrobat DC 1、所用功能 掃描和 OCR: 識別文本:在文件中 → 設置 確定后啟動掃描,識別過程中自動糾偏。 2、…

適配器模式:兼容不兼容接口

將一個類的接口轉換成客戶端期望的另一個接口,解決接口不兼容問題。代碼示例:// 目標接口(客戶端期望的格式) interface ModernPrinter {void printDocument(String text); }// 被適配的舊類(不兼容) class…

流程控制:從基礎結構到跨語言實踐與優化

流程控制 一、流程控制基礎概念與核心價值 (一)流程控制定義與本質 流程控制是通過特定邏輯結構決定程序執行順序的機制,核心是控制代碼運行路徑,包括順序執行、條件分支、循環迭代三大核心邏輯。其本質是將無序的指令集合轉化為有…

Http與Https區別和聯系

一、HTTP 詳解 HTTP(HyperText Transfer Protocol)?? 是互聯網數據通信的基礎協議,用于客戶端(瀏覽器)與服務器之間的請求-響應交互 核心特性??: 1.無連接(Connectionless)??…

飛算JavaAI:開啟 Java 開發 “人機協作” 新紀元

每日一句 明天是新的一天, 你也不再是昨天的你。 目錄每日一句一、需求到架構:AI深度介入開發“源頭設計”1.1 需求結構化:自然語言到技術要素的精準轉化1.2 架構方案生成:基于最佳實踐的動態適配二、編碼全流程:從“…

Qt項目鍛煉——TODO(五)

發現問題如果是自己創建的ui文件,怎么包含進自己的窗口類并且成為ui成員?一般來說Qt designer 會根據你.ui文件生成對應的ui_文件名這個類(文件名是ui文件名),它包含了所有 UI 組件(如按鈕、文本框、標簽等…

Vue框架之模板語法全面解析

Vue框架之模板語法全面解析一、模板語法的核心思想二、插值表達式:數據渲染的基礎2.1 基本用法:渲染文本2.2 純HTML渲染:v-html指令2.3 一次性插值:v-once指令三、指令系統:控制DOM的行為3.1 條件渲染:v-if…

從零開始的語言模型構建 CS336 第一課(一)

語言模型的發展歷史 🏗 Early foundation models (2010年代后期) 2018:ELMo(基于 LSTM 預訓練 微調)[Peters 2018]2018:BERT(基于 Transformer 預訓練 微調)[Devlin 2018]2019:G…

微信獲取access_token授權的兩種不同情況

1.網頁授權:需要頁面調用授權的sdk,首先需要獲取到code參數 (A.網頁版的獲取code參考另一篇文章:https://blog.csdn.net/ettamei/article/details/148763361?spm1011.2415.3001.5331 B.前端sdk提供:code只有5分鐘的有…

達夢數據庫windows靜默安裝

<DATABASE> <!-- 安裝數據庫的語言配置&#xff0c;簡體中文版: ZH&#xff0c;繁體中文版: CHT&#xff0c;英文版: EN&#xff0c;不區分大小寫。不允許為空 --> <LANGUAGE>ZH</LANGUAGE> <!-- 安裝程序的時區配置&#xff0c;缺省為08:00&#…

20250709榮品RD-RK3588開發板的Android13系統下修改為連續長按10s開機

20250709榮品RD-RK3588開發板的Android13系統下修改為連續長按10s開機 2025/7/9 10:11緣起&#xff1a;由于榮品RD-RK3588開發板使用的PMIC是RK806。 以前在榮品PRO-RK3566開發板上使用的PMIC是RK809上做過了長按開機的。 直接遷移過來了&#xff01;1、根據RK809的DATASHEET&a…

20250713-`Seaborn.pairplot` 的使用注意事項

Seaborn.pairplot 的使用注意事項 sns.pairplot 是 Seaborn 中最常用、最強大的探索性數據分析&#xff08;EDA&#xff09;函數之一。 它在一個調用里就能同時展示&#xff1a; 任意兩兩變量間的 散點圖&#xff08;觀察關系、聚類、異常值&#xff09;對角線上每個變量的 單…

如何選擇合適的AI論文寫作工具?七個AI英文論文寫作網站

在寫作英文論文時&#xff0c;許多人往往會遇到寫作思路卡殼、語言不流暢、重復率過高等問題。幸運的是&#xff0c;AI論文寫作工具的出現&#xff0c;極大地提升了寫作效率和質量。這些工具不僅可以幫你快速生成內容、擴展論點&#xff0c;還可以優化語言&#xff0c;幫助你順…

【保姆級喂飯教程】idea中安裝Conventional Commit插件

目錄前言一、安裝二、測試前言 之前了解到了Conventional Commit規范&#xff0c;idea中好像沒什么鉤子工具&#xff0c;測試一下Conventional Commit插件吧 一、安裝 點擊file-settings 點擊plugins插件&#xff0c;搜索Conventional Commit&#xff0c;點擊install安裝&…

# 電腦每次重啟都自動啟動惠普安裝程序,怎么取消?

電腦每次重啟都自動啟動惠普安裝程序&#xff0c;怎么取消&#xff1f; 一、通過任務管理器禁用&#xff1a; 1&#xff09;右鍵點擊任務欄上的空白區域&#xff0c;選擇 “任務管理器”。 2&#xff09;在任務管理器窗口中&#xff0c;點擊頂部菜單欄上的 “啟動” 選項卡。 3…

QT遇到過的樣式記錄

此帖主要記錄平常工程里遇到的qt樣式 窗口無邊框 原始文檔 void QWidget::setWindowFlag(Qt::WindowType flag, bool on true) Sets the window flag flag on this widget if on is true; otherwise clears the flag. This function was introduced in Qt 5.9. See also se…