3D 生成重建014-Bidiff使用二維和三維先驗的雙向擴散

3D 生成重建014-Bidiff使用二維和三維先驗的雙向擴散


文章目錄

    • 0 論文工作
    • 1 論文方法
    • 2 效果

0 論文工作

大多數三維生成研究集中在將二維基礎模型向上投影到三維空間中,要么通過最小化二維評分蒸餾采樣(SDS)損失,要么通過對多視圖數據集進行微調。由于缺乏顯式的三維先驗,這些方法經常導致幾何異常和多視圖不一致。近來研究人員試圖通過直接在三維數據集上進行訓練來改善三維物體的質量,其代價是生成的紋理質量較低,因為三維數據集中有限的紋理多樣性。為了利用這兩種方法的優勢,作者提出了雙向擴散(BiDiff),這是一個同時包含3D和2D的統一框架擴散過程中,二者分別服務于三維保真度和二維紋理豐富度。此外,由于一個簡單的組合可能會產生不一致的生成結果,論文用bidiff把他們連接起來。
這篇論文旨在解決當前文本到三維生成方法的局限性,特別是幾何異常和多視角不一致的問題,并提出一種名為 BiDiff (Bidirectional Diffusion) 的新方法,以生成高質量、細節豐富且三維一致的模型。
其實這個地方已經可以看到SyncDreamer和SyncMVD的味道了

1 論文方法

BiDiff 的核心思想是將預訓練的二維和三維擴散模型結合起來,并利用雙向引導機制來同步兩個擴散過程,從而學習一個聯合的二維和三維先驗。
在這里插入圖片描述
1方法概述:
混合表示: 使用 SDF (Signed Distance Field) 表示三維特征,使用多視角圖像表示二維特征。
雙向擴散: 分別訓練一個三維擴散模型和一個二維擴散模型,并通過雙向引導機制進行聯合微調。
二維引導三維: 將二維擴散模型去噪后的多視角圖像投影到三維空間,引導三維擴散模型的去噪過程。
三維引導二維: 將三維擴散模型去噪后的 SDF 渲染成多視角圖像,引導二維擴散模型的去噪過程。
2. 優勢:
高質量紋理: 利用預訓練的二維擴散模型,BiDiff 可以生成比僅使用三維數據集訓練的模型更豐富的紋理細節。
三維一致性: 通過雙向引導機制,BiDiff 確保了生成的三維模型在不同視角下的一致性。
可控性: BiDiff 可以分別控制紋理和幾何形狀的生成,例如,在保持形狀不變的情況下改變紋理,或在保持紋理風格不變的情況下改變形狀。
高效性: 相比于基于優化的文本到三維生成方法,BiDiff 的生成速度更快。
3. 其他特點:
利用三維先驗: BiDiff 使用 Shap-E 作為三維先驗,并引入噪聲以避免過度依賴先驗模型。
與優化方法結合: BiDiff 的輸出可以作為優化方法的初始化,進一步提升模型質量和效率。
4. 額外的分析:
創新性: BiDiff 的創新性主要體現在雙向引導機制,它有效地將二維和三維擴散過程結合起來,并利用兩個先驗模型的優勢。
局限性: 論文中沒有與其他最新的文本到三維生成方法進行詳細的比較,例如DreamFusion, ProlificDreamer等。
未來方向: 可以探索更強大的二維和三維擴散模型,以及更有效的引導機制,進一步提升生成質量和效率。

2 效果

在這里插入圖片描述

本文來自互聯網用戶投稿,該文觀點僅代表作者本人,不代表本站立場。本站僅提供信息存儲空間服務,不擁有所有權,不承擔相關法律責任。
如若轉載,請注明出處:http://www.pswp.cn/bicheng/15419.shtml
繁體地址,請注明出處:http://hk.pswp.cn/bicheng/15419.shtml
英文地址,請注明出處:http://en.pswp.cn/bicheng/15419.shtml

如若內容造成侵權/違法違規/事實不符,請聯系多彩編程網進行投訴反饋email:809451989@qq.com,一經查實,立即刪除!

相關文章

判斷變量是否為數組的幾種方法

1、isArray 方法 isArray() 方法用于判斷一個對象是否為數組。如果對象是數組返回 true,否則返回 false。 Array.isArray(arr); // true 1 2、對象原型 通過原型鏈判斷是否具有和數組同一原型鏈的頂端。 arr.__proto__ Array.prototype; // true 1 3、instanceof…

[數據結構] -- 雙向循環鏈表

🌈 個人主頁:白子寰 🔥 分類專欄:C打怪之路,python從入門到精通,數據結構,C語言,C語言題集👈 希望得到您的訂閱和支持~ 💡 堅持創作博文(平均質量分82)&#…

一文理清database/sql包的使用場景和宕機查詢流程

一文理清database/sql包你可能遇到的問題 那么database/sql包實現了什么功能呢?建立數據庫連接檢測連接是否能ping通通過連接進行具體的sql查詢查詢完將連接進行關閉當數據庫宕掉重啟后再次查詢 database/sql包創建的db連接 對于數據庫宕掉后重啟是否仍然有效&#…

AI繪畫工具:創意與技術的完美融合

隨著人工智能技術的飛速發展,我們見證了無數領域的革新與變革。其中,AI繪畫工具的出現,無疑為藝術界帶來了一股清新的風潮。這些工具以其獨特的魅力,吸引了無數藝術家和創意人士的目光,成為他們表達自我、探索未知的重…

Compose在xml中使用滑動沖突處理

一、背景 在現有Android項目中使用Compose可能存在滑動沖突問題,例如 SmartRefreshLayoutCoordinatorLayoutComposeView(ComposeView這里又是一個LazyColumn) 二、解決方案 官方介紹:https://developer.android.google.cn/develop/ui/compose/touch-inp…

huggingface 筆記:device_map

1 基本映射方法 設計設備映射時,可以讓Accelerate庫來處理設備映射的計算通過設置device_map為支持的選項之一("auto"、 "balanced"、 "balanced_low_0"、 "sequential");或者如果想更精…

golang的context和chan 的使用

1. context 作用 context包的context的接口,主要是控制協程執行上下文的時間,以及取消程序的執行,以及上下文中傳遞數據等作用,golang中耗時或者需要協同的操作都會見到context的身影。 context有幾個常用的方法 1.1 context.B…

用爬山算法解決離散的優化問題

爬山算法,也稱為梯度上升算法或局部搜索算法,是一種簡單有效的優化算法,常用于解決連續或離散的優化問題。爬山算法的基本思想是從一個隨機的初始點開始,通過迭代地向局部最優的方向移動,逐步逼近全局最優解。 爬山算…

git管理Codeup云效平臺

HTTPS方式實現Git命令 1.進入項目路徑,如 cd demo,與此同時,在Codeup平臺創建一個空倉庫repo,獲取空倉庫的https協議地址,例如 https://codeup.aliyun.com/xxxx/xxxx/xxx.git。 2.在demo項目下執行 git init命令初始化…

從反向傳播(BP)到BPTT:詳細數學推導【原理理解】

從反向傳播到BPTT:詳細推導與問題解析 在本文中,我們將從反向傳播算法開始,詳細推導出反向傳播通過時間(Backpropagation Through Time, BPTT)算法。重點討論BPTT中的梯度消失和梯度爆炸問題,并解釋如何解…

采用LoRA方法微調llama3大語言模型

文章目錄 前言一、Llama3模型簡介1.下載llama3源碼到linux服務器2.安裝依賴3.測試預訓練模型Meta-Llama-3-8B4.測試指令微調模型Meta-Llama3-8B-Instruct5.小結 二、LoRA微調Llama31.引入庫2.編寫配置文件3.LoRA訓練的產物 三、測試新模型效果1.編寫配置文件2.運行配置文件&…

QT教程-一,初識QT

目錄 一,QT是什么?能夠使用它做什么? 二,Qt 能夠使用的語言 三,Qt主要用于什么領域? 四,Qt開發的軟件 一,QT是什么?能夠使用它做什么? Qt是一個跨平臺的 C 開發庫,主…

全球最高點贊記錄,世界點贊第一名是誰?世界點贊第一人名字的由來

世界點贊第一人名字的由來: 起源與概念提出: 二十一世紀東方偉大的思想家哲學家教育家顏廷利教授,一位在中國21世紀早期便以其非凡才華和創新精神著稱的學者,早在互聯網尚未普及的20世紀90年代,就已經提出了“點贊”的…

算法提高之最大數

算法提高之最大數 核心思想&#xff1a;線段樹 添加數 看作原本的數組有數(0) 現在將他修改成另一個值 詢問后l個數的最大值query函數具體實現 #include <iostream>#include <cstring>#include <algorithm>using namespace std;const int N 200010;typed…

python爬蟲登錄到海康相機管理頁面

簡述 1.最近接到個任務是在管理頁面更改相機的某個參數&#xff0c;下載官方的sdk貌似沒有提供這個接口&#xff0c;所以只能自己寫爬蟲登錄發請求了。 1.主要步驟 1.1 發送get請求獲取到salt&#xff0c;sessionID&#xff0c;challenge等信息 http://admin:123456192.168.…

交叉熵損失函數計算過程(tensorflow)

交叉熵損失函數通常用于多類分類損失函數計算。計算公式如下&#xff1a; P為真實值&#xff0c;Q為預測值。 使用tensorflow計算 import tensorflow as tf import keras# 創建一個示例數據集 # 假設有3個樣本&#xff0c;每個樣本有4個特征&#xff0c;共2個類別 # 目標標簽…

Spark Client 配置

前言 記錄Spark Client 配置,這里的 Spark Client 和 HDFS、YARN 不在一個節點,只是一個單節點的 Spark Client,需要能連接其他節點的大數據集群的 Hive 和 能提交到Yarn 。 環境信息 大數據節點(已配置好Spark): 192.168.44.154 192.168.44.155 192.168.44.156 客戶端…

P2P 技術:點對點網絡的興起

目錄 概述 P2P 的興起 P2P 的定義和特征 定義 特征 P2P 的發展 早期發展 快速成長 成熟應用 P2P 的關鍵技術 P2P 的應用 總結 概述 P2P&#xff08;Peer-to-Peer&#xff09;&#xff0c;即點對點網絡&#xff0c;是一種去中心化的網絡架構&#xff0c;它允許網絡中…

2024最新私有化部署AI大模型,讓每個人都有屬于自己的AI助理

讓每個人都擁有一個屬于自己的本地大模型 下載Ollama 下載地址 ? https://ollama.com/download ? Ollama支持MacOS、Linux、Windows 解壓 下載完成后&#xff0c;會得到一個Ollama-darwin.zip文件&#xff0c;解壓后&#xff0c;以Mac為例是一個可運行文件&#xff1a;O…

Jupyter 使用手冊: 探索交互式計算的無限可能

什么是 Jupyter? Jupyter 是一個開源的 Web 應用程序,可用于創建和共享包含實時代碼、可視化和敘述性文本的文檔。它最初是作為 IPython 項目的一部分開發的,后來發展成為支持多種編程語言的交互式計算環境。 應用場景 作為一個開源的交互式計算環境,Jupyter 在以下幾個領域…