3D 生成重建011-LucidDreamer 優化SDS過平滑結果的一種探索

3D 生成重建011-LucidDreamer 優化SDS過平滑結果的一種探索


文章目錄

    • 0論文工作
    • 1論文方法
    • 2 效果

0論文工作

文本到3D生成的最新進展標志著生成模型的一個重要里程碑,為在各種現實場景中創建富有想象力的3D資產打開了新的可能性。雖然最近在文本到3D生成方面的進展顯示出了希望,但它們在渲染詳細和高質量的3D模型方面往往不足。這個問題特別普遍,因為有許多方法都可以使用蒸餾取樣(SDS)。本文指出了SDS的一個明顯缺陷,即它給三維模型帶來了不一致和低質量的更新方向,導致了過度更新平滑作用為了解決這個問題,我們提出了一種新的方法,稱為間隔分數匹配(ISM)。ISM采用確定性擴散軌跡,并利用基于區間的分數匹配部分過度平滑。此外,我們將**三維高斯濺(3D GS)**合并到我們的文本到三維生成管道中。大量的實驗表明,我們的模型在很大程度上優于最先進的技術質量和培訓效率。
LucidDreamer 旨在解決從文本提示生成高保真三維形狀的挑戰。該論文指出了現有文本到三維方法的關鍵局限性,特別是它們難以在樣本質量和多樣性之間取得平衡。LucidDreamer 以區間得分匹配 (ISM) 為中心的新方法,用于三維生成的擴散模型,從而緩解了這些問題。實際上這種sds相減在magic123和sparsefusion等3d生成都用了相似的技巧,只不過不同作者選擇了不同的解釋角度。甚至在紋理生成也使用了類似技巧。

1論文方法

  1. 現有方法存在的問題:
    多樣性有限: 許多文本到三維模型優先考慮生成與文本一致的合理形狀,這通常會導致多樣性低和輸出重復。
    質量和多樣性之間的權衡: 在高保真度細節和生成形狀的廣泛性之間取得平衡是一項重大挑戰。
    下圖是論文的結構圖,可以發現論文的結構上與SDS優化流派的方法保持一樣的結構,一個3d表示,渲染新視圖,SDS優化。不同的是論文是早期使用3d gaussian splatting表示的方法。另外論文使用了DDIM和ISM等不同處理。
    此外論文用一個圖對SDS過平滑進行一個可視化。簡單來說,多次的降噪就是在對不同降噪結果直接求了平均,會導致過平滑。
    在這里插入圖片描述

在這里插入圖片描述

  1. LucidDreamer 的解決方案:
    a) 區間得分匹配 (ISM): 這是 LucidDreamer 創新的核心。 ISM 為訓練用于三維形狀生成的擴散模型提供了一種新方法。
  • 核心理念: ISM 不是直接預測噪聲數據分布,而是側重于學習數據兩個擾動版本之間的差異(得分)。這允許更有效的訓練并更好地捕獲底層數據流形,從而生成更高質量的樣本。
  • 工作原理:
    1. 使用不同的噪聲級別對目標三維形狀的兩個噪聲版本進行采樣。
    2. 訓練擴散模型以預測這兩個噪聲版本之間的得分(矢量差)。
    3. 在生成過程中,模型通過迭代應用學習到的得分信息來逐漸對隨機三維形狀進行去噪。
      b) 用于文本引導生成的得分蒸餾: 為了使用文本提示引導生成過程,LucidDreamer 使用了得分蒸餾。
  • 訓練文本到得分網絡: 訓練一個單獨的網絡將文本描述映射到相應的三維形狀得分。該網絡充當文本域和三維形狀域之間的“翻譯器”。
  • 引導生成: 在生成過程中,來自文本到得分網絡的得分會影響擴散過程,確保生成的三維形狀與給定的文本提示一致。為了克服多面問題,論文還插入一個3d先驗模塊。
  1. LucidDreamer 的優勢:
    高保真生成: 通過利用 ISM,LucidDreamer 可以生成具有令人印象深刻的細節和真實感的三維形狀。
    增強的多樣性: 與現有方法相比,使用 ISM 有助于生成更廣泛的多樣化形狀,解決了輸出重復的問題。
    有效的文本引導: 得分蒸餾方法使模型能夠有效地整合文本信息,確保生成的三維形狀與輸入提示之間語義一致。
    此外論文用一個圖對SDS過平滑進行一個可視化。簡單來說,多次的降噪就是在對不同降噪結果直接求了平均,會導致過平滑。

2 效果

在這里插入圖片描述

本文來自互聯網用戶投稿,該文觀點僅代表作者本人,不代表本站立場。本站僅提供信息存儲空間服務,不擁有所有權,不承擔相關法律責任。
如若轉載,請注明出處:http://www.pswp.cn/web/14930.shtml
繁體地址,請注明出處:http://hk.pswp.cn/web/14930.shtml
英文地址,請注明出處:http://en.pswp.cn/web/14930.shtml

如若內容造成侵權/違法違規/事實不符,請聯系多彩編程網進行投訴反饋email:809451989@qq.com,一經查實,立即刪除!

相關文章

自建公式,VBA在Excel中解一元一次方程

自建公式,VBA在Excel中解一元一次方程 文章目錄 前言一、運行效果圖二、操作思路三、代碼1.去除方程中未知數,將未知數轉為“*0”2.計算方程中常數3.計算方程中未知數的系數一,先將未知數替換成“*1”4.計算方程中未知數的系數二5.計算方程得數前言 小學必考內容:一元一次…

掌握Python基本語法的終極指南【基本語法部分】

一、基本語法部分 1.簡單數據類型 1.1字符串類型及操作 字符串訪問: 1.索引訪問 mystr"Hello world" #索引訪問 print(mystr[0]) #H print(mystr[-1]) #d print(mystr[-7]) #o print(mystr[6]) #w 2.切片訪問 [頭下標:尾下標] &#x…

齊護K210系列教程(三十二)_在線模型訓練

在線模型訓練 概念理解準備工作1 采集圖像1.1 圖像要求1.2 使用K210采集圖片 2 標注圖像3 打包數據集4 上傳數據4.1創建項目4.1.1圖像分類創建項目4.1.2圖像檢測創建項目 4.2上傳數據4.2.1分類檢測上傳數據4.2.2圖像檢測上傳數據 5 訓練模型6 部署模型以及測試7 測試效果7.1圖像…

leetcode 152. 乘積最大子數組

. - 力扣(LeetCode) 給你一個整數數組 nums ,請你找出數組中乘積最大的非空連續 子數組 (該子數組中至少包含一個數字),并返回該子數組所對應的乘積。 測試用例的答案是一個 32-位 整數。 示例 1: 輸入…

MongoDB關系處理:優化數據管理、提升性能的最佳實踐

MongoDB 是一種 NoSQL 數據庫,它使用文檔模型來存儲數據,這與關系型數據庫(RDBMS)有顯著不同。本文將詳細介紹 MongoDB 中的關系處理,包括基本語法、命令、示例、應用場景、注意事項和總結。 基本語法 文檔和集合 M…

30.靜態代碼分析工具clang-tidy

文章目錄 基本介紹安裝clang-tidy使用clang-tidy配置文件和格式文件配置文件格式文件使用配置文件和格式化文件 在代碼中設置排除clang-tidy檢測reference 歡迎訪問個人網絡日志🌹🌹知行空間🌹🌹 基本介紹 clang-tidy 是一個基于…

JDBC總結

目錄 JDBC(java database connection) JDBC連接數據庫步驟: 1. 在項目中添加jar文件,如圖所示 2.加載驅動類 向數據庫中插入數據代碼示例: 第一種: 第二種: 查詢操作 : 第一種: 第二種: JDBC(java database connection) java數據庫連接.api(應用程序編程接口) ,可…

Java中的垃圾回收機制

在Java編程語言中,垃圾回收(Garbage Collection, GC)機制是內存管理的一個核心部分。它的主要目標是自動釋放那些不再被程序使用的對象所占用的內存空間,從而防止內存泄漏,并確保程序的穩定運行。下面,我將…

一文講清!傳統企業的進銷存管理難題該怎么解決?

有沒有開源的進銷存軟件啊? 確實,市面上存在不少開源的進銷存軟件。但客觀地講,開源軟件往往面臨著安全隱患,因為代碼公開,容易成為黑客攻擊的目標。此外,開源軟件的功能模塊通常較為固定,難以…

初出茅廬的小李博客之MQTT.fx客戶端接入EMQX Platform

EMQX Platform 概覽 EMQX Platform 是 EMQ 推出的一款面向物聯網領域的 MQTT 消息中間件產品。作為全球首個 MQTT 5.0 消息云服務,EMQX Platform 提供了一站式運維代管、獨有隔離環境的 MQTT 消息服務。在萬物互聯的時代,EMQX Platform 可以幫助您快速構…

python數據類型之列表

目錄 1.創建列表 2.列表基礎操作 常用操作 對列表元素順序隨機打亂 列表下標和切片 字符串分割為列表 列表位移 列表切片替換 3.列表內置方法 4.列表排序 簡單排序 使用key參數按指定規則排序 二維列表排序 自定義排序規則函數 5.列表排序算法 選擇排序 柱狀圖…

C# 利用Xejen框架源碼,我們來開發一個基于Dapper技術的數據庫通用的幫助訪問類,通過Dapper的增刪改查,可以訪問Sqlite數據庫

Dapper 是一個輕量級的對象關系映射(ORM)工具,適用于 .NET 平臺。它由 Stack Overflow 團隊開發,旨在提供簡單、高效的數據訪問功能。與其他重量級 ORM(如 Entity Framework)相比,Dapper 更加輕…

基于Python圖像增強算法:低光增強+圖像修復+超分辨率重建

歡迎大家點贊、收藏、關注、評論啦 ,由于篇幅有限,只展示了部分核心代碼。 文章目錄 一項目簡介 二、功能三、系統四. 總結 一項目簡介 一、項目背景與意義 在圖像處理與計算機視覺領域,圖像增強技術是提高圖像質量和可用性的重要手段。在實…

單片機io擴展

輸入輸出擴展 i2c擴展 方案1:PCF8575 PCF8575雙向IO口擴展模塊 16位輸入輸出I2C通訊 單片機級聯擴展板 方案2:PCA955A 輸出擴展 74HC595 io口擴展模塊輸出口擴展 參考鏈接 中微愛芯發[2004] 1號           簽發人: (szlcsc.com)https://…

? Vscode和Idea都可以使用的-AI插件(官方-百度出的)

? Vscode和Idea都可以使用的-AI插件(官方-百度出的) 最新AI特別火,給大家推薦一下最新出的VScode插件,輔助我們寫代碼! 1、下載地址: > https://comate.baidu.com/zh/shopping?inviteCodefkzlak8f …

jmeter中Ultimate Thread Group設計梯度壓測場景

Ultimate Thread Group Ultimate Thread Group 線程組是模擬波浪式壓測或者階梯式負載壓測 1、Start Threads Count:線程數量 2、Initial Delay,sec:每組開始添加到測試執行之前的延遲(xx秒開始啟動線程) 3、Startu…

python中的線程并行

文章目錄 1. 單線程2. 線程池ThreadPoolExecutor 1. 單線程 現在有1154張圖片需要順時針旋轉后保存到本地,一般使用循環1154次處理,具體代碼如下所示,img_paths中存儲1154個圖片路徑,該代碼段耗時約用97ms。 t1time.time() for …

Python筑基之旅-MySQL數據庫(四)

目錄 一、數據表操作 1、新增記錄 1-1、用mysql-connector-python庫 1-2、用PyMySQL庫 1-3、用PeeWee庫 1-4、用SQLAlchemy庫 2、刪除記錄 2-1、用mysql-connector-python庫 2-2、用PyMySQL庫 2-3、用PeeWee庫 2-4、用SQLAlchemy庫 3、修改記錄 3-1、用mysql-conn…

Java輕松轉換Markdown文件到Word和PDF文檔

Markdown 憑借其簡潔易用的特性,成為創建和編輯純文本文檔的常用選擇。但某些時候我們需要更加精致的展示效果,例如在專業分享文檔或打印成離線使用的紙質版時,就需要將Markdown文件以其他固定的文檔格式呈現。通過將 Markdown 轉換為 Word 和…

OpenHarmony實戰開發——網絡組件axios可以在OpenHarmony上使用了

什么是axios 上古瀏覽器頁面在向服務器請求數據時,因為返回的是整個頁面的數據,頁面都會強制刷新一下,這對于用戶來講并不是很友好。并且我們只是需要修改頁面的部分數據,但是從服務器端發送的卻是整個頁面的數據,十分…