?CVPR2025 3D 生成新框架|Kiss3DGen 讓 2D 擴散模型玩轉 3D 資產生成

?CVPR 3D 生成新框架|Kiss3DGen 讓 2D 擴散模型玩轉 3D 資產生成
📄論文題目:Kiss3DGen: Repurposing Image Diffusion Models for 3D Asset Generation
??作者及機構:Jiantao Lin、Xin Yang、Meixi Chen 等(HKUST (GZ)、HKUST、廣州趣丸網絡技術)
🧩面臨問題:當前 3D 內容生成在質量和泛化性上存在局限。一方面,優化型方法(如 DreamFusion)需密集迭代優化,推理耗時;另一方面,直接生成法(如 InstantMesh)依賴大規模 3D 數據集,但高質量 3D 數據稀缺(Objaverse-XL 約 70% 數據存在紋理缺失等問題)。此外,2D 擴散模型雖含強大 3D 先驗,卻多僅生成 depth/normal 等 2.5D 表示,無法支持完整 3D 生成。
🎯創新點及其具體研究方法:
1?? 提出 “3D Bundle Image” 表示與 Kiss3DGen 基礎框架:將 3D 物體渲染為 4 個視角的 RGB 圖及對應法線圖,組合為 “3D Bundle Image” 這一 2D 表示,將 3D 生成轉化為 2D 圖像生成任務,最大化復用預訓練 2D 擴散模型知識。通過 GPT-4V 為 Bundle Image 生成描述性文本,結合 LoRA 微調 Flux 模型得到 Kiss3DGen-Base,實現文本驅動生成 Bundle Image,再經 ISOMER 重建 3D 網格。
2?? 集成 ControlNet 擴展多任務能力:提出 Kiss3DGen-ControlNet,通過 ControlNet 實現 3D 增強、編輯和圖像到 3D 生成。3D 增強中用 ControlNet-Tile 優化低質量網格的紋理和幾何細節;3D 編輯通過調整 ControlNet 權重(λ?=0.3、λ?=0.5)支持屬性修改;圖像到 3D 則先由 InstantMesh 生成粗網格,再經增強 pipeline 優化。
3?? 小數據高效訓練機制:對 Objaverse 數據集精篩得到 147k 高質量 3D 物體,僅用 3 天在 8 張 A800 GPU 上完成訓練;即使縮減至 50k 數據集,在文本到 3D、圖像到 3D 等任務中仍保持競爭力,驗證數據效率優勢。

在這里插入圖片描述
在這里插入圖片描述
在這里插入圖片描述
在這里插入圖片描述
在這里插入圖片描述

本文來自互聯網用戶投稿,該文觀點僅代表作者本人,不代表本站立場。本站僅提供信息存儲空間服務,不擁有所有權,不承擔相關法律責任。
如若轉載,請注明出處:http://www.pswp.cn/news/917693.shtml
繁體地址,請注明出處:http://hk.pswp.cn/news/917693.shtml
英文地址,請注明出處:http://en.pswp.cn/news/917693.shtml

如若內容造成侵權/違法違規/事實不符,請聯系多彩編程網進行投訴反饋email:809451989@qq.com,一經查實,立即刪除!

相關文章

HTTP基本結構

目錄前言1. 概念2. HTTP基本格式2.1 抓包原理2.2 抓包軟件使用2.3 抓包結果3. HTTP請求3.1 URL3.2 方法3.3 版本號3.4 HTTP報頭3.4 正文部分4. HTTP響應4.1 HTTP狀態碼4.2 其他部分總結前言 本篇文章介紹HTTP的基本結構。 1. 概念 HTTP全稱為超文本傳輸協議,是一…

CVPR優秀論文 | DashGaussian:在200秒內優化三維高斯點繪制

本文選自gongzhonghao【圖靈學術SCI論文輔導】關注我們,掌握更多頂會頂刊發文資訊1.導讀1.1 論文基本信息論文標題:DashGaussian: Optimizing 3D Gaussian Splatting in 200 Seconds作者:Youyu Chen、Junjun Jiang、Kui Jiang、Xiao Tang、Zh…

知識蒸餾 - 基于KL散度的知識蒸餾 HelloWorld 示例 采用PyTorch 內置函數F.kl_div的實現方式

知識蒸餾 - 基于KL散度的知識蒸餾 HelloWorld 示例 采用PyTorch 內置函數F.kl_div的實現方式 flyfish kl_div 是 Kullback-Leibler Divergence的英文縮寫。 其中,KL 對應提出該概念的兩位學者(Kullback 和 Leibler)的姓氏首字母“div”是 div…

C語言基礎_補充知識、數據類型轉換、選擇結構

0、補充知識: 原碼、反碼、補碼的知識: 計算機中原碼轉補碼,正數不變,負數是符號位不變,其余各位取反碼加一。負數的補碼轉原碼應該是補碼減一然后再取反,為什么負數的補碼轉原碼是補碼取反然后再加一&…

ubuntu自動重啟BUG排查指南

當 Ubuntu 系統意外重啟時,排查原因需要從系統日志、硬件狀態和定時任務等多個方面入手。 示例:通過日志檢查重啟原因 last -x | head | tac 此命令顯示最近的關機和重啟記錄。如果記錄中包含 shutdown 或 crash,則可能是人為操作或系統故障導…

2. JS 有哪些數據類型

總結 基礎類型(7 種):number, string, boolean, null, undefined, symbol, bigint引用類型(對象及其子類):object, array, function, date, regexp, map, set 等 判斷方式推薦: 基礎類型&#x…

pipeline方法關系抽取--課堂筆記

Pipeline方法課堂筆記 一、Pipeline方法原理 pipeline方法是指在實體識別已經完成的基礎上再進行實體之間關系的抽取. pipeline方法流程: 先對輸入的句子進行實體抽取,將識別出的實體分別組合;然后再進行關系分類. 注意:這兩個子過…

linux系統離線環境安裝clickhouse客戶端

1、下載離線安裝包: 方式1:網站直接下載 鏈接:https://packagecloud.io/altinity/clickhouse 注意要下載同一版本的四個包 方式2:夸克網盤分享 鏈接:https://pan.quark.cn/s/7e77e6a1bc5f 2、將本地下載的安裝包上傳…

GPT-5的誕生之痛:AI帝國的現實危機

目錄 前言 一、“俄里翁”的隕落:一場夢碎的代際飛躍 二、扎克伯格的“抄家式”突襲 三、天才的詛咒:當AI聰明到無法與我們對話 四、燒錢的無底洞與微軟的影子 結語:AI帝國的黃昏,還是黎明前的黑暗? &#x1f3a…

探索設計模式的寶庫:Java-Design-Patterns

在軟件開發領域,設計模式是解決常見問題的經典方案,它們如同建筑師的藍圖,為開發者提供了經過驗證的最佳實踐。今天我要向大家介紹一個GitHub上的明星項目——java-design-patterns,這是一個全面、實用且持續更新的設計模式寶藏項…

JavaScript中的作用域、閉包、定時器 由淺入深

1. JavaScript中的作用域是什么? 作用域(Scope)是程序中定義變量的區域,它決定了變量的可訪問性(可見性)。在JavaScript中,作用域主要分為三種:全局作用域、函數作用域和塊級作用域&…

倉庫管理系統-11-前端之頭部區域Header的用戶登錄和退出功能

文章目錄 1 登錄功能 1.1 登錄頁面(Login.vue) 1.1.1 頁面布局 1.1.2 初始化數據 1.1.3 confirm方法 1.1.4 UserController.java(登錄接口) 1.1.5 Login.vue 1.2 登錄頁面的路由 1.2.1 創建路由文件(router/index.js) 1.2.2 注冊路由器(main.js) 1.2.3 路由視圖(App.vue) 2 退出…

【VLNs篇】07:NavRL—在動態環境中學習安全飛行

項目內容論文標題NavRL: 在動態環境中學習安全飛行 (NavRL: Learning Safe Flight in Dynamic Environments)核心問題解決無人機在包含靜態和動態障礙物的復雜環境中進行安全、高效自主導航的挑戰,克服傳統方法和現有強化學習方法的局限性。核心算法基于近端策略優化…

飛算科技:以自主創新引領數字科技浪潮,飛算JavaAI賦能產業智能化升級

技術創新已成為企業突破瓶頸、實現跨越式發展的核心驅動力。作為國家級高新技術企業,飛算數智科技(深圳)有限公司(簡稱“飛算科技”)憑借其深厚的互聯網科技、大數據與人工智能技術積淀,以及在民生產業、中…

51單片機按鍵復位電路電壓隨著電容放電升高的分析

一、引言在單片機系統中,復位電路是一個至關重要的組成部分,它確保了單片機在特定情況下能夠恢復到初始狀態,從而避免程序運行錯誤或系統崩潰。對于51單片機而言,按鍵復位電路是一種常用的復位方式,它通過手動按下復位…

JVM學習日記(十五)Day15——性能監控與調優(二)

好了我們這一篇繼續來說命令行監控指令,上一篇說了4個比較重要的指令,其中用的比較多的也就是jstat和jmap了。 jhat:堆轉儲分析工具 他是JDK自帶的分析工具,分析我們上一篇說的jmap轉存的內存快照,??內置了一個微型…

Docker國內鏡像列表

Docker 鏡像源列表(8月3日更新-長期&免費)_docker國內鏡像源-CSDN博客

Orange AI 管理平臺單體版安裝教程(Docker Compose 部署)

Orange AI 管理平臺單體版安裝教程(Docker Compose 部署) 本文介紹如何通過 Docker Compose 快速安裝 Orange AI 管理平臺單體版,適用于本地開發和測試環境。步驟簡單,適合初學者和有一定運維經驗的用戶。 一、環境準備 已安裝 …

PHP的魔術方法

一、介紹 ?PHP魔術方法是以雙下劃線__開頭的一組特殊方法,用于在對象生命周期、屬性訪問、方法調用等場景中實現自動化操作。?簡化面向對象編程。 二、17個現有的魔術方法 (一)、對象生命周期相關 1、__construct() 類的構造函數方法&a…

vue2實現類似chatgpt和deepseek的AI對話流打字機效果,實現多模型同時對話

實現多模型同時對話功能特點:1、抽離對話框成單獨組件ChatBox.vue,在新增模型對比窗口時可重復利用2、通過sse與后臺實時數據流,通過定時器實現打字效果3、適應深度思考內容輸出,可點擊展開與閉合4、可配置模型參數,本…