CLAY是一種大規模可控生成模型,用于創建高質量的3D資產,它結合了多分辨率變分自編碼器和簡化的潛在擴散變壓器,通過多種輸入形式生成詳細的3D幾何結構和物理渲染材質。
CLAY或許是今年最值得期待的3D生成模型,號稱質量最好+布線最好+支持的輸入模態最多+支持材質生成。
相關鏈接
論文地址:https://arxiv.org/abs/2406.13897
項目主頁:https://sites.google.com/view/clay-3dlm
代碼:https://github.com/CLAY-3D/OpenCLAY(暫未開源)
論文閱讀
CLAY:一種可控的大規模生成模型高質量的3D資產
摘要
在數字創意領域,我們憑借想象力創造復雜 3D 世界的潛力常常受到現有數字工具的限制,這些工具需要大量的專業知識和努力。為了縮小這種差距,我們引入了 CLAY,這是一種 3D 幾何和材料生成器,旨在毫不費力地將人類的想象力轉化為復雜的 3D 數字結構。
CLAY 支持經典的文本或圖像輸入以及來自各種基元(