StochSync:可在任意空間中生成360°全景圖和3D網格紋理

StochSync方法可以用于在任意空間中生成圖像,尤其是360°全景圖和3D網格紋理。該方法利用了預訓練的圖像擴散模型,以實現零-shot生成,消除了對新數據收集和單獨訓練生成模型的需求。StochSync 結合了 Diffusion Synchronization(DS)和 Score Distillation Sampling(SDS)的優點,能夠在條件較弱的情況下仍然生成高質量的圖像。

使用 StochSync 生成的各類網格紋理和全景圖,包括背景中的一張(環境映射圖),它是一張 360°全景圖。StochSync 擴展了在方形空間中訓練的圖像擴散模型的能力,能夠在諸如圓柱體、球體、環面和網格表面等任意空間中生成圖像。

相關鏈接

  • 論文:http://arxiv.org/abs/2501.15445v1

  • 主頁:https://stochsync.github.io/

論文介紹

我們提出了一種名為 StochSync 的方法,用于生成任意空間中的圖像——例如 360°全景圖或 3D 表面上的紋理——該方法利用了一個預訓練的圖像擴散模型。主要的挑戰在于彌合擴散模型理解的二維圖像與圖像生成的目標空間之間的差距。與那些在缺乏強條件或缺乏精細細節的情況下難以取得成效的方法不同,StochSync 結合了擴散同步和得分蒸餾采樣的優勢,即使在條件較弱的情況下也能有效運行。實驗表明 StochSync 比之前的基于微調的方法表現更出色,尤其是在 360°全景圖生成方面。

方法

StochSync方法的核心在于結合了Diffusion Synchronization和Score Distillation Sampling的優勢,具體包括以下幾個方面:

  • 最大隨機性:在同步過程中引入最大隨機性,優化了樣本在不同實例空間之間的連貫性。這一策略通過調整噪聲預測的方式,幫助消除樣本間的接縫,提高了圖像的整體流暢性。

  • 多步去噪計算:將傳統的單步去噪預測替換為多步去噪過程,以提高生成樣本的真實感和一致性。這種方法允許在每個時間步驟上進行更精確的樣本預測,進而提升生成圖像的細節。

  • 非重疊視圖采樣:在每個步驟中采用非重疊的視圖采樣策略,確保樣本在時間上的同步,同時避免了由于視圖重疊導致的真實感下降。這種方法通過交替采樣不同的視圖,提高了生成圖像的質量。

360°全景生成

使用 PanFusion 生成全景圖的定性結果提示。在左側列中呈現了與先前工作的比較結果,而在右側列中展示了與 StochSync 一起的消融測試案例。

L-MAGIC (Cai et al., 2024)和StochSync在水平特異性提示上的定性比較。

三維網格紋理的附加定性結果。

本文來自互聯網用戶投稿,該文觀點僅代表作者本人,不代表本站立場。本站僅提供信息存儲空間服務,不擁有所有權,不承擔相關法律責任。
如若轉載,請注明出處:http://www.pswp.cn/news/895259.shtml
繁體地址,請注明出處:http://hk.pswp.cn/news/895259.shtml
英文地址,請注明出處:http://en.pswp.cn/news/895259.shtml

如若內容造成侵權/違法違規/事實不符,請聯系多彩編程網進行投訴反饋email:809451989@qq.com,一經查實,立即刪除!

相關文章

研發管理知識

定義 研發管理是對研發活動進行有效的計劃、組織、領導和控制的過程,旨在通過合理配置資源、協調團隊工作、監控項目進度和質量等,確保研發項目能夠按時、按質、按量完成,實現企業的技術創新和產品升級目標,增強企業的核心競爭力。…

HarmonyOS 5.0應用開發——全局自定義彈出框openCustomDialog

【高心星出品】 文章目錄 全局自定義彈出框openCustomDialog案例開發步驟完整代碼 全局自定義彈出框openCustomDialog CustomDialog是自定義彈出框,可用于廣告、中獎、警告、軟件更新等與用戶交互響應操作。開發者可以通過CustomDialogController類顯示自定義彈出框…

AOS安裝及操作演示

文章目錄 一、安裝node1.1 在 macOS 上管理 Node版本1.1.1 安裝 nvm1.1.2 驗證 nvm 是否安裝成功1.1.3 使用 nvm 安裝/切換 Node.js 版本1.1.4 卸載 Node.js 版本 1.2 在 windows 上管理 Node版本1.2.1 安裝 nvm-windows1.2.2 安裝 Node.js 版本1.2.3 切換 Node.js 版本1.2.4 卸…

DeepSeek模型R1服務器繁忙,怎么解決?

在當今科技飛速發展的時代,人工智能領域不斷涌現出令人矚目的創新成果,其中DeepSeek模型無疑成為了眾多關注焦點。它憑借著先進的技術和卓越的性能,在行業內掀起了一股熱潮,吸引了無數目光。然而,如同許多前沿技術在發…

AIGC-微頭條爆款文案創作智能體完整指令(DeepSeek,豆包,千問,Kimi,GPT)

Unity3D特效百例案例項目實戰源碼Android-Unity實戰問題匯總游戲腳本-輔助自動化Android控件全解手冊再戰Android系列Scratch編程案例軟考全系列Unity3D學習專欄藍橋系列AIGC(GPT、DeepSeek、豆包、千問、Kimi)??關于作者 專注于Android/Unity和各種游戲開發技巧,以及各種資…

[LLM面試題] 指示微調(Prompt-tuning)與 Prefix-tuning區別

一、提示調整(Prompt Tuning) Prompt Tuning是一種通過改變輸入提示語(input prompt)以獲得更優模型效果的技術。舉個例子,如果我們想將一條英語句子翻譯成德語,可以采用多種不同的方式向模型提問,如下圖所示&#xf…

CSS 性能優化全攻略:提升網站加載速度與流暢度

系列文章目錄 01-從零開始學CSS選擇器:屬性選擇器與偽類選擇器完全指南 02-避免樣式沖突:掌握CSS選擇器優先級與層疊規則的終極指南 03-如何精確掌控網頁布局?深入解析 CSS 樣式與盒模型 04-CSS 布局全面解析:從傳統浮動到現代 F…

自主項目面試點總結

1、許苑–OJ判題系統 技術棧:Spring BootSpring Cloud AlibabaRedisMybatisMQDocker 項目地址: https://github.com/xuyuan-upward/xyoj-backend-microservice 1.1、項目介紹: 一個基于微服務的OJ系統,具備能夠根據管理員預設的題目用例對用戶提交的代…

12.推薦系統的前沿技術

接下來我們將學習推薦系統的前沿技術。推薦系統是一個快速發展的領域,許多新技術和新方法不斷涌現,進一步提升了推薦系統的性能和效果。在這一課中,我們將介紹以下內容: 圖神經網絡(GNN)在推薦系統中的應用…

【py】python安裝教程(Windows系統,python3.13.2版本為例)

1.下載地址 官網:https://www.python.org/ 官網下載地址:https://www.python.org/downloads/ 2.64版本或者32位選擇 【Stable Releases】:穩定發布版本,指的是已經測試過的版本,相對穩定。 【Pre-releases】&#…

CEF132 編譯指南 MacOS 篇 - depot_tools 安裝與配置 (四)

1. 引言 在 CEF132(Chromium Embedded Framework)的編譯過程中,depot_tools 扮演著舉足輕重的角色。這套由 Chromium 項目精心打造的腳本和工具集,專門用于獲取、管理和更新 Chromium 及其相關項目(包括 CEF&#xff…

1312:【例3.4】昆蟲繁殖

1312:【例3.4】昆蟲繁殖 時間限制: 1000 ms 內存限制: 65536 KB 提交數:60386 通過數: 29787 【題目描述】 科學家在熱帶森林中發現了一種特殊的昆蟲,這種昆蟲的繁殖能力很強。每對成蟲過xx個月產yy對卵,每對卵要過兩個月長成成蟲…

Linux防火墻設置

目錄 Ubuntu防火墻(UFW)常用設置 1. 查看防火墻狀態 2. 開啟/關閉防火墻 3. 管理端口 4. 管理IP地址 5. 服務管理 CentOS防火墻(firewalld)常用設置 1. 查看防火墻狀態 2. 啟動/關閉防火墻 3. 設置開機啟動 4. 管理端口…

Git 日志查看與版本回溯

引言 在軟件開發的漫漫長路中,代碼就如同我們搭建軟件大廈的基石,而 Git 則是一位默默守護并精心管理這些基石的 “管家”。它不僅能記錄代碼的每一次變動,還提供了強大的日志查看和版本回溯功能,這些功能就像是給開發者配備了一…

針對Prompt優化的深入分析

一、針對Prompt優化的深入分析 1. 結構化設計 技術原理: 大語言模型(LLMs)本質是基于概率的序列生成器,結構化模板通過顯式定義輸出框架(如角色、段落數、連接詞),利用模型的模式匹配能力&…

fps動作系統9:動畫音頻

文章目錄 動畫音頻創建音頻藍圖cue音量乘數 音效衰減衰減空間 綁定到動畫動畫序列軌道 動畫音頻 創建音頻藍圖 cue 音量乘數 音量大小 音效衰減 空間音效 衰減 空間 綁定到動畫 動畫序列 軌道 橫著的方向是有不同的軌道的,陰影的就是。

TensorRT【詳解】

文章目錄 1、 1、 參考: 1、nVidia TensorRT pytorch Docker 下載:https://catalog.ngc.nvidia.com/orgs/nvidia/containers/pytorch/tags 2、nVidia TensorRT pytorch Docker 版本講解:https://docs.nvidia.com/deeplearning/frameworks/py…

解決QTimer報“Timers cannot be started from another thread“錯誤

今天在Qt編程時,將QTimer在子線程里執行start()函數,遇到“Timers cannot be started from another thread”問題,使用了如下AI工具,進行查詢: ? ? 提示詞A:“C QTimer 如何跨線程” ? ? 提示詞B&#…

【AI知識點】苦澀的教訓 The Bitter Lesson by Rich Sutton(2019)

【AI論文解讀】【AI知識點】【AI小項目】【AI戰略思考】【AI日記】【讀書與思考】【AI應用】 “The Bitter Lesson” 是由 Richard Sutton(強化學習領域的先驅之一)提出的一個概念,指的是機器學習領域在長期發展過程中,尤其是在強…

單片機上SPI和IIC的區別

SPI(Serial Peripheral Interface)和IC(Inter-Integrated Circuit)是兩種常用的嵌入式外設通信協議,它們各有優缺點,適用于不同的場景。以下是它們的詳細對比: — 1. 基本概念 SPI&#xff0…