Cold Diffusion: Inverting Arbitrary Image Transforms Without Noise論文閱讀

冷擴散:無需噪聲的任意圖像變換反轉

摘要

標準擴散模型通常涉及兩個核心步驟:圖像降質 (添加高斯噪聲)和圖像恢復 (去噪操作)。本文發現,擴散模型的生成能力并不強烈依賴于噪聲的選擇,而是可以通過改變降質過程構建一個更廣泛的生成模型家族。即使使用完全確定性 的降質操作(如模糊、遮蔽等),擴散模型的訓練和測試規則仍可被推廣,從而生成高質量圖像。這一發現挑戰了學界對擴散模型的傳統認知——即依賴于梯度朗之萬動力學或變分推斷中的噪聲機制,同時為更通用的擴散模型(可反轉任意圖像變換)開辟了道路。
代碼開源地址:github.com/arpitbansal297/Cold-Diffusion-Models。

在這里插入圖片描述


1 引言

擴散模型最近已成為生成建模的強大工具 [Ramesh 等, 2022]。擴散模型有多種變體,但其核心概念均圍繞隨機噪聲的移除;研究者會訓練一個圖像恢復/去噪網絡,該網絡接受受高斯噪聲污染的圖像并輸出去噪后的圖像。在測試階段,去噪網絡通過交替應用去噪操作和添加高斯噪聲的更新規則,將純高斯噪聲轉化為逼真圖像。當采用正確的更新序列時,能夠觀察到復雜的生成行為。

擴散模型的起源以及我們對這些模型的理論理解,均高度依賴高斯噪聲在訓練和生成過程中的作用。擴散模型被理解為基于朗之萬動力學(Langevin dynamics)圍繞圖像密度函數進行的隨機游走 [Sohl-Dickstein 等, 2015;Song 和 Ermon, 2019],其中每一步都需要高斯噪聲。這一過程從高溫(強噪聲)狀態開始,逐步退火到幾乎無噪聲的“冷”狀態。另一條研究路線則通過變分推斷(variational inference)結合高斯先驗,推導出去噪網絡的損失函數 [Ho 等, 2020;Song 等, 2021a;Nichol 和 Dhariwal, 2021]。

本工作探討了擴散模型是否必須依賴高斯噪聲或任何隨機性。我們研究了超越擴散模型原始理論框架的廣義擴散模型。不同于局限于高斯噪聲的模型,我們考慮基于任意圖像變換(如模糊、下采樣等)構建的模型。通過簡單的 Lp 損失訓練恢復網絡以反轉這些變換。在測試階段交替應用圖像恢復模型和降質操作時,生成行為依然出現,并能夠生成逼真圖像。

在訓練和測試階段均無需高斯噪聲(或任何隨機性)的“冷擴散”模型的存在,挑戰了當前對擴散模型理論極限的理解,同時為具有全新特性的生成模型開辟了可能性。


本文來自互聯網用戶投稿,該文觀點僅代表作者本人,不代表本站立場。本站僅提供信息存儲空間服務,不擁有所有權,不承擔相關法律責任。
如若轉載,請注明出處:http://www.pswp.cn/pingmian/81204.shtml
繁體地址,請注明出處:http://hk.pswp.cn/pingmian/81204.shtml
英文地址,請注明出處:http://en.pswp.cn/pingmian/81204.shtml

如若內容造成侵權/違法違規/事實不符,請聯系多彩編程網進行投訴反饋email:809451989@qq.com,一經查實,立即刪除!

相關文章

Java并發編程核心組件簡單了解

一、Lock體系 1. ReentrantLock(可重入鎖) Lock lock new ReentrantLock(); lock.lock(); try {// 臨界區代碼 } finally {lock.unlock(); }特點:可重入、支持公平/非公平策略優勢:可中斷鎖獲取、定時鎖等待使用場景&#xff1…

第二個五年計劃!

下一階段!5年后!33歲!體重維持在125斤內!腰圍74! 健康目標: 體檢指標正常,結節保持較小甚至變小! 工作目標: 每年至少在一次考評里拿A(最高S,A我理…

Redis(三) - 使用Java操作Redis詳解

文章目錄 前言一、創建項目二、導入依賴三、鍵操作四、字符串操作五、列表操作六、集合操作七、哈希表操作八、有序集合操作九、完整代碼1. 完整代碼2. 項目下載 前言 本文主要介紹如何使用 Java 操作 Redis 數據庫,涵蓋項目創建、依賴導入及 Redis 各數據類型&…

【Folium】使用離線地圖

文章目錄 相關文獻離線地圖下載Folium 使用離線地圖 相關文獻 Folium — Folium 0.19.5 documentationOffline Map Maker 離線地圖下載 我們使用 Offline Map Maker 進行地圖下載。 特別注意:Folium 默認支持 WGS84 坐標系,建議下載 WGS84 坐標系的地…

DeepSearch:字節新一代 DeerFlow 框架

項目地址:https://github.com/bytedance/deer-flow/ 【全新的 Multi-Agent 架構設計】獨家設計的 Research Team 機制,支持多輪對話、多輪決策和多輪任務執行。與 LangChain 原版 Supervisor 相比,顯著減少 Tokens 消耗和 API 調用次數&#…

Qt—用SQLite實現簡單的注冊登錄界面

1.實現目標 本次實現通過SQLite制作一個簡易的登錄窗口,當點擊注冊按鈕時,登錄窗口會消失,會出現一個新的注冊界面;完成注冊或退出注冊時,注冊窗口會消失,重新出現登錄窗口。注冊過的用戶信息會出現在SQLi…

day 18:零基礎學嵌入式之數據結構——

一、基礎內容 1.數據結構:相互之間存在一種或多種特定關系的數據元素的集合。 2.邏輯結構 (1)集合,所有數據在同一個集合中,關系平等。 (2)線性,數據和數據之間是一對一的關系 &am…

【SSL證書系列】客戶端如何驗證https網站服務器發的證書是否由受信任的根證書簽發機構簽發

客戶端驗證HTTPS網站證書是否由受信任的根證書頒發機構(CA)簽發,是一個多步驟的過程,涉及證書鏈驗證、信任錨(Trust Anchor)檢查、域名匹配和吊銷狀態驗證等。以下是詳細的驗證流程: 1. 證書鏈的…

iOS即時通信的技術要點

iOS即時通信開發的關鍵技術要點總結: 一、通訊協議選擇 Socket通信 基礎實現:使用原生BSD Socket或CFNetwork框架(復雜),推薦第三方庫如CocoaAsyncSocket(封裝GCDAsyncSocket),簡化T…

智能AI構建工地安全網:跌倒、抽搐、區域入侵多場景覆蓋

智能AI在工地安全中的應用:從監測到救援的全流程實踐 一、背景:高溫作業下的工地安全挑戰 隨著夏季高溫持續,工地戶外作業環境面臨嚴峻考驗。工人因高溫疲勞、脫水或突發疾病引發的行為異常(如暈厥、抽搐、跌倒)頻發…

Doris

Apache Doris(原名:Palo)是一個高性能、實時的MPP分析型數據庫,非常適合海量數據的即席查詢、報表分析、指標統計等 OLAP 場景。Doris 的設計目標是:極致查詢性能、簡單易用、支持高并發分析和明細查詢。 一、Doris 核…

# 2-STM32F103-復位和時鐘控制RCC

STM32-復位和時鐘控制RCC 2-STM32-復位和時鐘控制RCC摘要說明本文參考資料如下: 一、STM32最小系統回顧STM32F103C8T6核心板原理圖 二、復位三、時鐘3.1 時鐘樹3.2 STM32啟動過程3.2 SystemInit()函數3.2.1 SystemInit()第1句:3.2.2 SystemInit()第2句&a…

rk3576 gstreamer opencv

安裝gstreamer rk3588使用gstreamer推流_rk3588 gstreamer-CSDN博客 rk3588使用gstreamer推流_rk3588 gstreamer-CSDN博客 Installing on Linux sudo apt-get install libgstreamer1.0-dev libgstreamer-plugins-base1.0-dev libgstreamer-plugins-bad1.0-dev gstreamer1.0-pl…

Quic如何實現udp可靠傳輸

QUIC(Quick UDP Internet Connections)是由 Google 設計并被 IETF 標準化的傳輸層協議,它基于 UDP 實現,但提供了類似 TCP 的可靠性和更高級的功能(如多路復用、0-RTT 握手、TLS 加密等)。 盡管 UDP 是不可…

uniapp-商城-59-后臺 新增商品(屬性的選中,進行過濾展示,filter,some,every和map)

前面講了屬性的添加,添加完成后,數據庫中已經存在數據了,這時再繼續商品的添加時,就可以進行屬性的選擇了。 在商品添加過程中,屬性選擇是一個關鍵步驟。首先,界面需要展示嵌套的屬性數據,用戶通…

負載均衡 ELB 在 zkmall開源商城高流量場景下的算法優化

在電商大促、直播帶貨等高頻交易場景下,流量突發增長對系統穩定性提出嚴峻挑戰。ZKmll 開源商城通過對負載均衡 ELB(Elastic Load Balancer)算法的深度優化,結合業務場景特性設計動態加權輪詢 地域感知 熱點分流的混合策略&…

Linux干貨(三)

前言 從B站黑馬程序員Linux課程摘選的學習干貨,新手友好!若有侵權,會第一時間處理。 目錄 前言 1.which find命令 1.which命令 2.find命令 2.grep wc 管道符 1.grep命令 2.wc命令 3.管道符 3.echo tail 重定向符 1.echo命令 2.反…

Sigmoid與Softmax:從二分類到多分類的深度解析

Sigmoid與Softmax:從二分類到多分類的深度解析 聯系 函數性質:二者都是非線性函數 ,也都是指數歸一化函數,可將輸入值映射為0到1之間的實數 ,都能把輸出轉化成概率分布的形式,在神經網絡中常作為激活函數使用。Softmax是Sigmoid的推廣:從功能角度看,Softmax函數可視為…

文件系統交互實現

關于之前的搭建看QT控件文件系統的實現-CSDN博客,接下來是對本程序的功能完善,我想著是這樣設計的,打開一個目錄以后,鼠標選中一個項可以是目錄,也可以是文件,右鍵可以出現一個菜單選擇操作,比如…

[ctfshow web入門] web75

信息收集 啟用了open_basedir,所以之前的方法又不能用了 解題 cforeach(new DirectoryIterator("glob:///*") as $a){echo($a->__toString(). ); } ob_flush();cif ( $a opendir("glob:///*") ) {while ( ($file readdir($a)) ! false …