ddpm Denoising Diffusion Probabilistic Model 學習筆記

ddpm Denoising Diffusion Probabilistic Model 學習筆記

web/2025/9/7 10:04:11/文章來源:https://blog.csdn.net/jacke121/article/details/138808815

目錄

Stable Diffusion

文章的貢獻抽象出來就兩個

潛空間上做擴散生成

ddpm(Denoising Diffusion Probabilistic Model)學習筆記

算法原理

unet預測噪聲

unet推理過程

重參數化技巧

（1）利用前一時刻的?xt-1?得到任意時刻的噪聲圖片?xt（重參數化技巧）

Stable Diffusion

文章的貢獻抽象出來就兩個

：1）提出可以在潛空間上用diffusion學特征分布，而不是直接讓diffusion 學圖像，降低了diffusion模型的難度；2）可以用 cross-attention 方法給模型加條件搞條件生成，在 cross-attention 中，q來源于與上一步，k和v來源于條件編碼。

潛空間上做擴散生成

之前的DM（diffusion model）大多是直接對圖像做去噪擴散，生成出來的圖像細節不太好，如果想生成高清大圖又需要非常大的計算量。所以這里作者提出了一種在潛空間上做擴散生成的方式，另外還增加了文本條件生成。這些操作使得模型最終可以生成非常高清的圖，而且跟像素級的DMs模型相比大大降低了計算量。

作者的貢獻有：

1）與以往純transformer的結構不同，作者的模型可以更優雅地擴展到更高緯度的數據，因此此工作可以（a）在壓縮了的級別上提供更可靠更具體的重建細節，（b）可以更有效地生成百萬像素高清圖像。

ddpm(Denoising Diffusion Probabilistic Model)學習筆記

算法原理

一文弄懂 Diffusion Model（DDPM）+ 代碼實現-CSDN博客

unet預測噪聲

無論在前向過程還是反向過程，Unet的職責都是根據當前的樣本和時間 t 預測噪聲。

訓練階段是一步預測出從0到t加的噪聲noise
推理階段是根據模型算出該t時刻的噪聲，然后用x_t減去該時刻的噪聲noise得到x[t-1]

unet推理過程

訓練時：給定原圖和時間t,加上噪聲，然后用unet預測噪聲。

推理時，給定隨機噪聲和時間t，預測噪聲，然后減去噪聲，然后就是圖像

重參數化技巧

（1）利用前一時刻的?`xt-1`?得到任意時刻的噪聲圖片?`xt（`重參數化技巧`）`

本文來自互聯網用戶投稿，該文觀點僅代表作者本人，不代表本站立場。本站僅提供信息存儲空間服務，不擁有所有權，不承擔相關法律責任。
如若轉載，請注明出處：http://www.pswp.cn/web/11729.shtml
繁體地址，請注明出處：http://hk.pswp.cn/web/11729.shtml
英文地址，請注明出處：http://en.pswp.cn/web/11729.shtml

如若內容造成侵權/違法違規/事實不符，請聯系多彩編程網進行投訴反饋email:809451989@qq.com，一經查實，立即刪除！

相關文章

LeetCode2215找出兩數組的不同

LeetCode2215找出兩數組的不同

題目描述給你兩個下標從 0 開始的整數數組 nums1 和 nums2 ，請你返回一個長度為 2 的列表 answer ，其中：answer[0] 是 nums1 中所有不存在于 nums2 中的不同整數組成的列表。answer[1] 是 nums2 中所有不存在于 nums1 中的不同整數組…

閱讀更多...

Linux poweroff命令教程：如何實現一鍵關機(附實例詳解和注意事項)

Linux poweroff命令教程：如何實現一鍵關機(附實例詳解和注意事項)

Linux poweroff命令介紹 poweroff命令是用來關閉系統的。當你執行這個命令時，它會發送一個信號給系統，告訴系統關閉所有的進程，然后關閉系統。這個命令非常有用，特別是在你需要遠程關閉系統，或者你的系統沒有圖形用戶…

閱讀更多...

Autosar架構

Autosar架構

藍框那種叫component，綠框的叫function cluster。接口有三種接口，RTE跟SWC之間鏈接的叫Autosar Interface，RTE跟BSW的Components鏈接是Standardized Interface，RTE跟BSW的services鏈接的是Standardized Autosar Interface。 St…

閱讀更多...

項目部署到線上proxytable代理失效nginx報404的問題

項目部署到線上proxytable代理失效nginx報404的問題

我的項目是在vue的config文件夾中的index.js中配置了接口地址 ，本地跑的時候都能訪問，放到線上就報404； module.exports {dev: {// PathsassetsSubDirectory: static,assetsPublicPath: /,proxyTable: {/xxx: {target: http://xxxxxxxx:xxx…

閱讀更多...

分享四種CAD圖紙加密方法，嚴防盜圖

分享四種CAD圖紙加密方法，嚴防盜圖

在數字化時代，cad圖紙的盜用和非法傳播問題日益突出。對于企業和設計師來說，保護設計成果的安全性和原創性，采取有效的cad加密方法至關重要。本文將分享四種cad加密方法，幫助您嚴防盜圖，保護圖紙安全。使用cad軟件內…

閱讀更多...

網絡協議的分類

網絡協議的分類

1.概要網絡協議可以分為三類： 封裝協議路由協議功能類協議 2.分類說明 OSPF報文直接調用_ IP協議__協議進行封裝，以目的地址_244.0.0.5 __發送到所有的OSPF路由器? 244.0.0.1 所有主機；244.0.0.2 所有路由器；244.0.0.6 指定…

閱讀更多...

【前端每日一題】day5

【前端每日一題】day5

JS 實現繼承的幾種方式在JavaScript中，實現繼承的幾種方式包括原型鏈繼承、構造函數繼承、組合繼承、原型式繼承、寄生式繼承和組合式繼承。原型鏈繼承： function Parent() {this.name Parent; } Parent.prototype.sayHello function() {console.…

閱讀更多...

當它還是幼生期的時候，及早離開它！

當它還是幼生期的時候，及早離開它！

當我們有豐富的精神生活時，充實的知識吸收儲備時，為自己的每一點進步而欣慰時，我們就不會有失敗的憂慮。也不會有孤單的自憐。沒有人是弱者，每個人都有自己活著的方式，當你內心強大時，你會尊重每一個“弱者…

閱讀更多...

Vue+springboot的批量刪除功能

Vue+springboot的批量刪除功能

vue前臺 <div style"margin-bottom: 10px"><el-button type"primary" plain click"handleAdd">新增</el-button><el-button click"delBatch" type"danger" plain style"margin-left: 5px"…

閱讀更多...

Spring Cloud 背后技術詳解

Spring Cloud 背后技術詳解

Spring Cloud 是基于 Spring Boot 的一套微服務架構解決方案。它為開發者提供了一系列的工具，用于快速構建分布式系統中的一些常見模式（例如配置管理、服務發現、斷路器等）。Spring Cloud 利用 Spring Boot 的自動配置和獨立運行能力&#xf…

閱讀更多...

C語言例題41、八進制轉換為十進制

C語言例題41、八進制轉換為十進制

#include<stdio.h>void main() {int x;printf("請輸入一個8進制整數：");scanf("%o", &x);printf("轉換成十進制后的整數為%d\n", x); }運行結果： 本章C語言經典例題合集：http://t.csdnimg.cn/FK0Qg…

閱讀更多...

Java基礎（33）Java Web攔截器作用和用法

Java基礎（33）Java Web攔截器作用和用法

Java Web攔截器（Interceptor）是Java Web開發中一個重要的概念，它允許開發者在處理HTTP請求和響應之前或之后執行特定的代碼，從而實現如權限檢查、日志記錄、事務管理等功能。攔截器可以作用于Java EE的Servlet、Spring框架、Strut…

閱讀更多...

redis試題按知識點歸類(四)

redis試題按知識點歸類(四)

十六、實戰應用 1.如何使用 Redis 存儲用戶會話？ 2.Redis 在電子商務平臺中的應用是什么？ 3.如何使用 Redis 進行實時數據分析？ 十七、面試題綜合 1.描述一次你解決 Redis 性能問題的經歷。 2.你如何理解 Redis 中的“單線程”模型&…

閱讀更多...

Java入門基礎學習筆記21——Scanner

Java入門基礎學習筆記21——Scanner

在程序中接收用戶通過鍵盤輸入的數據： 需求： 請在程序中，提示用戶通過鍵盤輸入自己的姓名、年齡、并能在程序中收到這些信息，怎么解決？ Java已經寫好了實現程序，我們調用即可。 API：Applicat…

閱讀更多...

2024 年中國大學生程序設計競賽全國邀請賽（鄭州）暨第六屆CCPC河南省大學生程序設計競賽 problem K. 樹上問題

2024 年中國大學生程序設計競賽全國邀請賽（鄭州）暨第六屆CCPC河南省大學生程序設計競賽 problem K. 樹上問題

//先找一個美麗的樹，然后遍歷樹找節點,分析是否符合條件。 //畫幾個圖，思考下。 #include<bits/stdc.h> using namespace std; #define int long long const int n1e611; int a,b,c[n],d,l,r,k,w,an; vector<int>t[n]; void dfs(int x,int…

閱讀更多...

MLT剪輯sample

MLT剪輯sample

#include <framework/mlt.h> int main(int argc, char **argv) { // 初始化MLT mlt_factory factory mlt_factory_init(NULL); // 加載素材（這里假設我們有一個名為"video.mp4"的視頻文件） mlt_profile profile mlt_prof…

閱讀更多...

什么是頁分裂、頁合并？

什么是頁分裂、頁合并？

數據組織方式在InnoDB存儲引擎中，表數據都是根據主鍵順序組織存放的，這種存儲方式的表稱為索引組織表(index organized table IOT)。行數據，都是存儲在聚集索引的葉子節點上的。而我們之前也講解過InnoDB的邏輯結構圖： 在I…

閱讀更多...

61、內蒙古工業大學、內蒙科學技術研究院：CBAM-CNN用于SSVEP - BCI的分類方法[腦機二區還是好發的]

61、內蒙古工業大學、內蒙科學技術研究院：CBAM-CNN用于SSVEP - BCI的分類方法[腦機二區還是好發的]

前言： 之前寫過一篇對CBAM模型改進的博客，在CBAM中引入了ECANet結構，對CBAM中的CAM、SAM模塊逐一改進，并提出ECA-CBAM單鏈雙鏈結構，我的這個小的想法已經被一些同學實現了，并進行了有效的驗證，…

閱讀更多...

快速對比找出2個名單不同之處

快速對比找出2個名單不同之處

import pandas as pd# 讀取兩個Excel文件 df1 pd.read_excel(1.xlsx) df2 pd.read_excel(2.xlsx)# 檢查兩個DataFrame的列是否相同 if list(df1.columns) ! list(df2.columns):print("兩個Excel文件的列不一致。")print("文件1的列：", df1.co…

閱讀更多...

AI智能體｜手把手教你申請一個Kimi(Moonshot)的API KEY

AI智能體｜手把手教你申請一個Kimi(Moonshot)的API KEY

大家好，我是無界生長。今天分享一下如何申請一個Kimi(Moonshot)的API KEY，為后面Kimi(Moonshot)接入微信機器人做鋪墊。學會了的話，歡迎分享轉發！ 前提擁有一個Kimi(Moonshot)賬號使用手機號注冊即可，新用戶可免費…

閱讀更多...

最新文章