機器學習筆記：李宏毅 stable diffusion

news/2025/7/26 21:01:41/文章來源:https://blog.csdn.net/qq_40206371/article/details/132259609

1 基本框架

?①：文字變成向量
?②：喂入噪聲+文字encoder，產生中間產物
?③：decoder 還原圖片

2? text encoder

?這張圖越往右下表示效果越好，可以看到text encoder尺寸越大，對后續生成圖片的增益越多

3 評價圖片生成好壞的標準

3.1 FID

?現有一個訓練好的CNN 模型，可以生成真實影像和生成圖像的representation
這兩組表征的分布越近，效果越好
——>我們sample 一堆圖片，然后生成一組同語義的圖片，計算他們分布的distance

3.2? CLIP

?如果圖片和文字是成對的，那么他們的representation越近表示生成的圖片效果越好

4 decoder

?

訓練一個auoto encoder
訓練完把decoder拿出來用即可

5 噪聲加的位置

之前defusion model 中，noise是加在圖片上
但現在產生的東西已經不是圖片了
- ——>noise 加在中間產物上

大體上和diffusion model 類似，這里就是最后多接一個decoder，將中間產物變成圖片

?

本文來自互聯網用戶投稿，該文觀點僅代表作者本人，不代表本站立場。本站僅提供信息存儲空間服務，不擁有所有權，不承擔相關法律責任。
如若轉載，請注明出處：http://www.pswp.cn/news/40315.shtml
繁體地址，請注明出處：http://hk.pswp.cn/news/40315.shtml
英文地址，請注明出處：http://en.pswp.cn/news/40315.shtml

如若內容造成侵權/違法違規/事實不符，請聯系多彩編程網進行投訴反饋email:809451989@qq.com，一經查實，立即刪除！

相關文章

公園游玩必備！新零售模式如何吸引更多游客

公園游玩必備！新零售模式如何吸引更多游客

隨著科技的不斷演進，新零售模式正以前所未有的速度改變著我們的購物方式和消費體驗。其中，自動售貨機作為新零售模式的重要組成部分，以其智能化、便捷性和多樣性的特點，正逐漸成為城市中熠熠生輝的一道風景線。從24小時不間斷的運…

閱讀更多...

LeetCode Top100 Liked 題單（序號34~51）

LeetCode Top100 Liked 題單（序號34~51）

?34. Find First and Last Position of Element in Sorted Array ? 題意：找到非遞減序列中目標的開頭和結尾我的思路用二分法把每一個數字都找到，最后返回首尾兩個數代碼 Runtime12 ms Beats 33.23% Memory14 MB Beats 5.16% class Solution {…

閱讀更多...

前端練手小項目--自定義時間（html+css+js）

前端練手小項目--自定義時間（html+css+js）

自定義時間寫文章的因關于要寫這篇文章的原因是記錄在工作上遇到的困難需求，是希望能給大家提供一些解決問題的思路接下來我描述這個需求的多樣性，難點在哪。勾選勾選框開始時間與結束時間默認顯示昨天與今天。取消勾選框開始時間與結束時間清空。…

閱讀更多...

如何查看線程在哪個cpu核上

如何查看線程在哪個cpu核上

1、ps -eLF查看PSR值 2、 taskset -pc $pid（進程/線程） 參考鏈接：https://blog.csdn.net/test1280/article/details/87993669

閱讀更多...

Ubuntu修改設置系列--修改ssh端口號的方法(有示例)

Ubuntu修改設置系列--修改ssh端口號的方法(有示例)

原文網址：Ubuntu修改設置系列--修改ssh端口號的方法(有示例)_IT利刃出鞘的博客-CSDN博客簡介說明本文介紹Ubuntu修改ssh端口號的方法(有示例)。要達成的目標 ssh添加一個端口：3333，關閉原來的22端口。 1.修改端口修改配置文件/et…

閱讀更多...

thingsboard編譯安裝踩坑記錄

thingsboard編譯安裝踩坑記錄

thingsboard編譯安裝踩坑記錄一、編譯：二、運行朋友的thingsboard沒人維護，要裝新的服務器，啥文檔也沒有，就讓參考官網的文檔，版本也比較老3.2.2的，拿過來試了試記錄下踩坑的地方。一、編譯：…

閱讀更多...

get與post如何拼接url與數據的靈活處理，循環的重要性。

get與post如何拼接url與數據的靈活處理，循環的重要性。

get與post拼接url地址不同： let postData {method: "post",data: {op: "/api/setting/maintenanceperiod?period"this.authorizationCode,loadingConfig: {},data: {period:this.authorizationCode}}}; if(this.editData.id){let postData …

閱讀更多...

Nginx運行Vue項目：基本運行

Nginx運行Vue項目：基本運行

需求在Nginx服務器中，運行Vue項目。說明 Vue項目打包生成的生產文件，是無法直接在瀏覽器打開的。需要放到Nginx服務器中，才能夠訪問。本文章只介紹最基本的情況：Nginx中運行一個Vue項目。實際生產環境，一個Ng…

閱讀更多...

mysql 批量給數據表和字段添加注釋

mysql 批量給數據表和字段添加注釋

1、用命令行導出 mysql數據庫中的所有表首先查看 mysql 的配置文件 “/etc/my.cnf ”，配置中找到 datadir 目錄， 將文件導出到 datadir 目錄下我的 datadir 目錄是： /var/lib/mysql 連接mysql，執行導出命令 SELECT TABLE_NAM…

閱讀更多...

解密 AI 客服；在不同硬件設備上運行大型語言模型的可能性

解密 AI 客服；在不同硬件設備上運行大型語言模型的可能性

🦉 AI新聞 🚀 微軟必應首席執行官稱必應聊天優于OpenAI的GPT-4，但成本更高摘要：微軟必應的首席執行官米哈伊爾?帕拉欣表示，必應聊天表現優于OpenAI的GPT-4，但使用了更高成本的檢索增強推理技術。必應聊…

閱讀更多...

中科億海微ROM使用

中科億海微ROM使用

標題 ROM（Read-Only Memory，只讀存儲器）是一種在FPGA（Field-Programmable Gate Array，現場可編程門陣列）中常用的存儲器類型。與RAM（Random Access Memory，機存取存儲器）…

閱讀更多...

Nginx安全加固，版本隱藏及HTTP請求頭修改方法

Nginx安全加固，版本隱藏及HTTP請求頭修改方法

1 隱藏nginx版本號 1.1 引言 nginx作為目前較為流行的http server軟件，其相關的安全漏洞也非常多，攻擊者可以根據我們的nginx版本來了解到相關的漏洞從而針對性的進行攻擊。通過新版本的nginx都會修復一些老版本的已知漏洞，但有時候我們生…

閱讀更多...

二刷LeetCode--148. 排序鏈表(C++版本),必會題，思維題

二刷LeetCode--148. 排序鏈表(C++版本),必會題，思維題

思路，本題其實考察了兩個點：合并鏈表、鏈表切分。首先從1開始，將鏈表切成一段一段，因為需要使用歸并，所以下一次的切分長度應該是當前切分長度的二倍，每次切分，我們拿出兩段，然后將第…

閱讀更多...

虛擬機與Java虛擬機介紹

虛擬機與Java虛擬機介紹

1、虛擬機所謂虛擬機（Virtual Machine），就是一臺虛擬的計算機。它是一款軟件，用來執行一系列虛擬計算機指令。大體上，虛擬機可以分為系統虛擬機和程序虛擬機。大名鼎鼎的Visual Box，VMware就屬于系統虛…

閱讀更多...

提示丟失vcomp140.dll怎么辦？如何快速修復vcomp140.dll丟失問題

提示丟失vcomp140.dll怎么辦？如何快速修復vcomp140.dll丟失問題

最近我遇到了一個程序啟動失敗的問題，錯誤提示顯示缺少了vcomp140.dll文件。經過一番研究和嘗試，我終于成功修復了這個問題。在這里，我將分享一下我的修復方法。目錄 vcomp140.dll是什么？ 如何快速修復呢？ vcomp140…

閱讀更多...

sCrypt編程馬拉松于8月13日在復旦大學成功舉辦

sCrypt編程馬拉松于8月13日在復旦大學成功舉辦

繼6月在英國Exeter大學成功舉辦了為期一周的區塊鏈編程馬拉松后，美國sCrypt公司創始人兼CEO劉曉暉博士帶領核心團隊成員王一強、鄭宏鋒、周全，于8月13日在復旦大學再次成功舉辦了一場全新的sCrypt編程馬拉松。本次活動由上海可一澈科技有限公司與復旦大…

閱讀更多...

C++筆記之花括號和圓括號初始化區別，列表初始化和初始化列表區別

C++筆記之花括號和圓括號初始化區別，列表初始化和初始化列表區別

C筆記之花括號和圓括號初始化區別，列表初始化和初始化列表區別 code review! 文章目錄 C筆記之花括號和圓括號初始化區別，列表初始化和初始化列表區別1.花括號{}進行初始化和圓括號()進行初始化2.列表初始化（list initialization&#xff0…

閱讀更多...

Vitis高層次綜合學習——FPGA

Vitis高層次綜合學習——FPGA

高層次綜合什么是高層次綜合？就是使用高級語言（如C/C）來編寫FPGA算法程序。在高層次綜合上并不需要制定微架構決策，如創建狀態機、數據路徑、寄存器流水線等。這些細節可以留給 HLS 工具，通過提供輸入約束&#xff…

閱讀更多...

專訪阿里云席明賢，視頻云如何運用大模型與小模型來破繭升級2.0

專訪阿里云席明賢，視頻云如何運用大模型與小模型來破繭升級2.0

不久前，LiveVideoStack與阿里云視頻云負責人席明賢（花名右賢）展開一場深度的對話，一個是圈內專業的社區媒體，一個是20年的IT老兵，雙方有交集、有碰撞、有火花。面對風云變幻的內外環境，阿里云…

閱讀更多...

未來數字銀行的樣子

未來數字銀行的樣子

對銀行長期發展來講，這意味著將關閉和減少低效率的實體分行，加速向數字化發展。實現成本節省和 IT 預算提效的需求，將為數字柜臺和銀行代理點創造新的機遇。一個嶄新的世界：未來數字銀行趨勢圖現在是銀行迎頭趕上并為客戶提供超…

閱讀更多...

最新文章