機器學習筆記:李宏毅 stable diffusion

1 基本框架

  • ?①:文字變成向量
  • ?②:喂入噪聲+文字encoder,產生中間產物
  • ?③:decoder 還原圖片

2? text encoder

?這張圖越往右下表示效果越好,可以看到text encoder尺寸越大,對后續生成圖片的增益越多

3 評價圖片生成好壞的標準

3.1 FID

  • ?現有一個訓練好的CNN 模型,可以生成真實影像和生成圖像的representation
  • 這兩組表征的分布越近,效果越好
  • ——>我們sample 一堆圖片,然后生成一組同語義的圖片,計算他們分布的distance

3.2? CLIP

  • ?如果圖片和文字是成對的,那么他們的representation越近表示生成的圖片效果越好

4 decoder

?

  • 訓練一個auoto encoder
  • 訓練完把decoder拿出來用即可

5 噪聲加的位置

  • 之前defusion model 中,noise是加在圖片上
  • 但現在產生的東西已經不是圖片了
    • ——>noise 加在中間產物上

大體上和diffusion model 類似,這里就是最后多接一個decoder,將中間產物變成圖片

?

本文來自互聯網用戶投稿,該文觀點僅代表作者本人,不代表本站立場。本站僅提供信息存儲空間服務,不擁有所有權,不承擔相關法律責任。
如若轉載,請注明出處:http://www.pswp.cn/news/40315.shtml
繁體地址,請注明出處:http://hk.pswp.cn/news/40315.shtml
英文地址,請注明出處:http://en.pswp.cn/news/40315.shtml

如若內容造成侵權/違法違規/事實不符,請聯系多彩編程網進行投訴反饋email:809451989@qq.com,一經查實,立即刪除!

相關文章

公園游玩必備!新零售模式如何吸引更多游客

隨著科技的不斷演進,新零售模式正以前所未有的速度改變著我們的購物方式和消費體驗。其中,自動售貨機作為新零售模式的重要組成部分,以其智能化、便捷性和多樣性的特點,正逐漸成為城市中熠熠生輝的一道風景線。 從24小時不間斷的運…

LeetCode Top100 Liked 題單(序號34~51)

?34. Find First and Last Position of Element in Sorted Array ? 題意:找到非遞減序列中目標的開頭和結尾 我的思路 用二分法把每一個數字都找到,最后返回首尾兩個數 代碼 Runtime12 ms Beats 33.23% Memory14 MB Beats 5.16% class Solution {…

前端練手小項目--自定義時間(html+css+js)

自定義時間 寫文章的因 關于要寫這篇文章的原因 是記錄在工作上遇到的困難需求,是希望能給大家提供一些解決問題的思路 接下來我描述這個需求的多樣性,難點在哪。 勾選勾選框開始時間與結束時間默認顯示昨天與今天。取消勾選框開始時間與結束時間清空。…

如何查看線程在哪個cpu核上

1、ps -eLF查看PSR值 2、 taskset -pc $pid(進程/線程) 參考鏈接:https://blog.csdn.net/test1280/article/details/87993669

Ubuntu修改設置系列--修改ssh端口號的方法(有示例)

原文網址:Ubuntu修改設置系列--修改ssh端口號的方法(有示例)_IT利刃出鞘的博客-CSDN博客 簡介 說明 本文介紹Ubuntu修改ssh端口號的方法(有示例)。 要達成的目標 ssh添加一個端口:3333,關閉原來的22端口。 1.修改端口 修改配置文件/et…

thingsboard編譯安裝踩坑記錄

thingsboard編譯安裝踩坑記錄 一、編譯:二、運行 朋友的thingsboard沒人維護,要裝新的服務器,啥文檔也沒有,就讓參考官網的文檔,版本也比較老3.2.2的,拿過來試了試記錄下踩坑的地方。 一、編譯:…

get與post如何拼接url與數據的靈活處理,循環的重要性。

get與post拼接url地址不同: let postData {method: "post",data: {op: "/api/setting/maintenanceperiod?period"this.authorizationCode,loadingConfig: {},data: {period:this.authorizationCode}}}; if(this.editData.id){let postData …

Nginx運行Vue項目:基本運行

需求 在Nginx服務器中,運行Vue項目。 說明 Vue項目打包生成的生產文件,是無法直接在瀏覽器打開的。需要放到Nginx服務器中,才能夠訪問。 本文章只介紹最基本的情況:Nginx中運行一個Vue項目。 實際生產環境,一個Ng…

mysql 批量給數據表和字段添加注釋

1、用命令行導出 mysql數據庫中的所有表 首先查看 mysql 的配置文件 “/etc/my.cnf ”,配置中找到 datadir 目錄, 將文件導出到 datadir 目錄下 我的 datadir 目錄是: /var/lib/mysql 連接mysql,執行導出命令 SELECT TABLE_NAM…

解密 AI 客服;在不同硬件設備上運行大型語言模型的可能性

🦉 AI新聞 🚀 微軟必應首席執行官稱必應聊天優于OpenAI的GPT-4,但成本更高 摘要:微軟必應的首席執行官米哈伊爾?帕拉欣表示,必應聊天表現優于OpenAI的GPT-4,但使用了更高成本的檢索增強推理技術。必應聊…

中科億海微ROM使用

標題 ROM(Read-Only Memory,只讀存儲器)是一種在FPGA(Field-Programmable Gate Array,現場可編程門陣列)中常用的存儲器類型。與RAM(Random Access Memory,機存取存儲器)…

Nginx安全加固,版本隱藏及HTTP請求頭修改方法

1 隱藏nginx版本號 1.1 引言 nginx作為目前較為流行的http server軟件,其相關的安全漏洞也非常多,攻擊者可以根據我們的nginx版本來了解到相關的漏洞從而針對性的進行攻擊。 通過新版本的nginx都會修復一些老版本的已知漏洞,但有時候我們生…

二刷LeetCode--148. 排序鏈表(C++版本),必會題,思維題

思路,本題其實考察了兩個點:合并鏈表、鏈表切分。首先從1開始,將鏈表切成一段一段,因為需要使用歸并,所以下一次的切分長度應該是當前切分長度的二倍,每次切分,我們拿出兩段,然后將第…

虛擬機與Java虛擬機介紹

1、虛擬機 所謂虛擬機(Virtual Machine),就是一臺虛擬的計算機。它是一款軟件,用來執行一系列虛擬計算機指令。大體上,虛擬機可以分為系統虛擬機和程序虛擬機。大名鼎鼎的Visual Box,VMware就屬于 系統虛…

提示丟失vcomp140.dll怎么辦?如何快速修復vcomp140.dll丟失問題

最近我遇到了一個程序啟動失敗的問題,錯誤提示顯示缺少了vcomp140.dll文件。經過一番研究和嘗試,我終于成功修復了這個問題。在這里,我將分享一下我的修復方法。 目錄 vcomp140.dll是什么? 如何快速修復呢? vcomp140…

sCrypt編程馬拉松于8月13日在復旦大學成功舉辦

繼6月在英國Exeter大學成功舉辦了為期一周的區塊鏈編程馬拉松后,美國sCrypt公司創始人兼CEO劉曉暉博士帶領核心團隊成員王一強、鄭宏鋒、周全,于8月13日在復旦大學再次成功舉辦了一場全新的sCrypt編程馬拉松。 本次活動由上海可一澈科技有限公司與復旦大…

C++筆記之花括號和圓括號初始化區別,列表初始化和初始化列表區別

C筆記之花括號和圓括號初始化區別,列表初始化和初始化列表區別 code review! 文章目錄 C筆記之花括號和圓括號初始化區別,列表初始化和初始化列表區別1.花括號{}進行初始化和圓括號()進行初始化2.列表初始化(list initialization&#xff0…

Vitis高層次綜合學習——FPGA

高層次綜合 什么是高層次綜合?就是使用高級語言(如C/C)來編寫FPGA算法程序。 在高層次綜合上并不需要制定微架構決策,如創建狀態機、數據路徑、寄存器流水線等。這些細節可以留給 HLS 工具,通過提供輸入約束&#xff…

專訪阿里云席明賢,視頻云如何運用大模型與小模型來破繭升級2.0

不久前,LiveVideoStack與阿里云視頻云負責人席明賢(花名右賢)展開一場深度的對話,一個是圈內專業的社區媒體,一個是20年的IT老兵,雙方有交集、有碰撞、有火花。 面對風云變幻的內外環境,阿里云…

未來數字銀行的樣子

對銀行長期發展來講,這意味著將關閉和減少 低效率的實體分行,加速向數字化發展。實現成本節省和 IT 預算提效的需求,將為數字柜臺和銀行代理點創造新的機遇。 一個嶄新的世界:未來數字銀行趨勢圖 現在是銀行迎頭趕上并為客戶提供超…