文生圖:AE/VAE/VQVAE/VQGAN/DALLE模型

文生圖模型演進:AE、VAE、VQ-VAE、VQ-GAN、DALL-E 等 8 模型本文中我們回顧了 AE、VAE、VQ-VAE、VQ-VAE-2 以及 VQ-GAN、DALL-E、DALL-E mini 和 CLIP-VQ-GAN 等 8 中模型,以介紹文生圖模型的演進。icon-default.png?t=N7T8https://mp.weixin.qq.com/s/iFrCEpAJ3WMhB-01lZ_qIA

1.AutoEncoder(AE)

2.Variational Autoencoder(VAE)

在AE基礎上引入了概率生成模型,通過在隱空間引入概率分布,使模型能夠生成多樣性的樣本,

Encoder將輸入映射到隱空間的一個點,而不同的點與點之間是沒有規律的,無法基于此來decoder出預期的內容。?

模型在隱空間是一個高斯分布,

3.Vector Quantised VAE(VQ-VAE)

在VAE的基礎上引入了離散的、可量化的隱空間表示,有助于模型更好的理解數據中的離散結構和語義信息,同時避免過擬合。

VQ是一種數據壓縮和量化的技術,它可以將連續的向量映射到一組離散的具有代表性的向量中,VQ通常用于將連續的隱空間表示映射到一個有限的、離散的codebook中,現在圖像tokenizer很多都是采用這種做法。

VQ中使用argmin來獲取最小距離,不可導,因此無法將encoder和decoder聯合訓練,作者將量化后表示的梯度拷貝到量化錢的表示,以使其連續可導。

4.VQ-VAE+PixelCNN

有了上述VQ-VAE,可以實現圖像壓縮,重建,codeformer的超分修復等,但是無法生成新的圖像,當然可以隨機生成index,然后對應生成量化后的latnet code,進而使用decoder來生成圖像,但是latent code完全沒有全局信息甚至局部信息,因為每個位置都是隨機生成的,引入了pixelcnn來自回歸的生成全局信息的latent code,進而可以生成更真實的圖像。

pixelcnn是一個自回歸模型,可以逐個像素生成,每個位置都可以看到之前位置的信息,這樣生成的latent code能夠更全面的考慮空間信息。

5.Vector Quantised VAE-2(V1-VAE-2)

6.Vector Quantised GAN(VQ-GAN)

引入了GAN,將VQ-VAE當做生成器,并加入判別器,加入了感知重建損失;將pixelcnn換成了GPT2;引入了滑動窗口自注意力機制。

7.DALLE(dVAE)

8.DALLE-mini

本文來自互聯網用戶投稿,該文觀點僅代表作者本人,不代表本站立場。本站僅提供信息存儲空間服務,不擁有所有權,不承擔相關法律責任。
如若轉載,請注明出處:http://www.pswp.cn/news/213622.shtml
繁體地址,請注明出處:http://hk.pswp.cn/news/213622.shtml
英文地址,請注明出處:http://en.pswp.cn/news/213622.shtml

如若內容造成侵權/違法違規/事實不符,請聯系多彩編程網進行投訴反饋email:809451989@qq.com,一經查實,立即刪除!

相關文章

pta模擬題(7-38 完全二叉樹的層序遍歷)

一個二叉樹,如果每一個層的結點數都達到最大值,則這個二叉樹就是完美二叉樹。對于深度為 D 的,有 N 個結點的二叉樹,若其結點對應于相同深度完美二叉樹的層序遍歷的前 N 個結點,這樣的樹就是完全二叉樹。 給定一棵完全…

GaussDB數據庫語法及gsql入門

一、GaussDB數據庫語法入門 之前我們講了如何連接數據庫實例,那連接數據庫后如何使用數據庫呢?那么我們今天就帶大家了解一下GaussDB,以下簡稱GaussDB的基本語法。 關于如何連接數據庫,請戳這里。 學習本節課程之后&#xff0c…

【開題報告】基于SpringBoot的消防知識科普平臺的設計與實現

1.選題背景 消防知識科普平臺的設計與實現是為了提高公眾對于消防安全的認知和應對能力,促進社會消防文化的普及和發展。在中國,火災事故時有發生,造成了重大人員傷亡和財產損失。因此,建立一個基于Spring Boot的消防知識科普平臺…

docker---網絡

docker的網絡模式: 1、橋接模式:創建docker時不需要指定網絡類型,默認模式。 2、host模式: 容器將不會虛擬出自己的網卡,也沒有自己的ip地址,全部使用宿主機的ip和端口。 3、container模式:容器和容器之間…

第五屆計算機能力挑戰賽國賽C語言組題解(專科組)

前言: ??前兩天計算機能力挑戰賽國賽結束了,拿著題做了一遍,發現難度真的不大,比省賽簡單多了,只是有時候可能有的同學拿著題,沒認真仔細去讀,或者說緊張了導致自己發揮不好吧。以下是個人的題…

【運維】將Linux的硬盤當內存用,Linux內存不夠用的時候如何用硬盤提升內存

文章目錄 內存不夠用,可以用硬盤當內存嗎如何取消這種交換空間交換空間是優先使用的還是說原始內存是會被優先使用的 內存不夠用,可以用硬盤當內存嗎 是的,可以使用硬盤作為虛擬內存來擴展容器中的內存。這個過程被稱為“交換”或“交換空間…

Django 模型操作-分頁(七)

一、連接MySql數據庫 1、先安裝MySQL 2、再安裝MySQL驅動 使用mysqlclient pip install mysqlclient 如果上面的命令安裝失敗, 則嘗試使用國內豆瓣源安裝: pip install -i https://pypi.douban.com/simple mysqlclient 二、在settings.py中配置 三、 book表的數據…

Android系統啟動過程-uBoot+Kernel+Android

摘要:本文是參考大量網上資源在結合自己查看源代碼總結出來的,讓自己同時也讓大家加深對Android系統啟動過程有一個更加深入的了解!再次強調,本文的大多數功勞應歸功于那些原創者們,同時一些必要的參考鏈接我會一一附上…

1009 說反話

給定一句英語,要求你編寫程序,將句中所有單詞的順序顛倒輸出。 輸入格式: 測試輸入包含一個測試用例,在一行內給出總長度不超過 80 的字符串。字符串由若干單詞和若干空格組成,其中單詞是由英文字母(大小…

【機器學習實訓項目】黑色星期五畫像分析

目錄 前言 一、項目概述 1.1 項目簡介 1.2 項目背景 1.3 項目目標 二、數據分析 2.1 導入庫 2.2 數據基本信息 三、畫像分析 3.1 畫像1:消費金額Top10 3.2 畫像2:高頻消費Top10 3.3 畫像3:人均消費金額Top10 3.4 畫像4:男女消費對…

創投課程第四期 | Web3一級市場投資框架的演變及投資人能力框架的構成

協會邀請了來自Zonff Partners的合伙人——Colin,作為VC創投課程第4期的嘉賓,在北京時間12月9日(周六)下午14:00 PM-15:00 PM于螞蟻鏈科技產業創新中心進行線下分享,屆時將與所有對Web3投資、創業心懷熱忱的朋友們共同探討《WEB3一級市場投資…

雙向鏈表(數據結構與算法)

???????????????? ???????????????? 🌿🌿🌿🌿🌿🌿🌿🌿🌿🌿🌿🌿🌿🌿&#x1…

程序啟動時訪問了未初始化的類指針引發內存訪問違例導致程序崩潰的問題排查

目錄 1、問題說明 2、使用Windbg動態調試去初步分析 3、使用Windbg詳細分析 4、最后 VC常用功能開發匯總(專欄文章列表,歡迎訂閱,持續更新...)https://blog.csdn.net/chenlycly/article/details/124272585C軟件異常排查從入門…

20、XSS——XSS跨站腳本

文章目錄 一、XSS漏洞概述1.1 XSS簡介 二、XSS漏洞分類2.1 反射型XSS2.2 存儲型XSS2.3 DOM型XSS 三、XSS payload構造以及變形3.1 XSS payload構造3.2 XSS payload 變形 一、XSS漏洞概述 1.1 XSS簡介 XSS被稱為跨站腳本攻擊(Cross-site scripting)&…

linux dpdk 介紹

DPDK(Data Plane Development Kit)是一個由英特爾發起的開源項目,旨在提供一個快速、高性能的數據平面開發工具包,使網絡應用能夠在通用處理器上實現網絡功能虛擬化(NFV)和軟件定義網絡(SDN&…

k8s volumes and data

Overview 傳統上,容器引擎(Container Engine)不提供比容器壽命更長的存儲。由于容器被認為是瞬態(transient)的,這可能會導致數據丟失或復雜的外部存儲選項。Kubernetes卷共享 Pod 生命周期,而不是其中的容器。如果容器終止,數據…

排序的簡單理解(上)

1. 排序的概念及引用 1.1 排序的概念 排序:所謂排序,就是使一串記錄,按照其中的某個或某些關鍵字的大小,遞增或遞減的排列起來的操作(按照我們的需求能夠有序的將數據信息排列起來)。 穩定性:假…

TeeChart.NET 2023.11.17 Crack

.NET 的 TeeChart 圖表控件提供了一個出色的通用組件套件,可滿足無數的圖表需求,也針對重要的垂直領域,例如金融、科學和統計領域。 數據可視化 數十種完全可定制的交互式圖表類型、地圖和儀表指示器,以及完整的功能集&#xff0c…

醫療設備智慧管理助力醫院提質增效,阿基米德amp;健康界實踐分享

近日,蘇州阿基米德網絡科技有限公司與醫療領域頭部級媒體健康界,聯合舉辦“數智為擎 提質增效——醫學裝備智慧管理創新發展論壇”的直播活動。 直播現場,來自上海交通大學醫學院附屬同仁醫院、中華醫學會航海醫學分會、蘇州阿基米德的專家們…

統信UOS_麒麟KYLINOS上使用命令行配置NTP服務器

原文鏈接:統信UOS/麒麟KYLINOS上使用命令行配置NTP hello,大家好啊,今天我要給大家介紹的是在統信UOS/麒麟KYLINOS操作系統上使用命令行配置NTP(Network Time Protocol)服務器的方法。在內網環境下,許多企業…