一文看盡AI繪畫工具 Stable Diffusion發展史,AI繪畫究竟發展到什么地步了?!

01、引言

Stable Diffusion 在短短兩年內發布了多個版本。最著名的版本是 1.5 和 SDXL。不過,還有許多其他版本值得一提。讓我們一起來探索穩定擴散模型的起源和發展。

閑話少說,我們直接開始吧!

02、缺失的SD V1.0版本

Stable Diffusion 的最早版本是V1.1。它由 CompVis 發布,而非 Stability AI。有趣的是,穩定擴散從未有過 1.0 版本。最初的模型稱為 Latent Diffusion,由 CompVis 開發,包含文本到圖像和inpainting功能。這個模型基本上可以被視為穩定擴散 1.0。但當 Latent Diffusion 演變為 Stable Diffusion 后,就沒有再進行更新了。

03、SD V1.1 到 V1.4

2022 年 8 月,CompVis 相繼發布了四個版本的穩定擴散軟件。隨后的每個版本都增加了訓練步驟,從而提高了輸出質量。

  • SD V1.1: Stable Diffusion 1.1 以 256x256 分辨率訓練237,000 步,以 512x512 分辨率訓練 197,000 步。

  • SD V1.2: Stable Diffusion 1.2 使用 512x512 分辨率的 515,000 步,并使用 laion-improved-aesthetics 數據集。

  • SD V1.3: StableDiffusion1.3 在1.2的基礎上進行了改進,在512x512 分辨率下增加了195,000個步驟,文本調節減少了 10%。

  • SD V1.4: StableDiffusion1.4 同樣基于1.2,但以 512x512 分辨率和 laion-aesthetics v2 5+ 數據集進行了 225,000 步訓練,并減少了類似的文本調節。

04、SD V1.5

RunwayML 于 2022 年 10 月發布了穩定版 Diffusion 1.5,該版本成為最廣泛使用的微調版本。

SD V1.5該版本是 1.2 的增強版,使用 laion-aesthetics v2 5+ 數據集,以 512x512 分辨率訓練了 595,000 步。

05、SD V2.0

2022 年 11 月,Stability AI 發布了 Stable Diffusion 2.0,12 月又發布了 2.1。盡管規模更大,但這些模型的受歡迎程度不如 1.5,而且擴展支持有限。

  • SD V2.0: Stable Diffusion 2.0 最初在 256x256 分辨率下進行了 550,000 步訓練,隨后在 512x512 分辨率下進行了 850,000 步訓練,并在 768x768 分辨率下進一步微調了 150,000 步。

  • SD V2.1: Stable Diffusion 2.1 是 2.0 的微調版本,增加了 55000 個步驟和額外的 155000 個微調步驟。

06、Stable Diffusion XL

SDXL 于 2023 年 6 月發布,與之前的版本相比有了顯著改進。它在 256x256 分辨率下訓練了 600,000 步,在 512x512 分辨率下訓練了 200,000 步。SDXL 擅長生成高達 1024x1024 像素的圖像,并支持 LoRA 和 ControlNet。

  • SDXL V0.9 base/refiner: Stable Diffusion XL 0.9 基礎版/精調版與最終版本相比,圖像成像質量較低。

  • SDXL V1.0 base/refiner: Stable Diffusion XL 1.0 正式發布,具有卓越的文本理解和圖像生成功能。

  • SDXL V1.0 Beta 2.2.2: 此模型僅通過 Stability AI 開發者平臺的API接口獨家提供。請將 engine_id 設置為 stable-diffusion-xl-beta-v2-2-2,以便使用。該版本是 SDXL 模型的微調迭代版本,與前一版本相比具有更強的功能。

  • Stable Image Core: 該模型只能通過Stability AI開發者平臺上的 v2 應用程序接口訪問。根據官方文檔,它是 SDXL 的微調版本,旨在提高性能。

07、SD V1.6

Stable Diffusion 1.6 是一個相對陌生的版本,因為它不是一個開源模型。它于 2023 年 11 月在 Stability AI 開發者平臺發布。它只能通過 Stability AI 開發者平臺的 v1 API 使用(最新的 API 版本為 v2)。

  • SD V1.6: Stable Diffusion 1.6 該版本是 Stable Diffusion 1.5 的微調升級版,據說比前一版本能生成更高質量的圖像。

08、SDXL Turbo

2023 年 11 月,SDXL Turbo 推出,利用潛在一致性模型(LCM)將生成步驟從通常的 30~40 步減少到 1~4 步。

  • SDXL Turbo: SDXL Turbo 使用逆向擴散蒸餾 (ADD) 技術來盡量減少生成步驟,但僅限于生成清晰度稍低的 512x512 圖像。

  • SD Turbo: Stable Diffusion 2.1 的 Turbo 版本,一直不太流行。

09、Stable Video Diffusion

Stability AI 公司于 2023 年 11 月推出了 SVD,可從單張圖像生成短動畫,且不會出現閃爍問題。

  • SVD: 穩定視頻擴散模型可用于制作14幀、576x1024 像素的動畫。

  • SVD-XT: 經過對SVD進行微調后的版本,能以相同的分辨率生成 25 幀動畫。

10、 Stable Zero 123

Stable Zero 123 于 2023 年 12 月發布,主要功能是通過單張圖像生成 3D 物體,并提供包括物體背面在內的多個視圖。

  • Stable Zero123: Stable Zero123 在Zero123上進行訓練,與前代產品相比,效果有所改進。

11、Stable Diffusion Cascade

2024 年 2 月,Stability AI 推出了 Stable Diffusion Cascade,它采用三階段生成流程(ABC 階段),以更高的效率生成高質量圖像。

  • SD Cascade: 穩定擴散級聯模型超越了 SDXL,具有更好的性能和多功能性,無需大量微調即可產生各種風格。

12、 SDXL Lightning

SDXL Lightning 緊隨 SDXL Turbo 之后推出,可提供更快的生成時間和高質量的結果,因其高效性而受到許多開發人員的青睞。

  • SDXL Lightning 結合SDXL和先進技術,以 1-8 個步驟提供圖像,并與 LoRA 和 Unet 集成以提高性能。

13、Stable Diffusion 3

Stable Diffusion 3 于 2024 年 2 月預覽,并于 2024 年 4 月通過 API 發布,于2024年6月開放開源模型。

  • SD3: Stable Diffusion 3 通過 Stability AI 開發者平臺的 API 提供。該型號在圖像質量方面超越了之前的所有版本,并具有強大的文本識別能力。它代表了 Stable Diffusion 系列的最新進展,為各種圖像生成任務提供了卓越的性能。

  • SD3 Turbo: StableDiffusion3 Turbo版本提供與Stable Diffusion3 相同的卓越功能,但圖像生成速度明顯更快。該版本專為那些需要在不影響 Stable Diffusion 3 所提供的高質量和強大文字識別能力的前提下快速獲得結果的用戶而設計。

14、Stable Video 3D

2024 年 3 月,Stable AI 公司推出了 Stable Video 3D,它能通過單張圖像制作 360 度可旋轉動畫。

  • Stable Video 3D: 該模型可從靜態圖像生成 21 幀、576x576 像素的動畫,為動畫渲染提供了一個新的維度。

在這里插入圖片描述

截至 2024 年 6 月,Stable Diffusion 已發布了 20 多個版本。每個版本都帶來了獨特的功能和改進,滿足了不同用戶的需求。你最喜歡哪個版本?

感興趣的小伙伴,贈送全套AIGC學習資料,包含AI繪畫、AI人工智能等前沿科技教程和軟件工具,具體看這里。

AIGC技術的未來發展前景廣闊,隨著人工智能技術的不斷發展,AIGC技術也將不斷提高。未來,AIGC技術將在游戲和計算領域得到更廣泛的應用,使游戲和計算系統具有更高效、更智能、更靈活的特性。同時,AIGC技術也將與人工智能技術緊密結合,在更多的領域得到廣泛應用,對程序員來說影響至關重要。未來,AIGC技術將繼續得到提高,同時也將與人工智能技術緊密結合,在更多的領域得到廣泛應用。
?
在這里插入圖片描述

一、AIGC所有方向的學習路線

AIGC所有方向的技術點做的整理,形成各個領域的知識點匯總,它的用處就在于,你可以按照下面的知識點去找對應的學習資源,保證自己學得較為全面。

在這里插入圖片描述

在這里插入圖片描述

二、AIGC必備工具

工具都幫大家整理好了,安裝就可直接上手!
在這里插入圖片描述

三、最新AIGC學習筆記

當我學到一定基礎,有自己的理解能力的時候,會去閱讀一些前輩整理的書籍或者手寫的筆記資料,這些筆記詳細記載了他們對一些技術點的理解,這些理解是比較獨到,可以學到不一樣的思路。
在這里插入圖片描述
在這里插入圖片描述

四、AIGC視頻教程合集

觀看全面零基礎學習視頻,看視頻學習是最快捷也是最有效果的方式,跟著視頻中老師的思路,從基礎到深入,還是很容易入門的。

在這里插入圖片描述

五、實戰案例

紙上得來終覺淺,要學會跟著視頻一起敲,要動手實操,才能將自己的所學運用到實際當中去,這時候可以搞點實戰案例來學習。
在這里插入圖片描述

若有侵權,請聯系刪除

本文來自互聯網用戶投稿,該文觀點僅代表作者本人,不代表本站立場。本站僅提供信息存儲空間服務,不擁有所有權,不承擔相關法律責任。
如若轉載,請注明出處:http://www.pswp.cn/web/38093.shtml
繁體地址,請注明出處:http://hk.pswp.cn/web/38093.shtml
英文地址,請注明出處:http://en.pswp.cn/web/38093.shtml

如若內容造成侵權/違法違規/事實不符,請聯系多彩編程網進行投訴反饋email:809451989@qq.com,一經查實,立即刪除!

相關文章

材質相關內容整理 -ThreeJs

在Three.js中,材質是用來定義3D對象外觀的關鍵部分。Three.js支持多種材質文件和類型,每種材質都有其特定的用途和優勢。下面簡單整理了一下目前Three.js支持的材質文件和類型。 一、Three.js支持的材質文件類型 JPEG (.jpg) 和 PNG (.png) 用途&#x…

iphone新機官網驗機流程

若您想購買新款iPhone并在官方網站上驗證機器的真實性,可以按照以下流程進行: 打開蘋果官方網站(https://www.apple.com)。在導航欄中選擇“iPhone”選項,進入iPhone的產品頁面。在頁面中找到您想要購買的新款iPhone&…

C語言快速學習筆記

學習網站:C 語言教程 | 菜鳥教程 (runoob.com)C 語言教程 | 菜鳥教程 (runoob.com)C 語言教程 | 菜鳥教程 (runoob.com) 這個網站知識完整,講解清晰。 在線C語言編程工具:菜鳥教程在線編輯器 (runoob.com) 國外學習網站:C語言介…

【機器學習】機器學習的重要方法——線性回歸算法深度探索與未來展望

歡迎來到 破曉的歷程博客 引言 在數據科學日益重要的今天,線性回歸算法以其簡單、直觀和強大的預測能力,成為了眾多領域中的基礎工具。本文將詳細介紹線性回歸的基本概念、核心算法,并通過五個具體的使用示例來展示其應用,同時探…

使用conda創建虛擬環境,并將虛擬環境加載到jupyter notebook中【已解決】

使用conda創建虛擬環境,并將虛擬環境加載到jupyter notebook中【已解決】

免費分享:2000-2021年全國分省250mNDVI數據集(附下載方法)

NDVI (Normalized Difference Vegetation Index)歸一化植被指數,又稱標準化植被指數。是目前應用最廣泛的植被指數,與植被的分布呈線性相關,是植被生長狀態和空間分布的最佳指示因子,也是遙感估算植被覆蓋度(FVC,Fract…

深入學習 Kafka(2)- Partition 和 Topic

1. Partition的作用 Topic是邏輯的概念,Partition是物理的概念: Partition 對一個 Topic 的消息進行物理上的分離,讓消息可以分布在不同的實體機器上,可以提升系統吞吐量和并行處理能力。每個Partition可以有多個副本&#xff08…

交換機06_vlantrunk

一、虛擬局域網vlan 目的:劃分廣播域 思科設備如何去配置vlan 創建vlan設置對應的接口模式將接口加入vlan全局模式配置vlan vlan 2 設置接口模式(目前需要將接口加入對應vlan,一般用于連接PC) en conf t int f0/0 switchport m…

SAP S/4 FICO批量創建銀行主數據(銀行主數據/賬戶主數據)開發說明書(包括測試樣例、程序代碼僅作參考,不保證一定可以運行)

開發通用說明 新增程序——批導工具處理邏輯如下:自定義批導程序():點擊“執行”按鈕若數據錯誤或重復,先檢查導入的銀行賬號是否已在系統中存在,若已存在則狀態顯示為紅燈,并在消息反饋列提示“該銀行已經存在”。查重后若銀行賬戶為新增賬戶,但導入模板提供的數據有缺…

Spring Boot中獲取請求參數的幾種方式詳解

Spring Boot中獲取請求參數的幾種方式詳解 在Web開發中,處理HTTP請求是一項基本且核心的任務。Spring Boot作為目前最流行的Java Web開發框架之一,提供了多種簡便的方式來獲取和處理請求參數。本文將深入探討在Spring Boot中獲取請求參數的幾種方式&…

學會python——用python編寫一個計算機程序(python實例十六)

目錄 1.認識Python 2.環境與工具 2.1 python環境 2.2 Visual Studio Code編譯 3.編寫計算器程序 3.1 代碼構思 3.2 代碼實例 3.3 運行結果 4.總結 1.認識Python Python 是一個高層次的結合了解釋性、編譯性、互動性和面向對象的腳本語言。 Python 的設計具有很強的可讀…

【C語言】刷題筆記 Day1

多刷題 多思考 【題目1】 實現字母的大小寫轉換,實現多組輸入輸出 1. getchar 為輸入函數,EOF(end of file)為文件結束標志,通常為文件結束的末尾。 2. 題目中要求實現多組輸入輸出,那我們用 while 循…

RH442 計算機測量單位的換算

計算機測量單位的換算 計算機測量單位的換算 計算機測量單位的換算 在本練習中,您要將性能指標從一個單位換算成另一個單位。 成果 您要學會性能指標單位的換算。 以 student 用戶登錄 workstation 虛擬機,密碼為 student。 在 workstation上運行 l…

初步認識 B樹(B-tree)

定義 B樹(B-tree)是一種自平衡的多路搜索樹,廣泛應用于數據庫和文件系統的索引結構中。它能夠保持數據有序,同時提供高效的插入、刪除和查找操作。 一、基本概念 定義:B樹是一種自平衡的樹結構,能夠保持…

python+django 環境搭建以及post接口封裝

1、搭建pythondjango環境 python 3.7.9的版本 具體參考之前的安裝教程 django 使用 pip install django 會自動安裝 檢驗安裝版本: python -m django --version 2、創建django項目 django-admin startproject projectname 啟動項目:python manage.py…

011-GeoGebra基礎篇-驗證泰勒斯定理(動點在指定曲線上移動)

注意咯,如果說前期的文章隨便看看就行,但從這篇往后的內容,則需要君略微動動brain了。當然,后續的文章如果感覺吃力的話,可以看看本專欄序號比較小的文章,可能會對你開卷有益。 若A, B, C是圓周上的三點&am…

Windows PowerShell 添加新配置文件(打開對應的目錄,并執行命令)

%SystemRoot%\System32\WindowsPowerShell\v1.0\powershell.exe ./redis-server.exe %SystemRoot%\System32\WindowsPowerShell\v1.0\powershell.exe yarn dev 人工智能學習網站 https://chat.xutongbao.top

數據分析如何在企業中發揮價值

數據分析如何在企業中發揮價值 數據分析的目的是什么為什么怎么做做什么 思考問題流程確認問題拆解問題量化分析 分析數據流程收集數據處理數據制作圖表 全流程 數據分析的目的 是什么 通過數據量化企業當前的經營現狀或業務事實,將業務細節轉換為具體數據&#xf…

通過容器啟動QAnything知識庫問答系統

QAnything (Question and Answer based on Anything) 是致力于支持任意格式文件或數據庫的本地知識庫問答系統,可斷網安裝使用。目前已支持格式:PDF(pdf),Word(docx),PPT(pptx),XLS(xlsx),Markdown(md)&…

LabVIEW汽車轉向器測試系統

紹了一種基于LabVIEW的汽車轉向器測試系統。該系統集成了數據采集、控制和分析功能,能夠對轉向器進行高效、準確的測試。通過LabVIEW平臺,實現了對轉向器性能參數的實時監測和分析,提升了測試效率和數據精度,為汽車轉向器的研發和…