Stable Diffusion教程|快速入門SD繪畫原理與安裝

什么是Stable Diffusion,什么是煉丹師?根據市場研究機構預測,到2025年全球AI繪畫市場規模將達到100億美元,其中Stable Diffusion(簡稱SD)作為一種先進的圖像生成技術之一,市場份額也在不斷增長,越來越多的人參與到AI掘金這場運動中來。煉丹師,就是指那些專門研究、開發與應用Stable Diffusion模型的專業人士或愛好者,他們在實踐中不斷優化模型,使其產生更高質量、更具創意的圖像。

目錄

_1 SD繪畫原理
_

2 本地部署安裝SD WebUI

3 生成第一張SD繪畫

**一、**SD繪畫原理

基本概念

名詞
解釋說明?
Stable?Diffusion是一種基于擴散模型的先進的人工智能技術,特別適用于文本到圖像(Text-to-Image)的生成任務。該模型由CompVis、Stability AI、LAION等研究機構和公司合作研發,它利用擴散過程在潛在空間(latent space)中生成圖像,而不是直接在高維像素空間中操作。
SD?WebUIStable Diffusion Web UI (SD WebUI)?是一個用于交互式控制和使用 Stable Diffusion 模型的網頁應用程序界面。用戶可以通過這個界面輸入文本提示(prompt)來驅動模型生成相應的圖像,提供了簡單易用的方式來體驗和定制基于 Stable Diffusion 的文本到圖像生成過程。
Python是一種廣泛使用的高級編程語言,以其語法簡潔清晰和代碼可讀性強而著稱。在AI領域,Python尤為流行,因為它擁有豐富的科學計算、機器學習和數據處理相關的庫,比如NumPy、Pandas和TensorFlow等。在部署和使用像Stable Diffusion這樣的深度學習模型時,Python常被作為開發和運行環境的基礎。
Controlnet插件
是針對 Stable Diffusion 模型開發的一種功能擴展插件,它允許用戶在文本生成圖像的過程中實現更為細致和精確的控制。該插件使得用戶不僅能夠通過文本提示(prompt)指導模型生成圖像,還能添加額外的輸入條件,比如控制圖像的構圖、顏色、紋理、物體位置、人物姿勢、景深、線條草圖、圖像分割等多種圖像特征。通過這種方式,ControlNet 提升了 AI 繪畫系統的可控性和靈活性,使得藝術創作和圖像編輯更加精細化。
Controlnet模型是配合上述插件工作的一個組成部分,它是經過訓練以實現對大型預訓練擴散模型(如 Stable Diffusion)進行細粒度控制的附加神經網絡模型。ControlNet 模型可以學習如何根據用戶的特定需求去調整原始擴散模型的輸出,即便是在訓練數據有限的情況下,依然能夠確保生成結果的質量和穩定性。例如,ControlNet 可能包括用于識別和利用邊緣映射、分割映射或關鍵點信息的子模塊,從而實現對生成圖像的特定區域進行針對性修改或強化。
VAE

Variational Autoencoder (VAE): 變分自編碼器是一種概率生成模型,它結合了編碼器(將輸入數據編碼為潛在空間中的概率分布)和解碼器(從潛在空間重構數據)的概念。在圖像生成場景中,VAE可以用來學習數據的潛在表示,并基于這些表示生成新的圖像。

CHECKPOINT
SD能夠繪圖的基礎模型,因此被稱為大模型、底模型或者主模型,WebUI上就叫它Stable Diffusion模型。安裝完SD軟件后,必須搭配主模型才能使用。不同的主模型,其畫風和擅長的領域會有側重。checkpoint模型包含生成圖像所需的一切,不需要額外的文件。
hyper-network超網絡是一種模型微調技術,最初是由NOVA AI 公司開發的。它是一個附屬于Stable Diffusion 穩定擴散模型的小型神經網絡,是一種額外訓練出來的輔助模型,用于修正SD穩定擴散模型的風格。
LORA?
全稱是Low-Rank Adaptation of Large Language Models?低秩的適應大語言模型,可以理解為SD模型的一種插件,和hyper-network,controlNet一樣,都是在不修改SD模型的前提下,利用少量數據訓練出一種畫風/IP/人物,實現定制化需求,所需的訓練資源比訓練SD模要小很多,非常適合社區使用者和個人開發者。LoRA最初應用于NLP領域,用于微調GPT-3等模型(也就是ChatGPT的前生)。由于GPT參數量超過千億,訓練成本太高,因此LoRA采用了一個辦法,僅訓練低秩矩陣(low rank matrics),使用時將LoRA模型的參數注入(inject)SD模型,從而改變SD模型的生成風格,或者為SD模型添加新的人物/IP。

prompt

提示詞/咒語

工作原理

Stable Diffusion就是一個接收文本提示詞,并生成相應圖像的生成模型。

SD來自于擴散模型(Diffusion Model)

擴散模型:(Diffusion Model)的核心原理被生動地比喻為物理學中的擴散過程,通過前向擴散過程逐漸將圖像轉化為噪聲圖像,然后通過反向擴散過程恢復出清晰的圖像。在Stable Diffusion中,模型訓練了一個噪聲預測器(noise predictor),它是一個U-Net結構的神經網絡,可以預測并從圖像中去除噪聲,從而重構原始圖像。

然而,傳統的擴散模型在圖像空間中的運算效率極低,不適合實時應用。為此,Stable Diffusion采用了在潛在空間(latent space)中進行擴散的過程,利用變分自編碼器(VAE)將圖像壓縮到較低維度的空間,極大地提高了計算速度和效率。

Stable Diffusion的具體工作流程包括:

  1. 輸入圖像被編碼到潛在空間。

  2. 添加噪聲,并通過噪聲預測器估算添加的噪聲量。

  3. 反復迭代,通過噪聲預測器預測并減去潛在噪聲。

  4. 使用VAE的解碼器將清理過的潛在圖像轉換回像素空間,生成最終圖像。

學習資料

國外一手資料:

stability.ai官網
https://stability.ai/about

github開源項目

https://github.com/CompVis/stable-diffusion/blob/main/README.md

The Illustrated Stable Diffusion @Jay Alammar 講的原理
https://jalammar.github.io/illustrated-stable-diffusion/
這份完整版的SD整合包已經上傳CSDN,朋友們如果需要可以微信掃描下方CSDN官方認證二維碼免費領取【保證100%免費

在這里插入圖片描述

二、本地部署安裝SD WebUI

硬件條件

說明:本地部署的硬件要求,當然使用云端部署租賃更高端的機器也是沒問題。


最低推薦配置

推薦配置

備注

顯卡(GPU)

GTX1050Ti

低配推薦:RTX4060Ti-16G高配推薦:RTX4090

為達到良好的體驗,請盡可能使用8GB顯存及以上顯卡。低顯存雖然能跑,但是體驗極差

內存(RAM)

8GB內存

總內存24GB及以上

可以開啟虛擬內存,內存過小會在加載模型的時候出現問題

存儲空間

20GB任意存儲設備

500GB以上固態硬盤

強烈建議單獨使用一個盤符,如果不想啟動的時候等10分鐘的話,那么只推薦使用SSD

CPU

x86架構的Intel或AMD等處理器都可以,

若為Mac電腦建議使用搭載M系列芯片的機型。

  1. 顯卡VRAM在4GB以下的會很容易遇到顯存不足的問題,即使使用放大插件也就非常慢(以時間換顯存)

2. 顯卡較差/顯存嚴重不足時可以開啟CPU模式,但是速度非常慢。你不希望一個小時一張圖的話那就別想著用CPU跑圖。

軟件需求

Windows:最低要求為Windows 10 64比特,請確保系統已更新至最新版本。

macOS:最低要求為macOS Monterey (12.5),如果可以的話請使用最新版macOS。建議使用搭載Apple Silicon M芯片 (M1、M2) 的Mac機型。舊款Mac需配備AMD獨立顯卡,只有Intel核顯的不能使用。

下載地址 (不藏著掖著,直接拿走不謝)
這份完整版的SD整合包已經上傳CSDN,朋友們如果需要可以微信掃描下方CSDN官方認證二維碼免費領取【保證100%免費

在這里插入圖片描述

安裝部署

2025.1月 更新了最新的整合包,無需任何操作即可達到最佳速度,解壓打開即用,內置啟動器。

整合包做了哪些事情?打包了 Python、Git、CUDA 等等必須的環境,并且放了運行必須的模型。簡單來說,整合包就是 SD-WebUI內核+啟動器+安裝好的環境+必須的模型。你只需下載它解壓就可以直接啟動運行!

特別鳴謝,安裝包作者@秋葉aaaki

**三、**生成第一張SD繪畫

啟動“A啟動器.exe”

加載更新

點擊“一鍵啟動”

[不要關閉它],它會自動打開,瀏覽器地址"http://127.0.0.1:7860/?__theme=dark"

基本功能介紹

界面及操作說明
stable diffusion模型
下拉,替換大模型/底模
正面提示詞 Tag

(想要的內容,提示詞)

如:masterpiece, best quality,

反面提示詞 Tag

(不想要的內容,提示詞)

如:lowres, bad anatomy, bad hands, text, error, missing fingers, extra digit, fewer digits, cropped, worst quality, low quality, normal quality, jpeg artifacts, signature, watermark, username, blurry

提示詞加權重

(girl) 加權重,這里是1.1倍。

((girl)) 加很多權重,1.1*1.1=1.21倍,以此類推。

提示詞減權重[girl] 減權重,一般用的少。減權重也一般就用下面的指定倍數。
提示詞指定權重
(girl:1.5) 指定倍數,這里是1.5倍的權重。還可以 (girl:0.9) 達到減權重的效果
采樣迭代步數

不需要太大,一般在50以內。通常28是一個不錯的值。

采樣方法
沒有優劣之分,但是他們速度不同。全看個人喜好。推薦的是圖中圈出來的幾個,速度效果都不錯
提示詞相關性代表你輸入的 Tag 對畫面的引導程度有多大,可以理解為 “越小AI越自由發揮”,太大會出現銳化、線條變粗的效果。太小AI就自由發揮了,不看 Tag
隨機種子生成過程中所有隨機性的源頭 每個種子都是一幅不一樣的畫。默認的 -1 是代表每次都換一個隨機種子。由隨機種子,生成了隨機的噪聲圖,再交給AI進行畫出來

切換webUI黑白皮膚,修改瀏覽器http地址:
白:http://127.0.0.1:7860/?__theme=light
黑:http://127.0.0.1:7860/?__theme=dark

輸入提示詞【1 girl】,點擊生成即可:

(我安裝了皮膚插件,所以和你運行的界面稍微酷炫一點_

**點點下方【收藏】和【】再走,贈人玫瑰 手留余香!****

本文來自互聯網用戶投稿,該文觀點僅代表作者本人,不代表本站立場。本站僅提供信息存儲空間服務,不擁有所有權,不承擔相關法律責任。
如若轉載,請注明出處:http://www.pswp.cn/diannao/73267.shtml
繁體地址,請注明出處:http://hk.pswp.cn/diannao/73267.shtml
英文地址,請注明出處:http://en.pswp.cn/diannao/73267.shtml

如若內容造成侵權/違法違規/事實不符,請聯系多彩編程網進行投訴反饋email:809451989@qq.com,一經查實,立即刪除!

相關文章

Webpack構建流程詳解優化前端性能\Dev-Server與Proxy\網絡攻擊\HMR

簡版 核心流程圖 根據,Webpack的構建流程分為初始化、編譯和輸出三個階段。初始化階段讀取配置、加載插件、實例化Compiler。編譯階段(構建依賴關系)涉及Compiler類的運行,生成Compilation對象,處理模塊依賴。輸出階…

《Transformer如何進行圖像分類:從新手到入門》

引言 如果你對人工智能(AI)或深度學習(Deep Learning)感興趣,可能聽說過“Transformer”這個詞。它最初在自然語言處理(NLP)領域大放異彩,比如在翻譯、聊天機器人和文本生成中表現出…

Java --- 根據身份證號計算年齡

介紹 根據身份證號計算年齡 Java代碼 /*** 根據身份證號計算年齡* param birthDateStr* return*/public static int calculateAge(String birthDateStr) {try {birthDateStrbirthDateStr.substring(6,68);// 定義日期格式SimpleDateFormat sdf new SimpleDateFormat("…

零成本搭建Calibre個人數字圖書館支持EPUB MOBI格式遠程直讀

文章目錄 前言1.網絡書庫軟件下載安裝2.網絡書庫服務器設置3.內網穿透工具設置4.公網使用kindle訪問內網私人書庫 前言 嘿,各位書蟲們!今天要給大家安利一個超級炫酷的技能——如何在本地Windows電腦上搭建自己的私人云端書庫。亞馬遜服務停了&#xff…

【Linux 指北】常用 Linux 指令匯總

第一章、常用基本指令 # 注意: # #表示管理員 # $表示普通用戶 [rootlocalhost Practice]# 說明此處表示管理員01. ls 指令 語法: ls [選項][目錄或文件] 功能:對于目錄,該命令列出該目錄下的所有子目錄與文件。對于文件&#xf…

跟蹤napi_gro_receive_entry時IP頭信息缺失的分析

問題描述 在使用eBPF程序跟蹤napi_gro_receive_entry內核跟蹤點時,發現獲取到的IP頭部字段(如saddr、daddr、protocol)為空值。 代碼如下: /* 自定義結構體來映射 napi_gro_receive_entry tracepoint 的 format */ struct napi…

Android子線程更新View的方法原理

對于所有的Android開發者來說,“View的更新必須在UI線程中進行”是一項最基本常識。 如果不在UI線程中更新View,系統會拋出CalledFromWrongThreadException異常。那么有沒有什么辦法可以不在UI線程中更新View?答案當然是有的! 一…

【Manus資料合集】激活碼內測渠道+《Manus Al:Agent應用的ChatGPT時刻》(附資源)

DeepSeek 之后,又一個AI沸騰,沖擊的不僅僅是通用大模型。 ——全球首款通用AI Agent的破圈啟示錄 2025年3月6日凌晨,全球AI圈被一款名為Manus的產品徹底點燃。由Monica團隊(隸屬中國夜鶯科技)推出的“全球首款通用AI…

Python----計算機視覺處理(opencv:像素,RGB顏色,圖像的存儲,opencv安裝,代碼展示)

一、計算機眼中的圖像 像素 像素是圖像的基本單元,每個像素存儲著圖像的顏色、亮度和其他特征。一系列像素組合到一起就形成 了完整的圖像,在計算機中,圖像以像素的形式存在并采用二進制格式進行存儲。根據圖像的顏色不 同,每個像…

SQLiteStudio:一款免費跨平臺的SQLite管理工具

SQLiteStudio 是一款專門用于管理和操作 SQLite 數據庫的免費工具。它提供直觀的圖形化界面,簡化了數據庫的創建、編輯、查詢和維護,適合數據庫開發者和數據分析師使用。 功能特性 SQLiteStudio 提供的主要功能包括: 免費開源,可…

【軟考網工-實踐篇】DHCP 動態主機配置協議

一、DHCP簡介 DHCP,Dynamic Host Configuration Protocol,動態主機配置協議。 位置:DHCP常見運行于路由器上,作為DHCP服務器功能:用于自動分配IP地址及其他網絡參數給網絡中的設備作用:簡化網絡管理&…

【Linux學習筆記】Linux用戶和文件權限的深度剖析

【Linux學習筆記】Linux用戶和文件權限的深度剖析 🔥個人主頁:大白的編程日記 🔥專欄:Linux學習筆記 前言 文章目錄 【Linux學習筆記】Linux用戶和文件權限的深度剖析前言一. Linux權限管理1.1 文件訪問者的分類(人)…

Centos離線安裝openssl-devel

文章目錄 Centos離線安裝openssl-devel1. openssl-devel是什么?2. openssl-devel下載地址3. openssl-devel安裝4. 安裝結果驗證 Centos離線安裝openssl-devel 1. openssl-devel是什么? openssl-devel 是 Linux 系統中與 OpenSSL 加密庫相關的開發包&…

深度學習篇---Opencv中Haar級聯分類器的自定義

文章目錄 1. 準備工作1.1安裝 OpenCV1.2準備數據集1.2.1正樣本1.2.2負樣本 2. 數據準備2.1 正樣本的準備2.1.1步驟2.1.2生成正樣本描述文件2.1.3示例命令2.1.4正樣本描述文件格式 2.2 負樣本的準備2.2.1步驟2.2.2負樣本描述文件格式 3. 訓練分類器3.1命令格式3.2參數說明 4. 訓…

Smart Time Plus smarttimeplus-MySQLConnection SQL注入漏洞(CVE-2024-53544)

免責聲明 本文所描述的漏洞及其復現步驟僅供網絡安全研究與教育目的使用。任何人不得將本文提供的信息用于非法目的或未經授權的系統測試。作者不對任何由于使用本文信息而導致的直接或間接損害承擔責任。如涉及侵權,請及時與我們聯系,我們將盡快處理并刪除相關內容。 0x01…

58.Harmonyos NEXT 圖片預覽組件架構設計與實現原理

溫馨提示:本篇博客的詳細代碼已發布到 git : https://gitcode.com/nutpi/HarmonyosNext 可以下載運行哦! Harmonyos NEXT 圖片預覽組件架構設計與實現原理 文章目錄 Harmonyos NEXT 圖片預覽組件架構設計與實現原理效果預覽一、組件架構概述1. 核心組件層…

虛擬機下ubuntu進不了圖形界面

6.844618] piix4_smbus 0000:07.3: SMBus Host ContrFoller not enabled! 7.859836] sd 2:0:0:0:0: [sda] Assuming drive cache: wirite through /dev/sda1: clean, 200424/1966080 files, 4053235/7864064 blocks ubuntu啟動時,卡在上面輸出位置 當前遇到的原因…

Appium高級操作--從源碼角度解析--模擬復雜手勢操作

書接上回,Android自動化--Appium基本操作-CSDN博客文章瀏覽閱讀600次,點贊10次,收藏5次。書接上回,上一篇文章已經介紹了appium在Android端的元素定位方法和識別工具Inspector,本次要介紹使用如何利用Appium對找到的元…

SpringBoot學生宿舍管理系統的設計與開發

項目概述 幽絡源分享的《SpringBoot學生宿舍管理系統的設計與開發》是一款專為校園宿舍管理設計的智能化系統,基于SpringBoot框架開發,功能全面,操作便捷。該系統涵蓋管理員、宿管員和學生三大角色,分別提供宿舍管理、學生信息管…

愛普生溫補晶振 TG5032CFN高精度穩定時鐘的典范

在科技日新月異的當下,眾多領域對時鐘信號的穩定性與精準度提出了極為嚴苛的要求。愛普生溫補晶振TG5032CFN是一款高穩定性溫度補償晶體振蕩器(TCXO)。該器件通過內置溫度補償電路,有效抑制環境溫度變化對頻率穩定性的影響&#x…