一、Stable Diffusion 與 UI 工具概述
Stable Diffusion 是當前最主流的開源 AI 繪畫模型,通過文本描述生成高質量圖像。為降低使用門檻,開發者推出了多種圖形界面(UI)工具,其中AUTOMATIC1111 webUI(簡稱 “webUI”)和ComfyUI是最受歡迎的兩款。二者基于相同的模型內核,但設計理念截然不同:webUI 以直觀易用為核心,適合新手快速上手;ComfyUI 則以節點式工作流為特色,提供極致的定制化能力,滿足專業用戶需求。
二、webUI 與 ComfyUI 核心差異對比
2.1 設計理念與適用人群
維度 | AUTOMATIC1111 webUI | ComfyUI |
---|---|---|
界面形式 | 網頁式交互(瀏覽器訪問),按鈕 + 表單布局 | 節點式圖形界面,通過連接模塊構建工作流 |
操作邏輯 | 預設功能模板,參數填空式調節 | 模塊化拼接,支持自定義數據流向和算法組合 |
適用人群 | 新手、設計師、內容創作者(追求效率和易用性) | 進階用戶、開發者、科研人員(需要精細控制) |
核心優勢 | 插件生態豐富(數千款擴展)、社區教程完善 | 工作流可視化、參數透明化、支持復雜任務串聯 |
典型場景 | 快速文生圖、風格遷移、日常創作 | 多模型混合推理、ControlNet 堆疊控制、科研實驗 |
2.2 關鍵功能對比
- 出圖效率:webUI 通過預設模板實現 “一鍵生成”,平均出圖時間比 ComfyUI 快 10%-20%(相同硬件下);
- 可控性:ComfyUI 支持逐步驟調整采樣器、VAE、LoRA 權重等底層參數,例如可單獨控制 “降噪強度隨步數動態變化”;
- 可復現性:ComfyUI 工作流文件(.json)可直接分享,他人加載后能 100% 復現結果;webUI 需手動記錄種子、模型、插件參數。
三、安裝方法詳解
3.1 webUI 安裝(推薦新手)
3.1.1 硬件要求
- GPU:NVIDIA 顯卡(RTX 2060 6GB 顯存以上,推薦 RTX 3060 8GB+),AMD / 集顯需用 CPU 渲染(速度慢 3-5 倍);
- 內存:16GB 以上(8GB 可運行但易卡頓);
- 存儲:至少 20GB 空閑空間(含模型和插件)。
3.1.2 安裝步驟(Windows 系統)
方法一:整合包安裝(最簡單)
- 下載秋葉整合包(sd-webui-aki-v4.2),解壓至無中文路徑的文件夾(如
D:\SD
); - 運行 “啟動器運行依賴 - dotnet-6.0.11.exe” 安裝依賴;
- 雙擊 “A 啟動器”,點擊 “一鍵啟動”,自動下載基礎模型(如 v1-5-pruned-emaonly.safetensors,3.9GB);
- 瀏覽器訪問
http://127.0.0.1:7860
進入界面。
方法二:手動安裝(適合進階用戶)
- 安裝 Python 3.10.6(官網下載,勾選 “Add Python to PATH”);
- 安裝 Git(官網下載),默認下一步;
- 打開 cmd,輸入以下命令克隆項目:
bash
git clone https://github.com/AUTOMATIC1111/stable-diffusion-webui.git
- 進入
stable-diffusion-webui
文件夾,雙擊webui-user.bat
,等待依賴安裝完成,自動啟動界面。
3.1.3 Mac 系統安裝
- 安裝 Homebrew:
bash
/bin/zsh -c "$(curl -fsSL https://gitee.com/cunkai/HomebrewCN/raw/master/Homebrew.sh)"
- 安裝依賴:
bash
brew install cmake protobuf rust python@3.10 git wget
- 克隆項目并啟動:
bash
git clone https://github.com/AUTOMATIC1111/stable-diffusion-webui.git cd stable-diffusion-webui ./webui.sh
3.2 ComfyUI 安裝(推薦進階用戶)
3.2.1 硬件要求
- GPU:NVIDIA 顯卡(顯存 4GB+,推薦 RTX 3060 12GB+),支持 CPU 運行(需添加
--cpu
參數); - 內存:8GB 以上(復雜工作流建議 16GB+);
- 存儲:SSD 優先(模型加載速度提升 50%),至少 40GB 空間。
3.2.2 安裝步驟(Windows 系統)
方法一:秋葉整合包(新手友好)
- 下載整合包(鏈接),解壓至無中文路徑;
- 雙擊 “繪世啟動器.exe”,選擇 “ComfyUI”,點擊 “一鍵啟動”;
- 自動安裝依賴并啟動,瀏覽器訪問
http://127.0.0.1:8188
。
方法二:手動安裝(原生版)
- 下載壓縮包(官網鏈接);
- 解壓后,根據顯卡類型雙擊啟動腳本:
- NVIDIA 顯卡:
run_nvidia_gpu.bat
- CPU 運行:
run_cpu.bat
- NVIDIA 顯卡:
- 安裝必備插件(ComfyUI-Manager):
bash
cd ComfyUI/custom_nodes git clone https://github.com/ltdrdata/ComfyUI-Manager.git
- 重啟后,通過 Manager 安裝漢化插件(搜索 “translation”),設置界面語言為中文。
四、模型類型與應用
4.1 核心模型分類及作用
模型類型 | 功能描述 | 文件格式 | 典型大小 | 存放路徑 |
---|---|---|---|---|
Checkpoint(大模型) | 基礎生成模型,決定圖像風格(如寫實、二次元) | .safetensors/.ckpt | 2-8GB | models/Stable-diffusion/ |
VAE(變分自編碼器) | 優化色彩和細節(如提亮畫面、修復模糊) | .safetensors/.ckpt | 300-800MB | models/VAE/ |
LoRA(低秩適配) | 微調特定風格 / 元素(如 “賽博朋克頭盔”“梵高畫風”),需搭配大模型使用 | .safetensors/.pt | 10-200MB | models/Lora/ |
Embedding(文本嵌入) | 打包提示詞(如 “完美手部”“高清皮膚”),優化關鍵詞權重 | .pt/.bin | 10-100KB | embeddings/ |
ControlNet | 控制圖像結構(如線稿轉插畫、姿態檢測),需對應預處理器模型 | .safetensors | 1-3GB | models/ControlNet/ |
4.2 2025 年熱門模型推薦
- Checkpoint:
- 寫實類:
Realistic Vision V6
(8K 分辨率支持,皮膚質感突出); - 二次元:
MeinaMix V10
(線條流暢,角色表情生動); - 通用類:
Stable Diffusion 3.5 Large
(81 億參數,支持多模態輸入)。
- 寫實類:
- LoRA:
Forest Jelly Glow
(添加發光森林水母效果,觸發詞jellyfishforest
)、Detail Tweaker XL
(提升金屬 / 布料紋理細節)。 - VAE:
kl-f8-anime2
(二次元專用,色彩鮮艷)、vae-ft-mse-840000-ema-pruned
(寫實類通用)。
五、常用插件推薦
5.1 webUI 必備插件
插件名稱 | 核心功能 | 安裝地址 |
---|---|---|
ControlNet | 通過線稿 / 姿態 / 深度圖控制生成(如 “根據草圖生成人物”) | https://github.com/Mikubill/sd-webui-controlnet |
After Detailer | 自動修復人臉 / 手部瑕疵(支持 9 種修復模型,解決 “六指”“面部扭曲” 問題) | https://github.com/Bing-su/adetailer |
Ultimate SD Upscale | 分塊放大圖像(顯存占用降低 40%,支持 4K/8K 輸出) | https://github.com/Coyote-A/ultimate-upscale-for-automatic1111 |
TagComplete | 提示詞自動補全(支持中文輸入,聯想 “masterpiece”“8k” 等高頻詞) | https://github.com/DominikDoom/a1111-sd-webui-tagcomplete |
5.2 ComfyUI 核心插件
插件名稱 | 核心功能 | 安裝方式 |
---|---|---|
ComfyUI-Manager | 插件 / 模型管理中心(一鍵安裝 / 更新節點,檢測缺失依賴) | 克隆至custom_nodes 目錄 |
AIGODLIKE-ComfyUI-Translation | 界面漢化(支持多語言切換,節點名稱 / 參數提示中文顯示) | 通過 Manager 搜索 “translation” 安裝 |
ComfyUI-Advanced-ControlNet | 多 ControlNet 堆疊(支持 Canny+Depth+Openpose 同時控制,精度提升 30%) | https://github.com/Kosinkadink/ComfyUI-Advanced-ControlNet |
SDXL Prompt Styler | 內置 70 + 風格模板(如 “蒸汽朋克”“折紙藝術”,自動生成對應提示詞) | https://github.com/twri/sdxl_prompt_styler |
六、核心功能深度解析
6.1 webUI 功能亮點
- 文生圖(txt2img):支持批量生成(最多 16 張 / 批),內置 “高清修復(Hires.fix)” 一鍵提升分辨率至 2K/4K;
- 局部重繪(Inpainting):通過畫筆涂抹需修改區域,結合提示詞精準替換(如 “將背景替換為星空”);
- 模型快速切換:下拉菜單選擇大模型 / LoRA,支持 “模型混合”(如 50% 寫實 + 50% 二次元風格)。
6.2 ComfyUI 高級功能
- 工作流嵌套:將常用節點組合為 “超級節點”(如 “文生圖 + ControlNet+Upscale” 打包為一個模塊),簡化復雜界面;
- 潛空間操作:直接編輯 Latent(潛變量)數據,實現 “風格插值”(如從 “寫實” 平滑過渡到 “動漫”);
- 多模型串聯推理:例如 “SDXL 基礎模型生成草圖 → Flux 模型細化細節 → StableSR 放大至 8K”,全流程節點化控制。
七、總結與選擇建議
- 優先選 webUI:如果你是新手、需要快速出圖、依賴豐富插件(如換臉、二維碼生成),或主要用于社交媒體內容創作;
- 優先選 ComfyUI:如果你需要精細控制生成流程、復現科研實驗、分享標準化工作流,或從事專業設計(如游戲原畫、影視概念圖)。
二者并非對立關系,許多用戶會同時安裝:用 webUI 處理日常創作,用 ComfyUI 調試復雜效果。隨著 Stable Diffusion 3.5 等新版本發布,兩款工具的生態正逐步融合,例如 ComfyUI 已支持直接加載 webUI 的插件和模型。