Stable Diffusion 擴展知識實操整合

本文的例子都是基于秋葉整合包打開的webui實現的

一、ADetailer——改善人臉扭曲、惡心

After detailer插件可以自動檢測生成圖片的人臉，針對人臉自動上蒙版，自動進行重繪，整個流程一氣呵成，因此可以避免許多重復的操作。除此之外，Adetailer還可以檢測整個人物的手部、眼睛甚至全身，并針對這些部分進行重繪

實例：8個女孩，臉已經崩了

使用After detailer后：臉有了明顯的改善

建議使用Euler a采樣方法，生成的圖像質量好一些

yolov8的修復效果不太好，建議使用mediapipe_face_full，但是mediapipe經常檢測不到側臉

After detailer也可以使用獨立參數，但一定要記得打鉤，不打鉤的話，參數設置也沒用

寫實的模型還沒用過

各模型使用范圍：

二、Tiled Diffusion、Tiled VAE 放大圖片

通過Tiled Diffusion技術，可以將圖像劃分為多個小塊（tiles），然后對每個小塊進行處理，從而生成高分辨率的圖像，適用于顯存不夠的情況
Tiled VAE是將 VAE 移動到 GPU (如果允許)
例如生成一個512*512圖像（兔兒旗袍女性）

使用Tiled Diffusion和Tiled VAE后生成了一副1024*1024的圖像，圖像大體不變、只是一些細節變化了

參數如下，只需改一下放大算法和放大倍數就可以

R-ESRGAN 4x+：寫實圖片
R-ESRGAN 4x+ Anime6B：二次元圖片
如果在網上下載了新的放大模型，放在 sd-webui-aki-v4.10\models\ESRGAN 路徑下

三、Dynamic Thresholding (CFG Scale Fix)動態CFG值調整

CFG（Control Flow Guidance）值是Stable Diffusion中控制生成圖像與提示詞（Prompt）關聯強度的核心參數。動態CFG值調整指在圖像生成過程中實時調整CFG值，以解決高CFG值導致的色彩失真、細節過度銳化等問題，同時平衡生成質量與多樣性。

應用場景:
1、高分辨率生成：在SD3中，動態CFG配合Shift參數調整，優化百萬像素級圖像的噪聲管理。
2、風格化生成：使用動漫、寫實等風格LoRA時，動態CFG可抑制風格沖突導致的細節失真
3、低顯存適配：通過分階段CFG調整，降低高分辨率生成時的顯存峰值占用。

舉例：science fiction,realistic,Cinematic Lighting,chocolate,city_lights,
左邊沒用動態CFG值調整，右邊使用了動態CFG值調整，右邊的效果更好
左邊文生圖，右邊是左側的圖生圖

本文來自互聯網用戶投稿，該文觀點僅代表作者本人，不代表本站立場。本站僅提供信息存儲空間服務，不擁有所有權，不承擔相關法律責任。
如若轉載，請注明出處：http://www.pswp.cn/news/901021.shtml
繁體地址，請注明出處：http://hk.pswp.cn/news/901021.shtml
英文地址，請注明出處：http://en.pswp.cn/news/901021.shtml

如若內容造成侵權/違法違規/事實不符，請聯系多彩編程網進行投訴反饋email:809451989@qq.com，一經查實，立即刪除！