本文的例子都是基于秋葉整合包打開的webui實現的
一、ADetailer——改善人臉扭曲、惡心
After detailer插件可以自動檢測生成圖片的人臉,針對人臉自動上蒙版,自動進行重繪,整個流程一氣呵成,因此可以避免許多重復的操作。除此之外,Adetailer還可以檢測整個人物的手部、眼睛甚至全身,并針對這些部分進行重繪
實例:8個女孩,臉已經崩了
使用After detailer后:臉有了明顯的改善
建議使用Euler a采樣方法,生成的圖像質量好一些
yolov8的修復效果不太好,建議使用mediapipe_face_full,但是mediapipe經常檢測不到側臉
After detailer也可以使用獨立參數,但一定要記得打鉤,不打鉤的話,參數設置也沒用
寫實的模型還沒用過
各模型使用范圍:
二、Tiled Diffusion、Tiled VAE 放大圖片
通過Tiled Diffusion技術,可以將圖像劃分為多個小塊(tiles),然后對每個小塊進行處理,從而生成高分辨率的圖像,適用于顯存不夠的情況
Tiled VAE是將 VAE 移動到 GPU (如果允許)
例如生成一個512*512圖像(兔兒旗袍女性)
使用Tiled Diffusion和Tiled VAE后生成了一副1024*1024的圖像,圖像大體不變、只是一些細節變化了
參數如下,只需改一下放大算法和放大倍數就可以
R-ESRGAN 4x+:寫實圖片
R-ESRGAN 4x+ Anime6B:二次元圖片
如果在網上下載了新的放大模型,放在 sd-webui-aki-v4.10\models\ESRGAN 路徑下
三、Dynamic Thresholding (CFG Scale Fix)動態CFG值調整
CFG(Control Flow Guidance)值是Stable Diffusion中控制生成圖像與提示詞(Prompt)關聯強度的核心參數。動態CFG值調整指在圖像生成過程中實時調整CFG值,以解決高CFG值導致的色彩失真、細節過度銳化等問題,同時平衡生成質量與多樣性。
應用場景:
1、高分辨率生成:在SD3中,動態CFG配合Shift參數調整,優化百萬像素級圖像的噪聲管理。
2、風格化生成:使用動漫、寫實等風格LoRA時,動態CFG可抑制風格沖突導致的細節失真
3、低顯存適配:通過分階段CFG調整,降低高分辨率生成時的顯存峰值占用。
舉例:science fiction,realistic,Cinematic Lighting,chocolate,city_lights,
左邊沒用動態CFG值調整,右邊使用了動態CFG值調整,右邊的效果更好
左邊文生圖,右邊是左側的圖生圖