AI繪畫 Stable Diffusion圖像的臉部細節控制——采樣器全解析

大家好,我是畫畫的小強

我們在運用AI繪畫 Stable Diffusion 這一功能強大的AI繪圖工具時,我們往往會發現自己對提示詞的使用還不夠充分。在這種情形下,我們應當如何調整自己的策略,以便更加精確、全面地塑造出理想的人物形象呢?舉例來說,假設我們輸入的是:

a girl in dress walks down a country road,vision,front view,audience oriented,

在這里插入圖片描述

圖片效果總是不盡人意在這里插入圖片描述

我們批量四個之后,除去背對的圖片,我們可以看到其余三個的面部非常的奇怪

在這里插入圖片描述

該如何快速處理呢?

原因分析

首先我們要了解臉部崩壞的原因

為什么在使用Stable Diffusion生成全身圖像時,臉部細節往往不夠精細?
  1. 問題一:圖像分辨率和細節處理 在生成全身圖像的過程中,模型會將計算資源集中于整個身體的描繪,包括服裝、姿勢和背景等要素。臉部通常僅占整個圖像的一小部分,相對地,分配給臉部細節處理的資源就顯得有限。這導致在最終生成的全身圖像中,臉部的細節可能不如半身圖像那樣清晰。

  2. 問題二:訓練數據的偏差效應 如果您的數據集中包含了大量高清的半身像而非全身像,Stable Diffusion模型可能會傾向于專注于處理這些半身像。由于全身像包含更多的圖像元素和更高的維度,模型在繪制時需要投入更多的計算能力。因此,它在半身像的處理上可能會更有優勢。

  3. 問題三:生成算法的局限性 當前的生成算法在處理尺寸不同的對象時,可能存在一些限制。例如,臉部區域是一個復雜且細節豐富的部分,而當算法處理全身圖像時,可能難以保持對臉部細節質量的關注。

  4. 問題四:計算資源的限制 要生成一個特定尺寸的圖像(如320x240像素),模型需要進行一系列運算,包括模板提取、特征表示、搜索和匹配等。這些都需要計算資源,并且在有限的資源下,對圖像不同部分的優化可能會增加計算成本。因此,對于全身圖像,可能對臉部細節質量有所優化,或者簡化了處理流程。

解決策略

  1. 利用更高分辨率圖像進行訓練 通過使用更高分辨率的圖像來進行訓練,模型可以學習更多細節,這對提升生成照片中臉部的細節是有益的。但是更高的分辨率會導致人物拉長畸形,大大降低了質量

  2. 在生成全身圖像時采用引導技術 在生成全身圖像時,嘗試應用引導技術(如注意力機制),這樣可以讓模型更加專注于臉部區域,從而提高對臉部細節的關注。

在這里插入圖片描述

我們可以看到即使使用了prompt之后,Stable Diffusion似乎聽不懂一樣只是對面部加了一個渲染,但并沒有達到預期的效果
在這里插入圖片描述

局部重繪

在這里插入圖片描述

我們可以直接點擊這里到局部重繪,在選擇重繪內容之后,如下:
在這里插入圖片描述

提示詞都不用變化,只需要把負面詞加上即可

(worst quality, low quality:1.4),monochrome,zombie,bad_prompt_version2-neg,easynegative (1),(worst quality, low quality:1.4),(depth of field, blurry:1.2),(greyscale, monochrome:1.1),3D face,cropped,lowres,text,(nsfw:1.3),(worst quality:2),(low quality:2),(normal quality:2),normal quality,((grayscale)),skin spots,acnes,skin blemishes,age spot,(ugly:1.331),(duplicate:1.331),(morbid:1.21),(mutilated:1.21),(tranny:1.331),mutated hands,(poorly drawn hands:1.5),blurry,(bad anatomy:1.21),(bad proportions:1.331),extra limbs,(disfigured:1.331),(missing arms:1.331),(extra legs:1.331),(fused fingers:1.61051),(too many fingers:1.61051),(unclear eyes:1.331),lowers,bad hands,missing fingers,extra digit,bad hands,missing fingers,(((extra arms and legs))),

  1. 調整參數設置 通過增加迭代次數或采用不同的采樣方法,可以提高生成圖像的質量,其中包括臉部細節。

在這里插入圖片描述

感興趣的小伙伴,贈送全套AIGC學習資料,包含AI繪畫、AI人工智能等前沿科技教程和軟件工具,具體看這里。

采樣器

在探討Stable Diffusion的核心技術中,采樣器扮演著至關重要的角色。本文將深入分析幾種主要的采樣器,以及它們各自的特點和應用場景,為讀者提供更全面的了解。首先,我們來看Euler采樣器。這是一個基礎而簡潔的工具,它采用歐拉方法來進行迭代操作。歐拉方法本質上是一種高效的數值積分技術,專門用于求解非線性常微分方程。當應用于圖像生成時,Euler采樣器通過迭代去噪,可以有效地去除圖像中的噪聲。盡管速度快,Euler采樣器也可能導致一些圖像細節受損,因為過度的去噪可能會丟失一些微妙的邊緣信息。

接下來是Euler a采樣器,作為Euler的改進版,它增加了額外的參數用于控制去噪過程。這些參數的引入使得用戶能夠在去噪過程中擁有更多的自主權,從而有望獲得更高的圖像質量。這種改進帶來了一系列潛在的優勢:如更平滑的采樣體驗、更精細的噪聲控制以及更優的整體圖像效果。轉向Heun采樣器,它的設計理念源自Heun方法,這是一種結合了Euler和Midpoint方法的創新技術。Heun方法同樣基于數值積分原理,專注于求解常微分方程,并在Stable Diffusion中用于迭代去噪過程。相較于Euler,Heun采樣器展現出更加平滑細膩的采樣過程,同時提供更為卓越的圖像質量。

在這里插入圖片描述

DPM2采樣器則是一種基于物理模型的工具。它采用了“去噪擴散概率模型”(DPM)技術,這一模型能夠在去噪過程中優化控制噪聲水平,進而生成更高質量的圖像。DPM2的強大之處在于它可以精確調整噪聲水平,避免了傳統去噪方法中常見的“過噪”問題。

DPM2 a是DPM2采樣器的又一次重大升級,它繼承了Euler a的特性,并引入了更多的參數來進一步控制去噪流程。這些新參數允許用戶對去噪過程進行精細的控制,有助于提升最終圖像的質量。

DPM fast是DPM系列的另一快速響應選項。它通過降低去噪迭代次數并簡化過程的方式,犧牲了一定的圖像質量以換取生成速度的提升。盡管如此,DPM fast仍然保留了許多吸引人的特點,包括快速的生成效率和更短的處理時間。

DPM adaptive是DPM2采樣器的自適應變體。它具備動態調整采樣策略的能力,能夠根據圖像的復雜度實時調整采樣參數。這樣做的目的是為了平衡高生成速度和高質量輸出之間的關系,確保生成的圖像既快又好。

Restart采樣器是一種利用重啟技術的新型采樣器。當圖像質量開始出現下降趨勢時,Restart采樣器會重新開始整個去噪過程,以恢復圖像的原有質量,防止其進一步惡化。

在這里插入圖片描述

DDIM采樣器基于迭代去噪技術,使用“去噪擴散迭代模型”(DDIM)。這項技術能夠生成非常高質量的圖像,但由于它的迭代特性,生成速度相對較慢。

PLMS采樣器是DDIM采樣器的改良版,它采用了“預條件的Legendre多項式去噪”(PLMS)技術。這種方法不僅能提供更好的圖像質量,還能在生成速度上略勝一籌,與DDIM形成鮮明對比。

UniPC采樣器基于統一概率耦合,采用“統一概率耦合”技術實現高質量圖像輸出。UniPC雖然在圖像質量方面表現出色,但其復雜性和迭代特性導致了較慢的生成速度。

LCM采樣器則基于拉普拉斯耦合模型,運用“拉普拉斯耦合模型”技術。LCM同樣能夠產出非常高品質的圖像,但由于其結構的復雜性及迭代特性,生成速度也相應受到影響。

DPM++ 2M采樣器是DPM2的進一步改進版,它引入了許多額外的去噪步驟和參數,旨在提升圖像質量。特別值得一提的是,DPM++ 2M在去噪概率模型方面做出了重要的更新。

DPM++ SDE采樣器是DPM2的基于隨機微分方程(SDE)的改進版本。SDE技術的引入為圖像生成提供了更加穩定和高質的結果。

DPM++ 2M SDE采樣器是DPM++ 2M與DPM++ SDE結合的產物。它融合了兩種技術的優勢,為用戶帶來了更佳的圖像質量。

DPM++ 2M SDE Heun采樣器是DPM++ 2M SDE的進一步升級,它使用Heun方法進行迭代,結合了去噪擴散概率模型和Heun方法的共同優點。

DPM++ 2S a采樣器是DPM++ 2M的最新版本,它增加了額外參數來精細控制去噪過程。這些新增的控制參數允許用戶在去噪過程中擁有更多選擇,有望獲得更加精細和高質量的圖像。

最后,我們來看看DPM++ 3M SDE采樣器。它是DPM++ 2M SDE采樣器的第三代進化版,引入了更多的去噪步驟和參數以追求更高的圖像質量。DPM++ 3M SDE的目標是在保持前兩代產品優點的同時,進一步提升性能和圖像質量,為用戶提供更加流暢和精細的圖像生成過程。

在這里插入圖片描述

總結

在當今這個視覺至上的時代,無論是藝術創作、廣告宣傳還是社交媒體分享,高質量的圖像都是吸引觀眾、傳遞信息的關鍵。通過上述介紹的解決策略和技術改進方法,我們不僅能夠藝術地掌控人物形象,還能更好地運用Stable Diffusion采樣器,這是圖像生成領域的一大進步。藝術地掌控人物形象,不僅需要我們有獨到的審美眼光,還需要我們掌握相關的技術手段。從化妝造型、服飾搭配到光影效果、后期處理,每一個環節都至關重要。通過上述介紹,我們了解到如何通過細節的調整,讓人物形象更加立體、生動。

在這里插入圖片描述

而Stable Diffusion采樣器的運用,則是圖像生成技術的又一次飛躍。它通過算法模擬出自然、逼真的圖像效果,大大提高了圖像生成的質量和效率。通過上述介紹,我們了解到如何通過調整參數、優化算法,讓Stable Diffusion采樣器更好地為我們服務。

感興趣的小伙伴,贈送全套AIGC學習資料,包含AI繪畫、AI人工智能等前沿科技教程和軟件工具,具體看這里。

AIGC技術的未來發展前景廣闊,隨著人工智能技術的不斷發展,AIGC技術也將不斷提高。未來,AIGC技術將在游戲和計算領域得到更廣泛的應用,使游戲和計算系統具有更高效、更智能、更靈活的特性。同時,AIGC技術也將與人工智能技術緊密結合,在更多的領域得到廣泛應用,對程序員來說影響至關重要。未來,AIGC技術將繼續得到提高,同時也將與人工智能技術緊密結合,在更多的領域得到廣泛應用。
?
在這里插入圖片描述

一、AIGC所有方向的學習路線

AIGC所有方向的技術點做的整理,形成各個領域的知識點匯總,它的用處就在于,你可以按照下面的知識點去找對應的學習資源,保證自己學得較為全面。

在這里插入圖片描述

在這里插入圖片描述

二、AIGC必備工具

工具都幫大家整理好了,安裝就可直接上手!
在這里插入圖片描述

三、最新AIGC學習筆記

當我學到一定基礎,有自己的理解能力的時候,會去閱讀一些前輩整理的書籍或者手寫的筆記資料,這些筆記詳細記載了他們對一些技術點的理解,這些理解是比較獨到,可以學到不一樣的思路。
在這里插入圖片描述
在這里插入圖片描述

四、AIGC視頻教程合集

觀看全面零基礎學習視頻,看視頻學習是最快捷也是最有效果的方式,跟著視頻中老師的思路,從基礎到深入,還是很容易入門的。

在這里插入圖片描述

五、實戰案例

紙上得來終覺淺,要學會跟著視頻一起敲,要動手實操,才能將自己的所學運用到實際當中去,這時候可以搞點實戰案例來學習。
在這里插入圖片描述

若有侵權,請聯系刪除

本文來自互聯網用戶投稿,該文觀點僅代表作者本人,不代表本站立場。本站僅提供信息存儲空間服務,不擁有所有權,不承擔相關法律責任。
如若轉載,請注明出處:http://www.pswp.cn/web/39990.shtml
繁體地址,請注明出處:http://hk.pswp.cn/web/39990.shtml
英文地址,請注明出處:http://en.pswp.cn/web/39990.shtml

如若內容造成侵權/違法違規/事實不符,請聯系多彩編程網進行投訴反饋email:809451989@qq.com,一經查實,立即刪除!

相關文章

域環境提權

域內提權漏洞(1) Netlogon域權限提升 1.查看域控主機名稱 net group "domain controllers" /domain 2.檢測漏洞是否存在 https://github.com/SecuraBV/CVE-2020-1472.git python zerologon_tester.py OWA 192.168.52.138 3.漏洞利用,對域賬號重置 ht…

《簡歷寶典》01 - 一文帶你學會如何寫一份糟糕透頂的簡歷

我們每個人幾乎都會面對找工作這件事,而找工作或者說求職首先就是要寫一份簡歷。今天狗哥將以一個不同的視角帶你寫一份無與倫比,糟糕透頂的求職簡歷,說實話,其實幾年前,我就是這么寫的。 目錄 1. 文件名 2. 基本信…

【項目管理】項目風險管理(Word原件)

風險和機會管理就是在一個項目開發過程中對風險進行識別、跟蹤、控制的手段。風險和機會管理提供了對可能出現的風險進行持續評估,確定重要的風險機會以及實施處理的策略的一種規范化的環境。包括識別、分析、制定處理和減緩行動、跟蹤 。合理的風險和機會管理應盡力…

白騎士的Python教學進階篇 2.4 高級數據結構

系列目錄 上一篇:白騎士的Python教學進階篇 2.3 文件操作??????? 在Python中,掌握高級數據結構可以顯著提升你的編程效率和代碼可讀性。高級數據結構包括列表推導式、生成器與迭代器以及裝飾器。本文將詳細介紹這些高級數據結構,幫助…

算法刷題1-10大排序算法匯總

十種常見排序算法可以分為兩大類: 比較類排序:通過比較來決定元素間的相對次序,由于其時間復雜度不能突破O(nlogn),因此也稱為非線性時間比較類排序。非比較類排序:不通過比較來決定元素間的相對次序,它可…

服務器安裝Nginx教程

1、安裝所需依賴 yum -y install gcc gcc-c make libtool zlib zlib-devel openssl openssl-devel pcre pcre-devel 2、創建nginx目錄并下載Nginx安裝包 //進入/usr/local cd /usr/local//創建nginx目錄 mkdir nginx//進入nginx目錄 cd nginx//下載nginx tar包 wget http://…

Lesson 47 A cup of coffee

Lesson 47 A cup of coffee 詞匯 like v. 喜歡,想要 用法:like 物品 / 人 喜歡……    like 動詞ing 喜歡做……(習慣性)    like to 動詞原形 喜歡做……(一次性) 例句:我喜歡小狗…

[leetcode hot 150]第五百三十題,二叉搜索樹的最小絕對差

題目: 給你一個二叉搜索樹的根節點 root ,返回 樹中任意兩不同節點值之間的最小差值 。 差值是一個正數,其數值等于兩值之差的絕對值。 解析: minDiffInBST 方法是主要方法。創建一個 ArrayList 來存儲樹的節點值。inorderTrave…

前端日常掃盲

一、js標簽語句 直接上代碼 for(let i 0; i < 10; i){console.log("頂層循環");for(let j 0; j < 10; j){console.log("內層循環",i,j);if(i * j > 30){console.log("退出頂層循環");break;}} }如上面的代碼&#xff0c;雙層循環&a…

opencv-yolo-tiny車輛檢測 ----20240705

opencv-yolo-tiny 實現車輛檢測 opencv.dnn模塊已經支持大部分格式的深度學習模型推理,該模塊可以直接加載tensorflow、darknet、pytorch等常見深度學習框架訓練出來的模型,并運行推理得到模型輸出結果。opecnv.dnn模塊已經作為一種模型部署方式,應用在工業落地實際場景中。…

持續交付:自動化測試與發布流程的變革

目錄 前言1. 持續交付的概念1.1 持續交付的定義1.2 持續交付的核心原則 2. 持續交付的優勢2.1 提高交付速度2.2 提高軟件質量2.3 降低發布風險2.4 提高團隊協作 3. 實施持續交付的步驟3.1 構建自動化測試體系3.1.1 單元測試3.1.2 集成測試3.1.3 功能測試3.1.4 性能測試 3.2 構建…

(一)進程與線程

一、進程和線程的概念 1.1 進程 程序由指令和數據組成&#xff0c;但這些指令要運行&#xff0c;數據要讀寫&#xff0c;就必須將指令加載至CPU&#xff0c;數據加載至內存。在指令運行過程中還需要用到磁盤、網絡等設備。進程就是用來加載指令、管理內存、管理 IO 的。當一個…

鴻蒙系統的開發與學習

1.開發工具的下載 DevEco Studio-HarmonyOS Next Beta版-華為開發者聯盟 安裝、環境配置時&#xff0c;建議 自定義目錄 注意&#xff1a;路徑中不要有 中文、特殊字符。 2.ArkTS基礎總結 1&#xff09;三種數據類型 ① string 字符串&#xff1a;描述信息 ② number 數…

銀聯快捷支付的優點!

快速支付&#xff0c;又稱電子支付或第三方支付&#xff0c;在行業中得到了廣泛的應用。用戶只需通過銀行完成交易。方便快捷是指銀行可以在任何條件下支持用戶之間的轉賬、支付等即時結算服務。快速支付是指用戶可以通過手機實現銀行卡等相關操作。然而&#xff0c;現在大多數…

Java后端每日面試題(day1)

目錄 JavaWeb三大組件依賴注入的方式Autowire和Resurce有什么區別&#xff1f;Spring Boot的優點Spring IoC是什么&#xff1f;說說Spring Aop的優點Component和Bean的區別自定義注解時使用的RetentionPolicy枚舉類有哪些值&#xff1f;如何理解Spring的SPI機制&#xff1f;Spr…

聽說現在AI產品經理薪資30k起步?0基礎可以轉行AI產品嗎?

2024年&#xff0c;還有什么新風口&#xff1f; AI、元宇宙、NFT… 很多人不知道&#xff0c;其實不管是元宇宙還是NFT&#xff0c;它們本質上就是人工智能領域。 AI自身應用領域非常廣泛&#xff0c;大批高薪崗位隨之涌了出來&#xff0c;包括AI產品經理。 AI產品經歷具體工…

CSS Float(浮動)

CSS Float(浮動) 概述 CSS Float(浮動)是一種布局技術,它允許開發人員將元素(如圖片或文本)沿著其容器的左側或右側放置,并且讓其他內容圍繞它流動。這種技術在過去被廣泛用于創建多欄布局,盡管現代CSS提供了更多高級的布局方法(如Flexbox和Grid),但理解浮動仍然…

【LeetCode:841. 鑰匙和房間 + DFS】

&#x1f680; 算法題 &#x1f680; &#x1f332; 算法刷題專欄 | 面試必備算法 | 面試高頻算法 &#x1f340; &#x1f332; 越難的東西,越要努力堅持&#xff0c;因為它具有很高的價值&#xff0c;算法就是這樣? &#x1f332; 作者簡介&#xff1a;碩風和煒&#xff0c;…

安卓手機已刪除短信如何恢復?這2個技巧,找回離家出走的短信

手機宛如一座豐富的寶庫&#xff0c;珍藏著生活中的點滴回憶。其中&#xff0c;短信作為溝通的橋梁&#xff0c;記錄著我們與親朋好友間的溫情脈脈&#xff0c;承載著無數珍貴的瞬間。然而&#xff0c;有時&#xff0c;我們卻會不慎觸發寶庫中的機關&#xff0c;使得這些寶貴的…

陳文自媒體:30歲房貸1000萬,杠杠超乎想象!

首先寫這個文章我要聲明&#xff0c;這個內容沒有傳播負能量&#xff0c;沒有傳播所謂的焦慮&#xff0c;我只是想表達一下我的觀點。 昨天的中金30歲女士的事件&#xff0c;我相信很多網友都知道了&#xff0c;已經上了熱搜了。 簡單總結一下原因&#xff0c;據說是她和老公…