Stable Diffusion入門-ControlNet 深入理解 第四課:風格遷移與重繪控制模型——讓AI也有“藝術天賦”!


大家好,歡迎回到 Stable Diffusion入門-ControlNet 深入理解 系列的第四課!

如果你還沒有看過上一課,趕緊補課哦:Stable Diffusion入門-ControlNet 深入理解 第三課。

上一課我們講解了 ControlNet 結構類模型,今天我們繼續帶你了解 風格遷移類模型重繪控制類模型,這兩種模型將幫助你在AI繪畫中自由玩轉“藝術創作”和“創意修圖”。

準備好了嗎?讓我們一起來揭開這些神奇的模型的面紗!




一、風格遷移類模型——讓AI學會“模仿大師”


風格遷移類模型的作用,就是讓AI學習一張參考圖的“風格”,然后將這種風格應用到你給定的新圖像上。

這就像是你給AI看了一幅蒙娜麗莎的畫,然后讓它根據蒙娜麗莎的風格去畫你的自拍。

是不是聽起來就很酷?


1. Shuffle洗牌——風格大變樣


Shuffle 算法的作用簡單來說就是“打亂”。

它通過打散參考圖的配色來獲取信息,并將這種風格應用到新的圖像上。

換句話說,AI會“模仿”你給它的參考圖的配色,但它并不會完全復制,而是給你一張“新”圖,保持了參考圖的色調,又不失原創感。


在這里插入圖片描述

需要注意的是,這個 ControlNet 只對1.5模型有效,別忘了,隨著時間的推移,這個預處理器可能會被逐漸淘汰哦!


2. Instant-ID——讓面部特征完美遷移


Instant-ID 是由小紅書開發的面部特征遷移模型,它的厲害之處在于,它可以對面部特征進行精準的遷移,確保新的圖像能夠完美呈現出參考圖中的人物面部特點。

比如,你可以給AI看一張你朋友的照片,然后讓它畫出一張完全符合你朋友面部特征的新畫像。

這個模型的使用要求有點特殊:

  • 只能在 SDXL 大模型中使用。
  • 提示詞引導系數(CFG Scale)需要比通常的設置值低 3-5,否則可能會出現“涂抹感”很強的問題。
  • 需要兩個 ControlNet 來配合使用,每個對應不同的面部特征處理。

3. IP-Adapter——騰訊的“黑科技”適配器


IP-Adapter 是騰訊實驗室發布的一個新適配器,它的主要作用是將輸入的圖像作為圖像提示詞進行風格遷移。

就像 MJ(MidJourney)的墊圖一樣,它能幫助AI學習參考圖的風格,然后把這些風格應用到你的圖像上。


在這里插入圖片描述


這個適配器有多種預處理器,其中有些是專門用來換臉的——比如 face_id 系列,就能讓你給AI一張照片,然后生成一個類似面部特征的圖像。


在這里插入圖片描述

需要注意的是:IP-Adapter 配合 Lora 使用時,必須確保 LoraControlNet 的模型一致,否則可能效果不理想。


在這里插入圖片描述


4. Reference參考——讓AI學會“借鑒”


Reference 預處理器的強大之處在于,它可以根據給定的參考圖像的配色、色調、風格等,生成一張具有相同風格的新圖像。

不同的是,生成的圖像會在保持原圖風格的同時,產生一定的多樣性差異。

你可以使用 reference_adain 來生成二次元風格的圖像,或者使用 reference_only 來進行更通用的風格遷移。

如果你需要更復雜的風格遷移效果,可以選擇 Reference_adain+attn,它能夠生成更高級的特征轉換效果。


在這里插入圖片描述

注意: reference只有預處理器,沒有模型:


在這里插入圖片描述




二、重繪控制類模型——讓AI也能進行“創意修圖”


風格遷移讓AI模仿畫風,而 重繪控制類模型 則是讓AI進行圖像的“創意重繪”,無論是修圖、換背景,還是改變人物姿勢,這些都能通過重繪控制類模型來實現。


1. OpenPose-姿態——讓AI了解人物動作


在第一篇文章中,我們介紹過 OpenPose,它是用來控制人物姿勢和形態的模型。


在這里插入圖片描述

通過 OpenPose,你可以讓AI精確地理解人物的動作,比如跳舞、跑步、擺姿勢等。


dw_openpose_full 是當前最強的預處理器之一,它是 OpenPose_full 的增強版,能夠讓AI識別并生成更加精細的人物姿勢。而 animal_openpose 甚至能夠識別動物的姿勢,真的是突破性進展!


2. Inpaint局部重繪——局部修圖,效果滿分


Inpaint 系列模型主要用于局部重繪,通常用于擴圖或者細節修復。


在這里插入圖片描述


如果你有一張圖像想要擴展,或者其中某些部分需要進行修改,inpaint_only 可以幫助你在保留原圖內容的基礎上,生成新內容。

inpaint_only+lama 則可以徹底抹除原有內容后重新生成,非常干凈。

inpaint_global_harmonious 全局融合算法,因此會導致涂抹以外的區域也發生一些變化,并且整體畫面的顏色也會發生改變。


3. InstructP2P——指令式修圖


想讓一張圖片變成另一種完全不同的風格?比如說,“讓它變成火焰”?InstructP2P 就能實現這個夢想!通過這個模型,你可以給AI一個簡單的指令:“Make Y into X”,它會根據你的指令對圖像進行創意修改。


4. Recolor重上色——AI的“涂色書”功能


如果你已經有了一張圖,但想給它重新上色,Recolor 系列模型就派上用場了。


在這里插入圖片描述


它可以調節圖像的亮度和強度,為圖像增加新的色彩效果。只要你告訴AI,你想要的色調是什么,它就能幫你把圖像重新上色,煥發新生。


5. Tile——給圖片加點“小細節”


Tile 模型的作用就是在保持圖片布局的基礎上,給圖片添加細節。

它經常用來進行高清修復、畫質提升,甚至可以用來轉換圖片風格,像是將真人照片轉為漫畫風格,或者做藝術字的設計。


在這里插入圖片描述


  • tile_resample(分塊-重采樣):僅保持圖片布局,顏色會進行一些變化。(常用)

  • tile_colorfix+sharp(分塊-固定顏色+銳化):保持圖片布局的同時固定圖片的顏色,并做一些銳化

  • tile_colorfix(分塊-固定顏色):保持圖片布局的同時固定圖片的顏色

  • blur_gaussian(模糊-高斯模糊):主要用于調整景深用的

tile 突出用途之一是和tile_diffusion及tile_vae三者組合進行圖生圖放大,可以顯著提高運行效率及放大效果。



總結


今天,我們探討了 風格遷移類模型重繪控制類模型,它們將讓你的創作更加自由、多樣。

從風格遷移到局部修圖,從姿態控制到圖像重上色,ControlNet 為AI繪畫提供了無盡的創意空間。


下一課,我們將深入探討 ControlNet 的其他高級應用,敬請期待!有任何問題或者想法,歡迎在評論區和我互動,我們下課見!

本文來自互聯網用戶投稿,該文觀點僅代表作者本人,不代表本站立場。本站僅提供信息存儲空間服務,不擁有所有權,不承擔相關法律責任。
如若轉載,請注明出處:http://www.pswp.cn/bicheng/86737.shtml
繁體地址,請注明出處:http://hk.pswp.cn/bicheng/86737.shtml
英文地址,請注明出處:http://en.pswp.cn/bicheng/86737.shtml

如若內容造成侵權/違法違規/事實不符,請聯系多彩編程網進行投訴反饋email:809451989@qq.com,一經查實,立即刪除!

相關文章

國產鴻蒙系統開放應用側載,能威脅到Windows地位嗎?

上個月華為正式發布了 HarmonyOS PC 操作系統,關于生態方面大家其實一直蠻擔心。 例如不兼容Windows應用、不支持應用側載等。 不過,在最近舉行的華為開發者大會 2025 電腦分論壇上,華為終端 BG 平板與 PC 產品線總裁(朱懂東&am…

Linux登錄檢查腳本

登錄檢查腳本 提高兼容性(適應不同Linux發行版)增強可視化效果和可讀性增加關鍵資源警戒提示優化表格對齊和顏色使用添加系統安全狀態檢查 #!/bin/bash# 改進版系統登錄提示腳本 # 優化點:兼容性增強、資源警戒提示、表格美化、安全狀態檢查…

jenkinsfile調用groovy

先決條件 gitlab存放jenkinsfile以及groovy代碼,jenkins我個人使用的是2.486具體的部署方法自己搞定,一堆文檔. gitlab創建一個devops8項目組以及my-jenkins-demo2項目用于演示過程 創建群組 這里已經創建好相關群組. 進入群組創建新項目 創建一個空白項目 配置項目選項 說明…

Ubuntu20.04離線安裝Realtek b852無線網卡驅動

最近有個項目,需要在 Ubuntu20.04 LTS 下開發,首先是安裝 Linux,我們可以從下面的網址下載: https://releases.ubuntu.com/20.04/ 本以為一切順利,結果剛開始就給我整不會了。我的電腦是聯想設計師GeekPro7&#xff…

1 Studying《Computer Architecture A Quantitative Approach》5-7

目錄 5 Thread-Level Parallelism 5.1 Introduction 5.2 Centralized Shared-Memory Architectures 5.3 Performance of Symmetric Shared-Memory Multiprocessors 5.4 Distributed Shared-Memory and Directory-Based Coherence 5.5 Synchronization: The Basics 5.6 M…

融智興科技: RFID超高頻柔性抗金屬標簽解析

在當今科技飛速發展的時代, RFID技術憑借其獨特的優勢,在眾多領域得到了廣泛應用。然而,在金屬環境中,傳統RFID標簽往往面臨著諸多挑戰,如信號干擾、識別距離短等問題。融智興科技推出的RFID 超高頻柔性抗金屬標簽&…

PHP Error: 深入解析與解決策略

PHP Error: 深入解析與解決策略 引言 PHP作為世界上最流行的服務器端腳本語言之一,在全球范圍內被廣泛使用。然而,在PHP的開發過程中,錯誤處理是一個非常重要的環節。本文將深入探討PHP錯誤處理的相關知識,包括錯誤類型、錯誤配置、錯誤日志以及常見的錯誤解決策略。 PH…

零基礎langchain實戰二:大模型輸出格式化成json

零基礎langchain實戰一:模型、提示詞和解析器-CSDN博客 書接上文 大模型輸出格式化 在下面例子中:我們需要將大模型的輸出格式化成json。 import os from dotenv import load_dotenvload_dotenv() # 加載 .env 文件 api_key os.getenv("DEEPS…

高通手機跑AI系列之——人臉變化算法

環境準備 手機 測試手機型號:Redmi K60 Pro 處理器:第二代驍龍8移動--8gen2 運行內存:8.0GB ,LPDDR5X-8400,67.0 GB/s 攝像頭:前置16MP后置50MP8MP2MP AI算力:NPU 48Tops INT8 &&…

TortoiseSVN 安裝教程

前言 TortoiseSVN 是一款流行的 免費開源 的 Subversion (SVN) 客戶端,專門為 Windows 操作系統 設計。它通過 Windows 資源管理器集成 提供直觀的圖形化界面,使用戶可以輕松管理版本控制的文件和目錄,無需使用命令行。 主要特點 資源管理器…

多張圖片生成PDF每張圖片生成pdf的一頁

需要的庫 <!-- 生成pdf--><dependency><groupId>com.itextpdf</groupId><artifactId>itextpdf</artifactId><version>5.5.10</version></dependency><!-- https://mvnrepository.com/artifact/commons-net/commons-n…

Java基礎 Map集合框架 LinkedHashMap

LinkedHashMap LinkedHashMap類架構與繼承關系核心特性繼承自 HashMap有序性插入順序訪問順序 雙向鏈表結構非線程安全1.并發修改導致數據丟失2.并發迭代導致 ConcurrentModificationException3.并發修改導致鏈表結構破壞解決方案1. 使用 Collections.synchronizedMap&#xff…

MySQL 離線安裝MariaDB

描述 離線環境下安裝MySQL數據庫&#xff0c;也就是MariaDB 操作 1、找到自帶的mysql rpm -qa | grep -i ^mysql-rpm -qa | grep -i ^maria-2、卸載對應的包 rpm --nodeps -ev mysql-libs-5.1.73-8.el6_8.x86_64安裝 MariaDb 離線安裝包官網下載&#xff1a;地址 這個文…

JSON簡介及其應用

JSON簡介及其應用 A Brief Introduction and Applications of JSON By JacksonML 1. JSON的概念 JSON&#xff08;JavaScript Object Notation&#xff09; 是一種輕量級的數據交換格式&#xff0c;采用鍵值對&#xff08;key-value&#xff09;的方式組織數據&#xff0c;…

RNN(循環神經網絡)與LSTM(長短期記憶網絡)輸出的詳細對比分析

今天在與同事探討RNN時&#xff0c;引出了一個主題&#xff0c;RNN和LSTM的輸出有什么區別。 以下是關于傳統RNN&#xff08;循環神經網絡&#xff09;與LSTM&#xff08;長短期記憶網絡&#xff09;隱藏層內容、輸出結果及模型區別的詳細對比分析&#xff0c;結合結構原理、數…

【閑談】技術債:軟件開發的隱形殺手

編程中的“技術債”&#xff1a;隱形殺手與化解之道 在軟件開發的世界里&#xff0c;我們常談性能、安全、架構設計、用戶體驗等話題&#xff0c;但有一個常被忽視的概念卻如影隨形、悄然吞噬著項目的健康——技術債&#xff08;Technical Debt&#xff09;。 本文將帶你深入…

Elasticsearch | 索引和模板字段管理:增加新字段的詳細操作

關注CodingTechWork 背景介紹 Elasticsearch 是一款基于 Lucene 的搜索和數據分析引擎&#xff0c;廣泛應用于日志分析、全文檢索等領域。在使用 Elasticsearch 時&#xff0c;字段是存儲在索引中的數據單位&#xff0c;字段的定義決定了數據的存儲方式及其檢索效率。因此&…

HTML表格中<tfoot>標簽用法詳解

在HTML中&#xff0c;<tfoot>標簽用于定義表格的頁腳&#xff08;表腳&#xff09;&#xff0c;通常包含匯總信息&#xff08;如總計、平均值等&#xff09;。其核心特點和使用方法如下&#xff1a; 基本特性 位置靈活 <tfoot>必須位于<table>內&#xff0c…

深度學習正負樣本比例的影響及其調節方法

在深度學習中&#xff0c;數據是模型性能的決定性因素之一。特別是在二分類問題中&#xff0c;正負樣本的比例對模型訓練的影響尤為顯著。本文將探討正負樣本比例對深度學習的影響&#xff0c;并給出相應的調節方法和代碼示例。 什么是正負樣本比例&#xff1f; 在二分類問題…

【公司經營】安全公司產品經營

一、產品經營 1.1 產品矩陣設計方法&#xff1a;風險場景驅動? ?分層產品架構? ?基礎層?&#xff1a;防火墻/WAF/EDR&#xff08;標準化硬件軟件&#xff09;?分析層?&#xff1a;SOC平臺/XDR&#xff08;年訂閱制&#xff0c;SaaS化交付&#xff09;?響應層?&#…