AIGC 006-textual-inversion使用文本反轉實現個性化文本到圖像生成!

AIGC 006-textual-inversion使用文本反轉實現個性化文本到圖像生成!


文章目錄

    • 0 論文工作
    • 1 論文方法
    • 2 效果

0 論文工作

這篇論文 (An Image is Worth One Word: Personalizing Text-to-Image Generation using Textual Inversion) 提出了一種新穎的技術,名為 “文本反轉 (Textual Inversion)”,用于個性化文本到圖像生成模型。該技術允許用戶通過學習新的 “偽詞” 來將特定主題或風格 嵌入到預訓練模型中。 這些偽詞對應于模型潛空間中的一個向量,能夠捕捉主題或風格的關鍵特征。用戶只需要提供幾張目標圖像,就能教會模型理解這個新詞,并用它來生成個性化圖像。
文本到圖像的模型提供了前所未有的自由,通過自然語言來指導創造。然而,目前還不清楚如何行使這種自由來產生特定的獨特概念的圖像或者在新的角色和新的場景中創作它們。換句話說,我們如何使用語言引導的模型來把我們的貓變成一幅畫,或者想象一個基于我們的新產品最喜歡的玩具嗎?在這里,論文提出了一個簡單的方法,允許這樣的創作自由。如果只使用3-5張用戶提供的概念的圖像,比如對象或風格,我們就可以學習通過新的“word”來表示它在一個凍結的文本到圖像模型的嵌入空間中。這些“詞”可以被組成成自然語言的句子,以一種直觀的方式指導個性化的創造。
與contronet dreambooth等方法在定制化概念上有一樣的效果,但是這個早期的論文使用了不同的思路。
論文鏈接
github

1 論文方法

文本反轉的核心思想是將一個新的 “偽詞” 與一組特定主題的圖像關聯起來,并通過優化該偽詞對應的詞嵌入向量,使其能夠在文本到圖像生成過程中準確地表達該主題。他會優化詞向量空間直到找到一個準確的詞對應這個圖像。
在這里插入圖片描述

a. 學習偽詞:
選擇目標圖像: 選擇 3-5 張清晰、高質量的圖像,這些圖像應該代表你想要嵌入到模型中的主題或風格。
創建偽詞: 選擇一個新的、模型從未見過的詞來代表這個主題,論文中使用 “S*” 作為示例,你可以選擇任何你喜歡的詞,例如 “MyStyle” 或 “MyDog”。
初始化詞嵌入: 模型會為這個偽詞隨機初始化一個詞嵌入向量,這個向量代表了模型對這個詞的理解,初始時是隨機的,沒有任何意義。
微調詞嵌入:
凍結模型參數: 為了避免破壞預訓練模型的生成能力,我們會凍結模型中除了偽詞嵌入之外的所有參數。
使用對比損失: 我們會使用一個對比損失函數來優化偽詞的詞嵌入。
正樣本: 將目標圖像與包含偽詞的文本提示 (例如 “一只 S* 狗”) 送入模型,鼓勵模型生成與目標圖像相似的圖像。
負樣本: 將其他隨機圖像與相同的文本提示送入模型,鼓勵模型生成與目標圖像不同的圖像。
迭代優化: 通過不斷迭代優化,偽詞的詞嵌入會逐漸學習到目標主題的特征,使得模型能夠理解這個偽詞并生成對應的圖像。
b. 圖像生成:
使用偽詞生成: 在文本提示中使用學習到的偽詞,例如 “一只 S* 狗”,來引導模型生成包含目標主題的圖像。
風格控制: 你可以通過調整偽詞在文本提示中的權重或將其與其他詞組合來控制生成圖像的風格。例如,“一只可愛的 S* 狗” 或 “一只 S* 風格的貓”。
2. 優勢:
高效性: 只需少量圖像即可將新概念嵌入到模型中,不需要從頭訓練模型。
易用性: 用戶只需提供目標圖像和一個偽詞,學習過程自動完成。
靈活性: 學習到的偽詞可以在不同的文本提示中重復使用,生成各種組合和變化。
可解釋性: 偽詞對應于模型潛空間中的一個特定向量,可以幫助理解模型如何表示概念。
3. 缺點:
表達能力: 單個偽詞可能難以完全捕捉復雜主題或風格的所有細微差別。
過度擬合: 使用過少的訓練圖像可能會導致過度擬合,限制了偽詞的泛化能力。
語義一致性: 生成的圖像可能并不總是與偽詞的預期語義完全一致,需要仔細選擇訓練圖像和調整生成參數。
4. 應用:
文本反轉技術在個性化圖像生成方面有廣泛的應用,包括:
個人肖像: 可以學習一個偽詞來代表特定人物,并生成各種姿勢、表情和背景下的肖像。
產品設計: 可以學習一個偽詞來代表特定產品或品牌,并生成各種設計變體。
藝術風格: 可以學習一個偽詞來代表特定藝術家的風格,并將其應用于不同的圖像主題。

2 效果

在這里插入圖片描述

本文來自互聯網用戶投稿,該文觀點僅代表作者本人,不代表本站立場。本站僅提供信息存儲空間服務,不擁有所有權,不承擔相關法律責任。
如若轉載,請注明出處:http://www.pswp.cn/bicheng/16439.shtml
繁體地址,請注明出處:http://hk.pswp.cn/bicheng/16439.shtml
英文地址,請注明出處:http://en.pswp.cn/bicheng/16439.shtml

如若內容造成侵權/違法違規/事實不符,請聯系多彩編程網進行投訴反饋email:809451989@qq.com,一經查實,立即刪除!

相關文章

Modal.method() 不顯示頭部的問題

ant-design中的Modal組件有兩種用法&#xff1a; 第一種是用標簽&#xff1a;<a-modal></a-modal> 第二種是用Api&#xff1a;Modal.info、Modal.warning、Modal.confirm...... 一開始項目中這兩種用法是混用的&#xff0c;后面UI改造&#xff0c;需要統一樣式&…

一個程序員的牢獄生涯(37)任務

星期一 任 務 我走回大鐐面前后,把雙手抱著的衣服遞給大鐐,但我并沒有把手里的東西也遞給他。現在的大鐐坐著,我站著,這個時候要給大鐐的話,肯定能被身邊的棍子或六子看到,甚至被所有號子里的人都看到。因為此時,所有人的目光都盯著我手里的衣服,盯著我和大鐐看。 “鐐…

Shell字符串變量

目標 能夠使用字符串的3種方式 掌握Shell字符串拼接 掌握shell字符串截取的常用格式 能夠定義Shell索引數組和關聯數組 能夠使用內置命令alias,echo,read,exit,declare操作 掌握Shell的運算符操作 Shell字符串變量 介紹 字符串&#xff08;String&#xff09;就是一系…

使用LabVIEW時遇到VISA屬性錯誤 -1073807331的解決方案

在LabVIEW或VeriStand中使用VISA屬性時&#xff0c;可能會遇到錯誤 -1073807331。這一錯誤的具體描述如下&#xff1a; 解決方案 導致VISA屬性出現此錯誤的原因主要有以下四種&#xff1a; 屬性不被使用的串行總線支持 示例 A.1&#xff1a;Is Port Connected VISA屬性僅支持由…

React(四)memo、useCallback、useMemo Hook

目錄 (一)memo API 1.先想一個情景 2.用法 (1)props傳入普通數據類型的情況 (2)props傳入對象的情況 (3)props傳入函數的情況 (4)使用自定義比較函數 3.什么時候使用memo&#xff1f; (二)useMemo Hook 1.用法 2.useMemo實現組件記憶化 3.useMemo實現函數記憶化 …

如何停止 iPad 和 iPhone 之間共享短信,獨立接收和發送消息

概括 在當今高度互聯的數字世界中&#xff0c;Apple 設備之間的無縫連接性提供了極大的便利&#xff0c;尤其是在消息同步方面。iPhone 和 iPad 用戶通常可以享受到設備間短信的自動同步功能&#xff0c;這意味著無論是在哪個設備上&#xff0c;用戶都可以接收和回復消息。然而…

2024.5.26.python.exercise

# # 導入包 # from pyecharts.charts import Bar, Timeline # from pyecharts.options import LabelOpts, TitleOpts # from pyecharts.globals import ThemeType # # # 從文件中讀取信息 # GDP_file open("1960-2019全球GDP數據.csv", "r", encoding&quo…

A. Maximize?

time limit per test 2 seconds memory limit per test 256 megabytes input standard input output standard output You are given an integer x&#x1d465;. Your task is to find any integer y&#x1d466; (1≤y<x)(1≤&#x1d466;<&#x1d465;) su…

深入理解python列表與字典:數據結構的選擇與性能差異

新書上架~&#x1f447;全國包郵奧~ python實用小工具開發教程http://pythontoolsteach.com/3 歡迎關注我&#x1f446;&#xff0c;收藏下次不迷路┗|&#xff40;O′|┛ 嗷~~ 目錄 一、列表與字典&#xff1a;基礎數據結構的對比 二、列表&#xff1a;逐個遍歷的查找方式 …

Ceres求解優化問題

1. 簡介 Ceres Solver是專門用于求解非線性最小二乘問題的C開源庫,研究SLAM方向不過濾波和優化兩個技術路線,因此常用Ceres庫解決實際項目中的優化問題,當然還有g2o同樣可用,但就說明文檔而言,Ceres對新用戶更友好,g2o提供不多的文檔,更多是需要參考其它開源項目使用,所以筆者…

【JAVA】接口

前面我們說了說抽象類相關內容&#xff0c;這篇我們主要聊聊接口相關內容&#xff0c;這部分很重要&#xff0c;大家引起關注。 1. 接口 1.1 接口的概念 接口就是公共的行為規范標準&#xff0c;大家在實現時&#xff0c;只要符合規范標準&#xff0c;就可以通用。在Java中&am…

力扣 739. 每日溫度 python AC

單調棧 class Solution:def dailyTemperatures(self, temperatures):size len(temperatures)ll []ans [0] * sizefor i in range(size - 1, -1, -1):while ll and temperatures[i] > temperatures[ll[-1]]:ll.pop()if ll:ans[i] ll[-1] - ill.append(i)return ans

C語言 數組——向函數傳遞數組

目錄 把數組傳給函數&#xff08;Passing Arrays to Functions&#xff09; 向函數傳遞一維數組 向函數傳遞二維數組 數組在學生成績管理中的應用 例&#xff1a;計算每個學生的平均分 把數組傳給函數&#xff08;Passing Arrays to Functions&#xff09; 向函數傳遞一維…

gnocchi學習小結

背景 總結gnocchi 4.4版本gnocchi-metricd工作流程 入口 gnocchi.cli.metricd metricd stop after processing metric默認為0&#xff0c;調servicemanager run MetricdServiceManager __init__ 服務邏輯封裝到MetricdServiceManager初始化中 主要由MetricProcessor, Met…

基于Vue的前端自定義詢問彈框與輸入彈框組件的設計與實踐

基于Vue的前端自定義詢問彈框與輸入彈框組件的設計與實踐 摘要 隨著技術的不斷進步&#xff0c;前端開發面臨越來越多的挑戰&#xff0c;其中之一就是如何有效管理復雜的業務邏輯和用戶體驗。傳統的整塊應用開發方式在面對頻繁的功能變更和用戶體驗優化時&#xff0c;往往顯得…

python數據分析-CO2排放分析

導入所需要的package import numpy as np import pandas as pd import matplotlib.pyplot as plt import seaborn as sns import datetime %matplotlib inline plt.rcParams[font.sans-serif] [KaiTi] #中文 plt.rcParams[axes.unicode_minus] False #負號 數據清洗…

MySQL數據表索引命名規范

在數據庫設計和開發過程中&#xff0c;索引是提高查詢性能的重要工具。合理的索引命名規范不僅能提高代碼的可讀性&#xff0c;還能便于維護和管理。本文將詳細介紹MySQL數據表索引的命名規范&#xff0c;包括不同類型索引的命名方法&#xff0c;并提供多個代碼示例以說明如何命…

SSH 遠程登錄系統和遠程拷貝

文章目錄 目錄 文章目錄 前言 一.SSH的基本用法 SSH基本用法&#xff1a; SSH無密碼登錄 二.SSH安全設置 三.SSH限制用戶 前言 很多時候服務器并沒有服務器&#xff0c;我們也不能每次都通過控制臺去管理服務器&#xff0c;這時候就需要遠程登錄&#xff0c;相比于Telnet&a…

京東應屆生公司內網說了一句‘什么時候被pdd收購‘,結果慘遭辭退

京東應屆生公司內網說了一句’什么時候被pdd收購’&#xff0c;結果慘遭公司開除 這個事最近在圈子討論比較多 前二天&#xff0c;有一個上海交大畢業的應屆生&#xff0c;在京東實習了9個月&#xff0c;好不容易轉正12天后&#xff0c;只因在內網說了一句話&#xff0c;就被…

upload-labs 21關解析

目錄 一、代碼審計 二、實踐 三、總結 一、代碼審計 $is_upload false; $msg null; if(!empty($_FILES[upload_file])){//檢查MIME$allow_type array(image/jpeg,image/png,image/gif);if(!in_array($_FILES[upload_file][type],$allow_type)){$msg "禁止上傳該類型…