基于擴散模型的圖像編輯:首篇綜述

AIGC 大模型最火熱的任務之一——基于 Diffusion Model 的圖像編輯(editing)領域的首篇綜述。長達 26 頁,涵蓋 297 篇文獻!本文全面研究圖像編輯前沿方法,并根據技術路線精煉地劃分為 3 個大類、14 個子類,通過表格列明每個方法的類型、條件、可執行任務等信息。此外,本文提出了一個全新 benchmark 以及 LMM Score 指標來對代表性方法進行實驗評估,為研究者提供了便捷的學習參考工具。強烈推薦 AIGC 大模型研究者或愛好者閱讀,緊跟熱點。

  • 作者:Yi Huang, Jiancheng Huang, Yifan Liu, Mingfu Yan, Jiaxi Lv, Jianzhuang Liu, Wei Xiong, He Zhang, Liangliang Cao, Shifeng Chen

  • 單位: 中科院、Adobe公司、蘋果公司(曹亮亮等)、南科大

  • 鏈接:https://arxiv.org/abs/2402.17525

  • https://github.com/SiatMMLab/Awesome-Diffusion-Model-Based-Image-Editing-Methods

摘要

去噪擴散模型已成為各種圖像生成和編輯任務的有力工具,有助于以無條件或輸入條件的方式合成視覺內容。這些模型背后的核心理念是學習如何逆轉逐漸向圖像中添加噪聲的過程,從而從復雜的分布中生成高質量的樣本。

在這份調查報告中,我們詳盡概述了使用擴散模型進行圖像編輯的現有方法,涵蓋了該領域的理論和實踐方面。我們從學習策略、用戶輸入條件和可完成的一系列具體編輯任務等多個角度對這些作品進行了深入分析和分類。此外,我們還特別關注圖像的inpainting和outpainting,并探討了早期的傳統上下文驅動方法和當前的多模態條件方法,對其方法論進行了全面分析。

為了進一步評估文本引導圖像編輯算法的性能,我們提出了一個系統基準 EditEval,其特點是采用了創新指標 LMM Score。最后,我們討論了當前的局限性,并展望了未來研究的一些潛在方向。

附帶的資源庫發布在:https://github.com/SiatMMLab/Awesome-Diffusion-Model-Based-Image-Editing-Methods。

統計圖

基于擴散模型的圖像編輯中研究出版物的統計概述。上圖:學習策略。中:輸入條件。下圖:編輯任務。

從多角度對基于擴散模型的圖像編輯方法進行了全面地分類。這些方法是根據訓練、微調和免訓練進行顏色渲染的。輸入條件包括文本、類別、參考圖像,分割圖、姿態、蒙版、布局、草圖、拖動點和音頻。打勾表示可以做的任務。

訓練大類的分類屬性圖以及框架圖

?

?比較兩種有代表性的CLIP導引方法:DiffusionCLIP 和 Asyrp 的框架圖。樣本圖像來自CelebA數據集上的Asyrp

?指令圖像編輯方法的通用框架。示例圖像來自InstructPix2Pix、InstructAny2Pix和MagicBrush。

微調大類的分類屬性圖以及框架圖

?

?使用不同微調組件的微調框架。樣本圖像來自Custom-Edit。

免訓練大類的分類屬性圖以及框架圖

?

免訓練方法的通用框架,其中指出了不同部分中描述的修改。樣本圖片來自LEDITS++。

Benchmark

?LMM Score與用戶研究的皮爾遜相關系數。

?LMM Score/CLIPScore與用戶研究的皮爾遜相關系數比較。

對7種選定的編輯類型進行直觀比較。

本文來自互聯網用戶投稿,該文觀點僅代表作者本人,不代表本站立場。本站僅提供信息存儲空間服務,不擁有所有權,不承擔相關法律責任。
如若轉載,請注明出處:http://www.pswp.cn/news/715148.shtml
繁體地址,請注明出處:http://hk.pswp.cn/news/715148.shtml
英文地址,請注明出處:http://en.pswp.cn/news/715148.shtml

如若內容造成侵權/違法違規/事實不符,請聯系多彩編程網進行投訴反饋email:809451989@qq.com,一經查實,立即刪除!

相關文章

查詢緩存-緩存更新-緩存穿透-緩存雪崩-緩存擊穿

1.查詢緩存 1.2.出現的原因 用戶高并發訪問帶來的服務器讀寫的壓力 1.3.解決方法 添加緩存 2.緩存更新 2.1.出現的原因 出現數據不一致的問題 2.2.解決方法 操作數據庫的時候 更新數據庫刪除緩存 查詢數據的時候設置過期時間 3.緩存穿透 3.1.出現的原因 在高并發訪…

LeetCode 熱題 100 | 圖論(一)

目錄 1 200. 島嶼數量 2 994. 腐爛的橘子 2.1 智障遍歷法 2.2 仿層序遍歷法 菜鳥做題,語言是 C 1 200. 島嶼數量 解題思路: 遍歷二維數組,尋找 “1”(若找到則島嶼數量 1)尋找與當前 “1” 直接或間接連接在…

Java輸入輸出流詳細解析

Java I/O(輸入/輸出)主要被用來處理輸入數據和輸出結果。 在Java中,輸入/輸出操作被當作流(Stream)進行處理。流是一個連續的數據流入或數據流出的通道。流操作在Java中主要可以分為兩種類型:字節流和字符…

基于ssm疫情期間高校防控系統+vue論文

摘 要 傳統信息的管理大部分依賴于管理人員的手工登記與管理,然而,隨著近些年信息技術的迅猛發展,讓許多比較老套的信息管理模式進行了更新迭代,學生信息因為其管理內容繁雜,管理數量繁多導致手工進行處理不能滿足廣大…

‘conda‘ 不是內部或外部命令,也不是可運行的程序 或批處理文件

如果你在運行 conda 命令時收到了 ‘conda’ 不是內部或外部命令,也不是可運行的程序或批處理文件。 的錯誤消息,這可能意味著 Anaconda 并沒有正確地添加到你的系統路徑中。 1.你可以嘗試手動添加 Anaconda 到系統路徑中。以下是在 Windows 系統上添加…

19.2 DeepMetricFi:基于深度度量學習改進Wi-Fi指紋定位

P. Chen and S. Zhang, "DeepMetricFi: Improving Wi-Fi Fingerprinting Localization by Deep Metric Learning," in IEEE Internet of Things Journal, vol. 11, no. 4, pp. 6961-6971, 15 Feb.15, 2024, doi: 10.1109/JIOT.2023.3315289. 摘要 Wi-Fi RSSI指紋定位…

C++內存泄漏:原因、預防、定位

內存泄漏是 C 中常見的問題之一,可能導致程序運行時資源消耗過大、性能下降,甚至程序崩潰。 內存泄漏的原因 1. 未釋放動態分配的內存 在 C 中,通過 new 操作符分配的內存需要手動使用 delete 操作符進行釋放。如果忘記或者由于某種原因未…

調用“每日詩詞”在你的頁面添加一句詩

概述 前幾天瀏覽網站的時候看到頁面上有句詩&#xff0c;打開調試看了下調用的是“每日詩詞”的SDK。本文基于此SDK實現你的頁面添加一句詩。 實現效果 實現 1. 引入SDK <script src"https://sdk.jinrishici.com/v2/browser/jinrishici.js" charset"utf-…

mysql服務治理

一、性能監控指標和解決方案 1.QPS 一臺 MySQL 數據庫&#xff0c;大致處理能力的極限是&#xff0c;每秒一萬條左右的簡單 SQL&#xff0c;這里的“簡單 SQL”&#xff0c;指的是類似于主鍵查詢這種不需要遍歷很多條記錄的 SQL。 根據服務器的配置高低&#xff0c;可能低端…

【BUUCTF web】通關 2.0

&#x1f36c; 博主介紹&#x1f468;?&#x1f393; 博主介紹&#xff1a;大家好&#xff0c;我是 hacker-routing &#xff0c;很高興認識大家~ ?主攻領域&#xff1a;【滲透領域】【應急響應】 【Java】 【VulnHub靶場復現】【面試分析】 &#x1f389;點贊?評論?收藏 …

MAC-鍵盤command快捷鍵、設置windows快捷鍵

在 Windows PC 專用鍵盤上&#xff0c;請用 Alt 鍵代替 Option 鍵&#xff0c;用 Ctrl 鍵或 Windows 標志鍵代替 Command 鍵。 Mac 鍵盤快捷鍵 - 官方 Apple 支持 (中國) 設置windows快捷鍵 使用mac外接適用于windows的鍵盤時&#xff0c;如何設置快捷鍵&#xff1f;_mac外…

2024年2月國內如何快速注冊OnlyFans最新小白教學

前言 onlyface軟件是一個創立于2016年的訂閱式社交媒體平臺&#xff0c;創作者可以在自己的賬號發布原創的照片或視頻&#xff0c;并將其設置成付費模式&#xff0c;若用戶想查看則需要每月交費訂閱。 需要注意的是&#xff0c;網絡上可能存在非法或不道德的應用程序&#xff…

Java:性能優化細節31-45

Java&#xff1a;性能優化細節31-45 31、合理使用java.util.Vector 在使用java.util.Vector時&#xff0c;需要注意其性能特性和最佳實踐&#xff0c;以確保應用程序運行高效。Vector是一個同步的集合類&#xff0c;提供了動態數組的實現。由于它是線程安全的&#xff0c;所以…

獲取當前數據 上下移動

點擊按鈕 上下移動 當前數據 代碼 // 出國境管理 登記備案人員列表 <template><a-row><a-col span"24"><a-card :class"style[a-table-wrapper]"><!-- 出國境 登記備案人員列表 --><a-table:rowKey"records >…

淘寶開放平臺獲取商家訂單數據API接口接入流程

taobao.custom 自定義API操作 接口概述&#xff1a;通過此API可以調用淘寶開放平臺的API&#xff0c;通過技術對接&#xff0c;您可以輕松實現無賬號調用官方接口。進入測試&#xff01; 公共參數 名稱類型必須描述keyString是調用key&#xff08;必須以GET方式拼接在URL中&…

通過修改host文件來訪問GitHub

前言&#xff1a; 由于國內環境的原因&#xff0c;導致我們無法流暢的訪問GitHub&#xff0c;。 但是我們可以采取修改host文件來實現流暢訪問。 缺點&#xff1a;需要不定時的刷新修改。 操作流程 一、查詢IP地址 以下地址可以查詢ip地址 http://ip.tool.chinaz.com/ htt…

pugixml使用

pugixml 使用pugixml庫需要三個文件:pugiconfig.hpp pugixml.cpp pugixml.hpp pugixml.hpp代碼添加在最后。 全是代碼 寫入文件-使用實例&#xff1a; #include "../pugixml/pugixml.hpp"//2024.2.29 add 寫入參數值到文件中 void MainFrame::SaveBrg(CString Path) …

C++從零開始的打怪升級之路(day40)

這是關于一個普通雙非本科大一學生的C的學習記錄貼 在此前&#xff0c;我學了一點點C語言還有簡單的數據結構&#xff0c;如果有小伙伴想和我一起學習的&#xff0c;可以私信我交流分享學習資料 那么開啟正題 今天分享的是關于繼承的知識點 1.繼承的概念及定義 1.1繼承的概…

JDK時間

Date 全世界的時間&#xff0c;有一個統一的計算標準。 世界標準時間&#xff1a;格林尼治時間/格林威治時間簡稱GMT&#xff0c;目前時間標準時間已經替換為&#xff1a;原子鐘。 中國標準時間&#xff1a;世界時間8 時間換算單位&#xff1a; 一秒等于一千毫秒 一毫秒等于一…

CDC作業歷史記錄無法刪除問題

背景 數據庫開啟CDC功能后&#xff0c;每天會生成大量的歷史記錄&#xff0c;即使達到參數“每個作業的最大歷史記錄“的閾值后也不會被刪除&#xff0c;導致其它作業的歷史記錄被刪除&#xff0c;無法查看以前的執行情況&#xff0c;非常不方便。 現象 數據庫開啟CDC后會創建…