影樓精修-AI衣服祛褶皺算法解析

注:為避免侵權,本文所用圖像均為AIGC生成或無版權網站提供;

衣服祛褶皺功能,目前在像素蛋糕、美圖云修、百度網盤AI修圖、阿里云都有相關的功能支持,它的價值就是將不平整的衣服圖像,變得整齊平整,去掉不美觀的衣服褶皺等。

功能分析

我們以像素蛋糕為例,來分析衣服祛褶皺功能,像素蛋糕中該功能界面如下:

支持衣服細褶皺和粗褶皺分別祛除兩個參數調節+整體程度參數調節;

效果舉例如下:

?

算法方案

對于衣服祛褶皺功能,目前公開的算法資料:

Paper: ABPN: Adaptive Blend Pyramid Network for Real-Time Local Retouching of Ultra High-Resolution Photo

Code:https://www.modelscope.cn/models/iic/cv_unet_skin-retouching/

但這份開源代碼是做人像美膚的代碼,是論文算法的一個應用,并未提供衣服祛褶皺相關的模型;

算法流程圖如下:

  • 自適應混合金字塔網絡(ABPN),主要由上下文感知局部修飾層(LRL)和自適應混合金字塔層(BPL)組成。

  • LRL采用多任務架構,包括共享編碼器、掩碼預測分支(MPB)和局部修飾分支(LRB)。MPB通過跳連接和軟掩碼引導特征融合,LRB利用門控卷積(GConv)和局部注意力模塊(LAM)實現高細節保真度的局部修飾。

  • BPL基于混合層概念,設計了自適應混合模塊(ABM)及其反向版本(R-ABM),通過逐步上采樣和細化混合層,將低分辨率結果擴展到原始尺寸。ABM通過可學習的參數和Hadamard積實現靈活的圖像轉換,R-ABM則用于生成混合層。

在論文中,作者也對比了在PS中使用中性灰+Softlight的效果,如下圖所示:

在對比中,Softlight的效果較差,論文方法確實獲得了不錯的效果。

該論文方案可能也為當前市面上主流的幾家提供了一些技術方案。

但是,個人看來,這個算法還是有一些提升空間的,比如:

1.網絡輸入圖像可以處理5000×5000左右的大圖,如果是更大分辨率的圖,如何保證最終原圖清晰度的信息問題,存在一定的疑問。尤其是影樓修圖領域,5000×5000算是小圖了。

2.資源消耗,網絡輸入分辨率越大,對應資源消耗越大:

針對上述問題,個人優化方案:

方案一

1.使用上述方案,但處理最小分辨率512×512,保證較小的資源消耗和較快的性能;假設原圖S,resize小圖為S_small上述方案的效果圖為D;

2.根據D和S_small進行中性灰圖層計算,注意,這里需要參考線性光圖層混合,不可使用柔光圖層混合,論文中對比Softlight效果,個人覺得是有問題的,可能做算法的小伙伴并不擅長PS修圖。最終得到中性灰圖層蒙版D_mask;

3.將D_mask還原回原圖大小,得到圖D_hd;

4.將D_hd與原圖S做中性灰圖層混合,得到最終衣服祛褶皺效果D;

舉例如下:

方案二

1.構建衣服祛褶皺中性灰蒙版網絡,輸入512×512小圖+對應的衣服區域mask,輸出中性灰蒙版D_mask;

2.將D_mask還原回原圖大小,得到圖D_hd;

3.將D_hd與原圖S做中性灰圖層混合,得到最終衣服祛褶皺效果D;

這個方案最大的優勢是可以將原圖與效果圖完全解耦,對于大分辨率的圖,中性灰圖層混合并不會影響原圖本身其他區域的清晰度,同時,網絡推理性能也可以得到兼顧;

上述方案僅是本人的一些個人見解,用來拋磚引玉,歡迎與大家溝通交流;

?

本文來自互聯網用戶投稿,該文觀點僅代表作者本人,不代表本站立場。本站僅提供信息存儲空間服務,不擁有所有權,不承擔相關法律責任。
如若轉載,請注明出處:http://www.pswp.cn/pingmian/83815.shtml
繁體地址,請注明出處:http://hk.pswp.cn/pingmian/83815.shtml
英文地址,請注明出處:http://en.pswp.cn/pingmian/83815.shtml

如若內容造成侵權/違法違規/事實不符,請聯系多彩編程網進行投訴反饋email:809451989@qq.com,一經查實,立即刪除!

相關文章

Celery 核心概念詳解及示例

Celery 核心概念詳解及示例 Celery 是一個簡單、靈活且可靠的分布式系統,用于處理大量消息,提供對任務隊列的操作,并支持任務的調度和異步執行。它常用于深度優化 Web 應用的性能和響應速度,通過將耗時的操作移到后臺異步執行&am…

智能對聯網頁小程序的倉頡之旅

#傳統楹聯遇上AI智能體:我的Cangjie Magic開發紀實 引言:一場跨越千年的數字對話 "云對雨,雪對風,晚照對晴空"。昨天晚上星空璀璨,當我用倉頡語言寫下第一個智能對聯網頁小程序的Agent DSL代碼時&#xff0…

《ERP原理與應用教程》第3版習題和答案

ERP原理與應用教程是一門系統介紹企業資源計劃(Enterprise Resource Planning, ERP)系統核心理論、技術架構及實施應用的綜合性課程。它主要面向管理類、信息類、工程類等專業學生及企業管理者,旨在培養對現代企業信息化管理的理解與實踐能力。以下是該課程的詳細解析: 一…

SOC-ESP32S3部分:32-LVGL顯示框架

飛書文檔https://x509p6c8to.feishu.cn/wiki/Ly6ywvphqi6HZlk38vHcz2OgnXg LVGL是一個開源的顯示框架,使用它可以加速我們開發帶顯示屏交互的應用。 IDF對于LVGL的支持一直有更新的,我們可以很方便在組件庫中搜索到對應版本的LVGL,并把它添…

原理圖與 PCB 設計流程及注意事項

原理圖與 PCB 設計流程及注意事項 一、原理圖設計 1. 首先,需要創建一個新的項目,在此項目中建立原理圖。 2. 接著,在原理圖中添加元件和芯片。可以從元件庫中挑選所需的元件,如電阻、電容等。既可以在元件庫中進行搜索查找&…

LeetCode--23.合并k個升序鏈表

解題思路: 1.獲取信息: 給出了多個升序鏈表,要求合并成一個升序鏈表,返回首元結點 2.分析題目: 外面在21題的時候,講了怎樣合并兩個升序鏈表為一個升序鏈表,不了解的,建議去看一下21…

【國產化適配】如何選擇高效合規的安全數據交換系統?

一、安全數據交換系統的核心價值與國產化需求 在數字化轉型浪潮中,企業數據流動的頻率與規模呈指數級增長,跨網文件傳輸已成為日常運營的剛需,所以安全數據交換系統也是企業必備的工具。然而,數據泄露事件頻發、行業合規要求趨嚴…

JMM初學

文章目錄 1,線程間的同步和通信1.1, 共享內存并發模型 (Shared Memory Model)線程通信機制線程同步機制特點 1.2, 消息傳遞并發模型 (Message Passing Model)線程通信機制線程同步機制特點 適用場景對比 2,Java內存模型JMM2.0,Java內存模型的基礎(1)內存…

【動手學MCP從0到1】2.5 MCP中的Context日志輸出、進度匯報和服務端調用客戶端的大模型項目實現步驟詳解

MCP中的Context 1. Context2. 日志輸出2.1 服務端2.2 客戶端2.2.1 客戶端代碼調試2.2.2 客戶端全部代碼 3. 進度匯報3.1 服務端3.2 客戶端3.2.1 客戶端代碼調試3.2.2 客戶端全部代碼 4. 模型調用4.1 服務端4.2 客戶端4.2.1 客戶端代碼調試4.2.2 客戶端全部代碼 1. Context Con…

QT自定義資源管理器

使用qt 和 C實現。還在優化中 項目地址:GitHub - Linda1226/FileResourceManager: 自定義資源管理器 有問題可以交流

[華為eNSP] OSPF綜合實驗

目錄 配置流程 畫出拓撲圖、標注重要接口IP 配置客戶端IP 配置服務端IP 配置服務器服務 配置路由器基本信息:名稱和接口IP 配置路由器ospf協議 測試結果 通過配置OSPF路由協議,實現跨多路由器的網絡互通,并驗證終端設備的訪問能力。 …

如何把本地服務器變成公網服務器?內網ip網址轉換到外網連接訪問

? 內網IP只能在本地內部網絡連接訪問,當本地搭建服務器部署好相關網站或應用后,在局域網內可以通過內網IP訪問,但在外網是無法直接訪問異地內網IP端口應用的,只有公網IP和域名才能實現互聯網上的訪問。那么需要如何把本地服務器變…

Linux-文件管理及歸檔壓縮

1.根下的目錄作用說明: /:Linux系統中所有的文件都在根下/bin:(二進制命令目錄)存放常用的用戶命令/boot:系統啟動時的引導文件(內核的引導配置文件,grub配置文件,內核配置文件) 例…

從零開始的python學習(七)P95+P96+P97+P98+P99+P100+P101

本文章記錄觀看B站python教程學習筆記和實踐感悟,視頻鏈接:【花了2萬多買的Python教程全套,現在分享給大家,入門到精通(Python全棧開發教程)】 https://www.bilibili.com/video/BV1wD4y1o7AS/?p6&share_sourcecopy_web&v…

Linux 查找特定字符詳細講解

CentOS 7 中使用 grep 查找特定字符詳細筆記? 一、grep 命令概述? grep 全稱為 Global Regular Expression Print,即全局正則表達式打印,是 CentOS 7 系統中用于文本搜索的核心工具。它基于正則表達式或固定字符串,在文件、標準輸入流中進…

uniappx插件nutpi-idcard 開發與使用指南(適配鴻蒙)

uniappx插件nutpi-idcard 開發與使用指南(適配鴻蒙) 前言 nutpi-idcard 是一個基于 UTS (uni-app TypeScript Syntax) 開發的 uni-app 插件適配鴻蒙,主要用于解析身份證號碼,提取其中的關鍵信息,如地區、出生日期、性…

Grafana-ECharts應用講解(玫瑰圖示例)

工具: MySQL 數據庫 MySQL Workbench 數據庫管理工具(方便編輯數據) Grafana v11.5.2 Business Charts 6.6(原 Echarts插件) 安裝 安裝 MySQL社區版安裝 MySQL Workbench安裝 Grafana在 Grafana 插件中搜索 Business Charts 進行安裝以上安裝步驟網上教程很多,自行搜…

React狀態管理Context API + useReducer

在 React 中,Context API useReducer 是一種輕量級的狀態管理方案,適合中小型應用或需要跨組件共享復雜狀態的場景。它避免了 Redux 的繁瑣配置,同時提供了清晰的狀態更新邏輯。 1. 基本使用步驟 (1) 定義 Reducer 類似于 Redux 的 reduce…

3 個優質的終端 GitHub 開源工具

1、Oh My Zsh Oh My Zsh 是一個幫助你管理和美化 zsh 終端的開源工具。它讓你的終端更炫酷、更高效。安裝后,你可以快速使用各種插件和主題,比如常見的 git 命令簡化、支持多種編程語言工具等,每次打開終端都會有驚喜。無論你是開發者還是普…

無人機巡檢智能邊緣計算終端技術方案??——基于EFISH-SCB-RK3588工控機/SAIL-RK3588核心板的國產化替代方案?

一、方案核心價值? ?實時AI處理?:6TOPS NPU實現無人機影像的實時缺陷檢測(延遲<50ms)?全國產化?:芯片、操作系統、算法工具鏈100%自主可控?極端環境適配?:-40℃~85℃穩定運行,IP65防護等…