論文解讀——掌紋生成網絡 RPG-Palm升級版PCE-Palm

該文章是2023年論文RPG-Palm的升級版
論文:PCE-Palm: Palm Crease Energy Based Two-Stage Realistic Pseudo-Palmprint Generation
作者:Jin, Jianlong and Shen, Lei and Zhang, Ruixin and Zhao, Chenglong and Jin, Ge and Zhang, Jingyun and Ding, Shouhong and Zhao, Yang and Jia, Wei
出版刊物:Proceedings of the AAAI Conference on Artificial Intelligence
代碼:https://github.com/Ukuer/PCE-Palm


文章目錄

  • 1、算法概述
  • 2、背景知識
  • 3、算法細節
    • 3.1 Transfer from Bézier Palm to PCE Domain
    • 3.2 Generate Realistic Palmprint from PCE Domain
    • 3.3 推理階段
  • 4、實驗


1、算法概述

騰訊優圖的掌紋生成文章,從2022年的BézierPalm,到2023年的RPG-Palm,到今年2024年的PCE-Palm,該文章是將RPG-Palm中從Bézier曲線一步到位生成掌紋圖片拆分成了兩步進行,新增了中間一步叫做PCE圖像,減小了一步到位生成掌紋圖像的難度。


2、背景知識

因為該論文是基于RPG-Palm進行改進升級的,所以有必要了解一下RPG-Palm算法的訓練和推理步驟,詳細論文解讀見博文掌紋生成網絡RPG-Palm論文解讀,RPG-Palm算法框架如下圖所示:
在這里插入圖片描述
圖(a)是訓練階段,圖(b)是推理階段;
生成器G結構類似于常見的圖像生成器結構UNet,為了生成多樣化的結果,引入了條件自適應實例規范化模塊(CAdaIN),對每個Down-Block和Up-Block生成的細節進行調制。D是判別器,而編碼器E用于將掌紋圖像進行編碼,論文中了Resnet結構,為了保證生成的id類內一致,作者添加了ID-aware Loss。
推理階段,可以看到,是一步到位的,即直接從Bézier圖像經過生成器G生成了“偽”掌紋圖像。


3、算法細節

PCE-Palm掌紋生成算法基于RPG-Palm算法將推理步驟拆分成兩個階段,中間插入了生成PCE圖像( palm crease energy),下圖是兩者的區別:
在這里插入圖片描述
可以看到,從Bézier曲線圖到掌紋圖像之間有著巨大差距,而RPG-Palm算法試圖一步到位生成(上面的箭頭),而本文的PCE-Palm算法分兩步,首先從Bézier曲線圖生成手掌折痕圖,第二步再加入皮膚紋理(下面的箭頭)。

3.1 Transfer from Bézier Palm to PCE Domain

在第一階段,生成器GB->P將隨機采樣的Bézier曲線轉換為PCE圖像。第一階段主要的網絡就是生成器GB->P,為了模擬高斯MFRAT
濾波器(Jia,Huang,andZhang2008)的效果,作者提出了線特征增強模塊( line feature enhancement block, LFEB)用于增強生成器GB->P對線路能量特性的關注能力。第一階段及生成器GB->P以及線特征增強模塊LFEB的結構如下:
在這里插入圖片描述
PCEM模塊用于從真實掌紋圖像中提取PCE圖像,它的結構如下:
在這里插入圖片描述


3.2 Generate Realistic Palmprint from PCE Domain

第二階段是利用PCE圖像生成逼真的掌紋圖像,其訓練生成器GP->R的框圖如下:
在這里插入圖片描述
其中,生成器GP->R和編碼器E依然和RPG-Palm一樣,均是采用Unet和Resnet結構,PCEM模塊同第一階段一樣,用于從掌紋圖像中提取PCE圖像信息。

與RPG-Palm不一樣的是,對于確認生成的掌紋與真實像不像這里的損失,RPG-Palm用是的Lid損失函數加L1和判別器D的損失,Lid損失函數是計算兩張圖片特征的余弦相似度大小;而本論文是用的循環ID一致性損失Lcyc加L1和判別器D的損失,這個循環ID一致性損失Lcyc說白了也是L1損失,只是計算的兩張圖片是PCE圖像,一個是由真實掌紋圖而來,一個是由生成的掌紋圖而來,它是基于這個假設,生成的掌紋圖越像真實掌紋圖,那么兩者的PCE圖應該也非常像。

循環ID一致性損失Lcyc公式如下:
在這里插入圖片描述
生成器GP->R的損失函數以及第二階段整個損失函數的公式如下:
在這里插入圖片描述


3.3 推理階段

推理階段就沒那么復雜了,直接利用上面兩節訓練好的生成器GB->P和生成器GP->R進行生成就行,首先用隨機抽樣的控制點生成Bézier曲線。然后,使用生成器GB→P將Bézier曲線轉換到PCE域。之后,用訓練好的生成器GP→R可以以PCE圖像作為ID條件生成逼真的掌紋。為了生成多樣化的掌紋,將隨機噪聲向量輸入到GP→R中作為潛在的控制向量,以再現各種光線和皮膚紋理。如下面框圖所示:
在這里插入圖片描述
同時,作者為了最大限度地減少了生成掌紋和真實掌紋之間的差距。還根據皮膚紋理學方面的知識,設計了Bézier曲線的5個模板,生成Bézier曲線均基于這些模板,如下圖所示:
在這里插入圖片描述


4、實驗

開放集掌紋識別對比情況如下表所示:
在這里插入圖片描述

限制id數量下掌紋識別對比情況如下:
在這里插入圖片描述

在開放集協議下,采用不同的生成方法進行定量識別的對比情況如下:
在這里插入圖片描述

消融實驗
在這里插入圖片描述

線特征增強模塊LFEB提升掌紋中線的特征提取能力,可視化結果如下:
在這里插入圖片描述
可以看到,掌紋圖像經過LFEB模塊后,線特征得到了強化,有點圖像銳化的效果,對于后續生成PCE圖像有幫助。

本文來自互聯網用戶投稿,該文觀點僅代表作者本人,不代表本站立場。本站僅提供信息存儲空間服務,不擁有所有權,不承擔相關法律責任。
如若轉載,請注明出處:http://www.pswp.cn/web/64092.shtml
繁體地址,請注明出處:http://hk.pswp.cn/web/64092.shtml
英文地址,請注明出處:http://en.pswp.cn/web/64092.shtml

如若內容造成侵權/違法違規/事實不符,請聯系多彩編程網進行投訴反饋email:809451989@qq.com,一經查實,立即刪除!

相關文章

代碼隨想錄算法【Day2】

Day2 1.掌握滑動窗口法 2.模擬題&#xff0c;堅持循環不變量原則 209 長度最小的子數組 暴力法&#xff1a; class Solution { public:int minSubArrayLen(int target, vector<int>& nums) {//暴力法int i, j; //i代表起始點&#xff0c;j代表終止點int sum; //…

android——屏幕適配

一、屏幕適配的重要性 在 Android 開發中&#xff0c;屏幕適配是非常關鍵的。因為 Android 設備具有各種各樣的屏幕尺寸、分辨率和像素密度。如果沒有進行良好的屏幕適配&#xff0c;應用可能會出現顯示不完整、元素拉伸或壓縮變形、字體大小不合適等問題&#xff0c;極大地影響…

oscp學習之路,Kioptix Level2靶場通關教程

oscp學習之路&#xff0c;Kioptix Level2靶場通關教程 靶場下載&#xff1a;Kioptrix Level 2.zip 鏈接: https://pan.baidu.com/s/1gxVRhrzLW1oI_MhcfWPn0w?pwd1111 提取碼: 1111 搭建好靶場之后輸入ip a看一下攻擊機的IP。 確定好本機IP后&#xff0c;使用nmap掃描網段&…

第二十六周機器學習筆記:PINN求正反解求PDE文獻閱讀——正問題

第二十六周周報 摘要Abstract文獻閱讀《Physics-informed neural networks: A deep learning framework for solving forward and inverse problems involving nonlinear partial differential equations》1. 引言2. 問題的設置3.偏微分方程的數據驅動解3.1 連續時間模型3.1.1 …

【安全編碼】Web平臺如何設計防止重放攻擊

我們先來做一道關于防重放的題&#xff0c;答案在文末 防止重放攻擊最有效的方法是&#xff08; &#xff09;。 A.對用戶密碼進行加密存儲使用 B.使用一次一密的加密方式 C.強制用戶經常修改用戶密碼 D.強制用戶設置復雜度高的密碼 如果這道題目自己拿不準&#xff0c;或者…

中關村科金智能客服機器人如何解決客戶個性化需求與標準化服務之間的矛盾?

客戶服務的個性化和標準化之間的矛盾一直是一個挑戰。一方面&#xff0c;企業需要提供標準化的服務以保持運營效率和成本控制&#xff1b;另一方面&#xff0c;為了提升客戶滿意度和忠誠度&#xff0c;企業又必須滿足客戶的個性化需求。為此&#xff0c;中關村科金推出了智能客…

OPPO Android面試題及參考答案 (上)

性能優化方面,講一下圖片內存占用計算,以及如何避免持有不必要的引用。 在 Android 中,計算圖片內存占用主要與圖片的尺寸和像素格式有關。對于一張位圖(Bitmap),其內存占用大小可以通過以下方式估算:內存占用 = 圖片寬度 圖片高度 每個像素占用字節數。例如,常見的 …

Agent 案例分析:金融場景中的智能體-螞蟻金服案例(10/30)

Agent 案例分析&#xff1a;金融場景中的智能體 —螞蟻金服案例 一、引言 在當今數字化時代&#xff0c;金融行業正經歷著深刻的變革。隨著人工智能技術的飛速發展&#xff0c;智能體&#xff08;Agent&#xff09;在金融場景中的應用越來越廣泛。螞蟻金服作為金融科技領域的…

ElasticSearch 的工作原理

理解 ElasticSearch 的工作原理需要從索引、搜索、以及其背后的核心機制幾個方面來探討。 1. ElasticSearch 是什么&#xff1f; ElasticSearch 是一個分布式搜索和分析引擎&#xff0c;適用于各種類型的數據&#xff0c;例如文本、數值、地理位置、結構化或非結構化數據。它基…

STM32F407 | Embedded IDE01 - vscode搭建Embedded IDE開發環境(支持JLINK、STLINK、DAPLINK)

導言 Embedded IDE官網:https://em-ide.com/docs/intro 我猜肯定有部分人使用SI Keil開發STM32項目&#xff0c;也有vscode Keil開發STM32程序。SI或vscode編寫代碼&#xff0c;然后切換Keil編譯、下載、調試程序。有一段時間&#xff0c;我也是這么干的。但是&#xff0c;程…

光譜相機的工作原理

光譜相機的工作原理主要基于不同物質對不同波長光的吸收、反射和透射特性存在差異&#xff0c;以下是其具體工作過程&#xff1a; 一、光的收集 目標物體在光源照射下&#xff0c;其表面會對光產生吸收、反射和透射等相互作用。光譜相機的光學系統&#xff08;如透鏡、反射鏡…

ThinkPHP接入PayPal支付

ThinkPHP 5接入PayPal 支付&#xff0c;PayPal的流程是服務器請求Paypal的接口下單&#xff08;需要傳訂單id/支付成功的重定向地址/支付失敗的重定向地址&#xff09;&#xff0c;接會返回一個支付地址&#xff0c;項目服務器把地址返給用戶&#xff0c;用戶打開鏈接登錄Paypa…

stream流的toMap

假設有這么一個類: import java.util.Arrays; import java.util.HashMap; import java.util.List; import java.util.Map; import java.util.stream.Collectors;public class Student {private int id;private String name;public Student(int id, String name) {this.id id;…

html + css 淘寶網實戰

之前有小伙伴說&#xff0c;淘寶那么牛逼你會寫代碼&#xff0c;能幫我做一個一樣的淘寶網站嗎&#xff0c;好呀&#xff0c;看我接下來如何給你做一個淘寶首頁。hahh,開個玩笑。。。學習而已。 在進行html css編寫之前 先了解下網頁的組成和網頁元素的尺寸吧 1.網頁的組成 …

神經網絡、深度學習、卷積神經網絡

好的&#xff01;我會盡量詳細且易懂地為你解釋這些概念&#xff0c;并在最后用簡單直白的語言總結一下。 1. 神經網絡思想 神經網絡是靈感來自于生物大腦神經元的工作原理&#xff0c;是一種模仿人類大腦處理信息的方式來設計的數學模型。我們的大腦由億萬個神經元組成&…

設計模式01:創建型設計模式之單例、簡單工廠的使用情景及其基礎Demo

一、單例模式 1.情景 連接字符串管理 2.好處 代碼簡潔&#xff1a;可全局訪問連接字符串。性能優化&#xff1a;一個程序一個連接實例&#xff0c;避免反復創建對象&#xff08;連接&#xff09;和銷毀對象&#xff08;連接&#xff09;。線程安全&#xff1a;連接對象不會…

【不太正常的題】LeetCode.232:用棧的函數接口實現隊列

&#x1f381;個人主頁&#xff1a;我們的五年 &#x1f50d;系列專欄&#xff1a;初階數據結構刷題 &#x1f389;歡迎大家點贊&#x1f44d;評論&#x1f4dd;收藏?文章 &#x1f697; 1.問題描述&#xff1a; 題目中說了只能使用兩個棧實現隊列&#xff0c;并且只能使用…

Linux搭建text-generation-webui框架,安裝通義千問大模型,開放對外api,voxta測試對話圖文教程

目錄 text-generation-webui部分 開放對外API 通義千問部分 遠程API對話測試部分 text-generation-webui部分 本來不想發這個文章的&#xff0c;但是自己部署的時候看了挺多人的帖子&#xff0c;很多發的不全面&#xff0c;要么就是跟著他們流程走有些小問題啥的&#xff…

QT程序發布后,mysql在其它電腦設備無法連接數據庫

QT程序發布后&#xff0c;mysql在其它電腦設備無法連接數據庫 D:\mysql-5.7.24-winx64\lib, mysql-5.7.24-winx64是一個壓縮包&#xff0c;用于啟動mysql服務&#xff0c;創建數據庫 壓縮包 解決方法&#xff1a; 拷貝庫到exe的相同目錄&#xff0c;libmysql.dll,libmysql.li…

ElasticSearch 的核心功能

要深入理解 ElasticSearch 的核心功能&#xff0c;需要全面掌握其 全文搜索、分析、聚合 和 索引生命周期管理&#xff08;ILM&#xff09; 的設計原理和實際應用。 1. 全文搜索 ElasticSearch 的全文搜索是其核心功能之一&#xff0c;依賴于倒排索引和強大的分詞、相關性評分…