【論文閱讀】Diff-Privacy: Diffusion-based Face Privacy Protection

基于擴散模型的人臉隱私保護方法——DiffPrivacy,解決了兩類人臉隱私任務:匿名化(anonymization)和視覺身份信息隱藏(visual identity information hiding)。


1. 研究背景

隨著人工智能和大數據技術的普及,個人身份圖像(尤其是人臉圖像)面臨隱私泄露風險。研究者提出兩類主要保護方法:

  • 匿名化

    • 目標:讓人和機器都無法識別到原來的身份,但保留面部結構,使檢測器仍能正常工作。

    • 場景:社交媒體照片,公開發布。

  • 視覺身份信息隱藏

    • 目標:人類看不到真實身份,但機器可準確識別(如加密存儲、后續智能識別)。

    • 場景:云端存儲加密,人臉認證等。

挑戰:這兩類任務的目標是矛盾的,難以通過同一模型實現。例如,匿名化需要讓模型無法識別,而視覺身份隱藏則要求機器仍能正確識別。此外,現有方法多為專用,需大量高質量人臉數據,且容易留下編輯痕跡,恢復能力有限。


DiffPrivacy設計:

  • 多尺度圖像反演模塊(MSI)
    利用擴散模型在不同時間步關注圖像的不同級別(尺度)信息,設計MSI模塊獲取原始圖像的條件嵌入(conditional embedding),支持多樣化調控。

  • 身份指導能量函數(Energy-based Identity Guidance)
    在擴散生成過程的去噪階段,根據任務需求進行梯度修正。即:

    • 匿名化:最大化對原身份的混淆(讓識別模型識別錯誤)

    • 信息隱藏:確保加密圖像能被機器準確識別

  • 嵌入調度策略(Embedding Scheduling)
    結合不同時間步分配不同的嵌入,使生成與恢復流程靈活切換。


Figure 1:DiffPrivacy方法生成的加密/匿名人臉:

  • 既能在視覺上高度逼真地改變身份(真實感極強),

  • 也能在需要時無損地恢復原始身份,

  • 與對比方法相比,既不易被識破,也能靈活支持不同應用場景。

2. Related Work

2.1 Anonymization

1. 基礎低層方法
  • 低級圖像處理如模糊(blurring)、馬賽克(mosaicing)、遮罩(masking)、像素化(pixelization)等,直接破壞臉部可辨識特征。這些方法有效消滅身份,但往往嚴重損害圖片可用性:檢測、識別、分析都受影響。
2. 基于生成式模型
  • GANs/虛擬臉替換
    • 用生成對抗網絡(GANs)生成新的、虛擬的面部區域替換原始身份,例如inpainting生成新臉(如Sun等[39])。
    • 不足:生成的面部常常不自然,表情屬性單一。
    • 提升:Maximov等[25]利用人臉關鍵點信息生成多樣化加密臉,但高分辨率下自然度仍有限。
3. 可恢復匿名化
  • 最近工作([5], [13], [22]等)專注于可逆加密和匿名。典型方法:
    • 條件GAN,輸入密碼條件,輸出加密臉(Gu等[13])。
    • 抽取屬性/身份向量,旋轉改變身份(Cao等[5])。
    • 將原圖投射到StyleGAN2潛空間,密碼與transformer一起處理生成加密代碼(Li等[22])。
  • 局限性:訓練強依賴高質量人臉數據,加密和恢復的圖像質量滿意度一般。

2.2 Visual Information Hiding 視覺信息隱藏

1. 基于同態加密(Homomorphic Encryption, HE)
  • 利用密碼學加密圖像,理論上安全,但不適用深度模型,對圖像推理兼容性很差。
2. 基于感知加密(Perceptual Encryption, PE)
  • 專注人類感知的加密域設計,如直接用加密圖像訓練模型,準確率受較大影響。
  • 例如Ito等[18]結構化變換網絡,確保分類器依然可正確識別但視覺信息隱藏,不可恢復原始圖像
3. 對抗攻擊啟發方法
  • Su等[38]應用Type-I攻擊迭代加密,可恢復和識別,但生成內容接近噪音,容易被黑客識別為加密圖片;且在線優化,速度慢。

2.3 Diffusion Models 擴散模型

演進與應用
  • 經典Diffusion:基于馬爾可夫鏈反復迭代,早期[14]慢,樣本質量好。
  • DDIM[35]:確定性采樣,極大提升生成速度。
  • 引入類別/條件信息:如Dhariwal等[8],提升真實度但訓練成本高。
  • Classifier-Free Diffusion:條件+無條件共同訓練更平衡([15])。
  • Latent Diffusion:從像素空間到潛空間生成(Rombach等[30]),極大節省算力。
  • 當前已廣泛用于密度估計、樣本生成及視覺任務。

3. Diff-Privacy方法原理詳細解析

總體框架

Diff-Privacy設計為三步:

  1. 條件嵌入學習(key-E):通過多尺度(multi-stage embedding)反演模塊(MSI)學習原圖在預訓練SDM(Stable Diffusion Model)中的條件嵌入(embedding)。
  2. 隱私保護圖像生成(key-I):通過能量函數身份指導+嵌入調度策略,在去噪流程中引導生成加密/匿名化臉,并通過DDIM反演得到噪音圖。
  3. 身份恢復:使用key-I和key-E(作為條件嵌入),利用DDIM采樣逆向還原出原始圖。

3.1 擴散模型與DDIM采樣/反演

  • SDM將原圖編碼到潛空間(latent space):z? = Enc(x?)
  • 加噪過程:zt = sqrt(α?)z? + sqrt(1-α?)ε(ε為高斯噪聲)
  • 去噪(采樣):使用UNet網絡生成epsilon估計
  • DDIM逆過程:采樣和反演公式(見Eq. 2,4),使噪音圖能夠還原原圖。

3.2 條件嵌入(Conditional Embedding)學習

1. 多階段條件嵌入空間(C*)
  • 觀察:擴散模型去噪初期決定布局、結構;中期決定內容;末期生成紋理。
  • 10階段嵌入方案:1000步去噪分10段,每段一個嵌入(每個token配768維向量)——更細粒度調控。
  • 如何獲取嵌入:不是直接優化而是用MSI模塊,結合CLIP圖像編碼器多層特征(五層768向量),分別與時間步embedding相乘,通過注意力模塊聚合,最終對齊并得到embedding組。
2. 訓練目標
  • 優化MSI,使SDM去噪誤差最小(Eq. 7)
  • cross-attention做dropout防過擬合。

3.3 隱私保護機制設計

3.3.1 嵌入調度策略
  • 利用多階段嵌入,不同privacy目標采用分階段切換:如去噪初/中期用無條件embedding,后期用learned embedding。
  • 匿名化:前40%用無條件embedding,后60%用learned embedding。
3.3.2 能量函數身份指導模塊
  • 目標:通過能量函數對去噪方向做梯度修正,實現身份相似/不同可控。
  • 主要步驟:
    1. 利用預訓練人臉識別模型,得到embedding空間表示;
    2. 構建identity loss:
      • 匿名化用identity dissimilarity loss(LIdis):多種噪音下生成新臉,最大化與原臉embedding夾角,保證身份差異;
      • 信息隱藏用identity similarity loss(Lis):最大化加密臉和原臉embedding夾角接近(0.95),保證機器可識別。
    3. 構建diversity loss(Ldiv):同一原圖噪不同,加密后身份embedding也應分散,增強加密樣本多樣性。
    4. 在去噪流程中加能量函數引導采樣方向,Eq. 14為帶能量修正的采樣。
3.3.3 匿名化細節
  • 初始加0.6強度噪音(保持布局、破壞面部)
  • 結合identity dissimilarity loss和diversity loss引導生成新臉
  • 先用無條件embedding,后改為learned embedding(見Eq. 18)
  • 保存對應步驟DDIM逆反得到的噪音地圖,作為恢復密鑰
3.3.4 信息隱藏細節
  • 初始噪音強度調高至0.8(連背景/姿態也可變)
  • 用identity similarity loss增強加密臉和原臉embedding接近,機器仍能識別
  • embedding調度比匿名化更偏向無條件(60%)
  • 同樣保存DDIM噪音地圖,配對密鑰恢復

3.4 身份恢復機制

  • 用加密/匿名后的噪音圖(key-I)+相應embedding(key-E),進入逆DDIM采樣,逐步去噪最終還原原臉。

總結

DiffPrivacy通過:

  • 多尺度嵌入學習(MSI)解決少樣本高質量控制;
  • 能量函數身份引導模塊實現不同身份相似/差異需求的梯度修正;
  • 分階段嵌入調度,將擴散模型去噪的各階段與屬性控制靈活結合;
  • 恢復過程依賴于密鑰(noise map+embedding),確保安全性。

4. Experiments

4.1 實現細節

  • 模型參數:僅訓練提出的MSI模塊,其余全部采用預訓練SDM默認參數。
  • 訓練設備與耗時:NVIDIA RTX3090,每張圖訓練約20分鐘,batch size=1,學習率0.001。
  • 評測數據集:CelebA-HQ [19] + LFW [16],涵蓋高質量與真實場景多樣性。

4.2 Anonymization

4.2.1 De-identification

對比方法

  • RiDDLE [22](可恢復)
  • FIT [13](可恢復)
  • CIAGAN [25]
  • DeepPrivacy [17]

定性分析(Figure 4):

  • CIAGAN去匿名后圖像扭曲嚴重。
  • FIT改變身份但視覺質量差,屬性錯亂(如女性圖生成男性臉)。
  • RiDDLE生成多樣臉,但細節不自然(如眼部畸形)。
  • DeepPrivacy雖逼真,但表情等非身份屬性無法保留。
  • Diff-Privacy優勢:自然逼真的面部特征,保留表情、姿態等非身份屬性,整體視覺效果優勝。

定量分析

  • 成功保護率SR(Table 1):利用人臉識別網絡(FaceNet、ArcFace),當加密臉與原臉embedding距離超過閾值,認為保護成功。
  • Diff-Privacy在SR指標高于其它方法,安全性強。

人臉檢測可用性(Table 2):

  • 在MtCNN和Dlib檢測下評估檢測率以及人臉框/關鍵點距離(像素偏差)。
  • Diff-Privacy檢測率最高,且結構保持度、關鍵點一致性均優。
  • 支持去身份后用于一般CV任務,實用性強。

身份多樣性(Figure 5, t-SNE可視化):

  • Diff-Privacy能生成多樣去身份臉,且分布更分散。
  • 200組加密臉embedding分布覆蓋超大區域——隱私防護性、多樣性強于FIT等方法(后者聚類緊湊,泛化差)。

4.2.2 身份恢復

對比方法:FIT, RiDDLE(可恢復)

  • 用識別率(Table 1底部)、原-恢復圖像相似度(MSE,PSNR,SSIM,LPIPS)(Table 3)。
  • Diff-Privacy恢復后圖像清晰度、結構一致性都高于競品,視覺效果、像素級和感知級分數均優(Figure 7)。


4.3 Visual identity information hiding 視覺身份信息隱藏

4.3.1 加密評測(對比AVIH [38])
  • 按AVIH流程選定12身份/10圖,other身份樣本共12878張。
  • 用FaceNet和ArcFace識別,加密后判斷同身份/異身份匹配難度。
  • Diff-Privacy在FaceNet識別率高于AVIH 3個百分點,ArcFace下則基本相當,接近未加密原圖識別率。
  • 隱私安全性:加密臉保留真實感,黑客難判定是否被加密,提升安全性。
4.3.2 身份恢復
  • 對比恢復后圖像質量(Figure 6, Table 3):AVIH像素級與Diff-Privacy相近,但感知級指標(LPIPS, SSIM)Diff-Privacy明顯優,且恢復區域更完整,無明顯偽影。

4.4 Ablation Study 消融實驗

① 條件嵌入組的作用
  • 只用單一嵌入(Ours-OE)vs. 用組嵌入(完整MSI)。
  • 圖像編輯性、屬性解耦、加密/恢復質量,組嵌入全面優于單嵌入(Figure 8, Table 5)。
② Embedding調度策略
  • 實驗不同τ值(分階段使用無條件/學習嵌入)對于匿名化/信息隱藏后圖像identity距離的影響(Figure 8,9)。
  • 匿名化推薦τ=0.4(最大化脫敏且屬性不變);信息隱藏τ=0.6(人眼變化最大但機器可識別)。
③ 噪音強度(Sns)
  • 噪音變弱,生成圖像更靠近原圖;Sns=0.6適合匿名化(屬性保留),Sns=0.8最大身份差異(用于信息隱藏)(Figure 10)。
④ Diversity loss多樣性損失
  • 移除多樣性損失功能后,去身份臉embedding聚集,分布減小,多樣性明顯降級(Figure 11)。

5. Conclusion 結論

論文貢獻總結

  1. 統一兩大隱私需求:提出Diff-Privacy方案,兼顧可恢復匿名化和信息隱藏。
  2. 三階段架構:多尺度條件嵌入(key-E)、能量函數+調度引導加密(key-I)、可逆恢復。
  3. 實驗表現:量化與定性結果均超過主流競品,圖片質量、恢復效果、身份多樣性更優。

本文來自互聯網用戶投稿,該文觀點僅代表作者本人,不代表本站立場。本站僅提供信息存儲空間服務,不擁有所有權,不承擔相關法律責任。
如若轉載,請注明出處:http://www.pswp.cn/web/98026.shtml
繁體地址,請注明出處:http://hk.pswp.cn/web/98026.shtml
英文地址,請注明出處:http://en.pswp.cn/web/98026.shtml

如若內容造成侵權/違法違規/事實不符,請聯系多彩編程網進行投訴反饋email:809451989@qq.com,一經查實,立即刪除!

相關文章

React 原理篇 - 深入理解虛擬 DOM

一、什么是虛擬 DOM? 在前端開發中,“虛擬 DOM” 是一個高頻出現的術語,尤其在 React 生態中被廣泛討論。但很多開發者對它的理解往往停留在 “JS 對象” 這個表層認知上。 實際上,虛擬 DOM 是一種編程概念—— 在這個概念里&…

對匯編的初理解

此處是一個簡單的函數,里面將調用了一個函數add()函數這里是函數的原型這里是調用lcd函數產生的匯編語言,翻譯過來就是r11,r0cnt(r4cnt,前文有提及),然后調用add函數,此處BL是指會回到指令的下一…

《Python 自動化實戰:從零構建一個文件同步工具》

《Python 自動化實戰:從零構建一個文件同步工具》 一、開篇引入:為什么我們需要文件同步? 你是否有過這樣的困擾: 公司電腦和家里電腦上都有工作項目,每次更新都要手動復制? U 盤頻繁傳輸文件,不僅麻煩還容易出錯? 項目文件夾動輒幾 G,每次同步都耗時長、效率低? 在…

工業相機與鏡頭的靶面尺寸詳解:選型避坑指南

在機器視覺系統中,相機與鏡頭的靶面尺寸匹配是一個非常關鍵卻又經常被忽略的細節。選錯了,不但影響圖像質量,還可能導致畫面“黑角”、視野不符、鏡頭浪費等問題。 今天我們就用通俗易懂的方式,聊一聊相機與鏡頭靶面尺寸的那些事兒…

使用 Go 和 go-commons 實現內存指標采集并對接 Prometheus

文章目錄一、準備工作二、編寫內存采集代碼三、運行 Exporter四、接入 Prometheus五、可擴展思路總結在運維和監控領域,資源指標采集 是必不可少的一環。CPU、內存、磁盤、網絡這些系統資源,需要實時采集并上報到監控系統中。 本文以 內存指標采集 為例&…

webrtc弱網-IntervalBudget類源碼分析與算法原理

一、核心功能 IntervalBudget 類用于基于時間窗口的帶寬預算管理。它根據設定的目標比特率(kbps)和一個固定時間窗口(500ms),計算在該時間窗口內可用的字節數(即“預算”),并支持預…

深度學習基本模塊:RNN 循環神經網絡

循環神經網絡(RNN)是一種專門用于處理序列數據的神經網絡架構。與處理空間數據的卷積神經網絡(Conv2D)不同,RNN通過引入循環連接使網絡具有"記憶"能力,能夠利用之前的信息來影響當前的輸出&#…

React18學習筆記(二) React的狀態管理工具--Redux,案例--移動端外賣平臺

文章目錄一.Redux的基礎用法1.示例:普通網頁中的Redux計步器2.Redux管理數據的流程3.配套工具和環境準備3.1.配套工具3.2.環境準備4.示例:React項目中的Redux計步器思路步驟step1:創建子模塊step2:導入子模塊step3:注入store實例step4:React組件內使用store中的數據step5:在組件…

34.Socket編程(UDP)(上)

點分十進制字符串IP 轉 32位網絡序列IP 分析:1)IP轉成4字節 2)4字節轉成網絡序列 思路: "192.168.1.1" 進行字符串劃分,以 "." 為分割符,分割出"192",&qu…

Redis的持久化工具包—RDB AOF

文章目錄 前言 一、RDB 持久化(快照持久化) 1. 定義 2. RDB 觸發機制 (1)手動觸發 (2)自動觸發 3. RDB 持久化流程 4. RDB 核心配置 5. RDB 優缺點 二、AOF 持久化(日志持久化) 1. 定…

【Web安全】XXL-JOB框架SRC高頻漏洞分析總結

文章目錄前言一、核心漏洞分類與技術細節二、漏洞關聯利用與攻擊路徑三、版本演進與修復策略四、安全運維建議五、典型漏洞復現環境搭建六、總結前言 XXL-JOB是國內主流的開源分布式任務調度框架,由徐雪里開發維護,以輕量易用、高可用、適配分布式場景等…

Capacitor 打包后接口訪問不到的排查經歷

我最近在用 Quasar Capacitor 6 做一個 Android App,前端用的是 Vue3 Quasar,打包交給 Capacitor 去跑在手機的 WebView 里,后端是 FastAPI 提供接口。開發模式下一切順利,瀏覽器里訪問接口沒有任何問題,我甚至覺得打…

【正點原子】Linux應用編程入門~概念及環境介紹

應用編程概念 應用編程(也可稱為系統編程)與驅動編程、裸機編程有何不同?系統調用;何為庫函數;應用程序的 main()函數;應用程序開發環境的介紹;系統調用 定義系統調用(system call&a…

一、HTML 完全指南:從零開始構建網頁

文章目錄前言一、 HTML 結構認識 HTML 標簽HTML 文件基本結構標簽層次結構快速生成代碼框架二、 HTML 常見標簽詳解2.1 注釋標簽2.2 標題標簽 (h1 - h6)2.3 段落標簽 (p)2.4 換行標簽 (br)2.5 格式化標簽2.6 圖片標簽 (img)2.7 超鏈接標簽 (a)2.8 表格標簽基本使用合并單元格2.…

基于POI-TL實現動態Word模板的數據填充:【散點圖】特殊處理方案

基于POI-TL實現動態Word模板的數據填充:散點圖特殊處理方案 在使用POI-TL進行Word模板動態數據填充時,圖表生成是一個常見需求。最近在項目中使用POI-TL處理散點圖時遇到了一個特殊問題,經過研究后找到了解決方案,特此記錄分享。 問題背景 POI-TL作為一款優秀的Java Wor…

使用node-Express框架寫一個學校宿舍管理系統練習項目-前后端分離

今天繼續分享一個新的練習項目,是使用node做為后端語言,來寫的一個前后端分離項目:學校宿舍管理系統。我們如果想掌握一門編程語言,就是需要大量的練習。所以當我們學習到了一些知識,自己想一下 可以拿學到的知識&…

Kafka 運維實戰基本操作含命令與最佳實踐

1. 基礎概覽與工具入口 Kafka 發行包的所有 CLI 工具均在 bin/ 目錄下。任何工具不帶參數運行都會顯示所有可用選項。本文命令默認:--bootstrap-server localhost:9092;生產請替換為你的控制面或內網 VIP。 2. 主題管理(創建 / 修改 / 刪除 /…

貪心算法應用:航班起降問題詳解

Java中的貪心算法應用:航班起降問題詳解 貪心算法是一種在每一步選擇中都采取當前狀態下最優的選擇,從而希望導致全局最優解的算法策略。在航班起降問題中,貪心算法可以有效地解決機場跑道調度問題,即如何安排航班的起降順序以最大…

uniapp scroll-view 設置scrollTop無效

當我們使用 scroll-view的scroll-top的時候 默認想讓它回到頂部,當我們設置值為0的時候會不生效,在實際運用過程中,發現設置了scroll-top無效,滾動條位置并沒有發生變化,是因為微信小程序的官方框架處于性能考慮&#…

網絡與通信

1.TCP協議與UDP協議TCP(Transmission Control Protocol,傳輸控制協議)和 UDP(User Datagram Protocol,用戶數據報協議)是 TCP/IP 協議族中兩種核心的傳輸層協議,它們在數據傳輸方式、可靠性、適…