視覺AIGC識別——人臉偽造檢測、誤差特征 + 不可見水印

視覺AIGC識別——人臉偽造檢測、誤差特征 + 不可見水印

  • 前言
  • 視覺AIGC識別
  • 【誤差特征】DIRE for Diffusion-Generated Image Detection
    • 方法
      • 擴散模型的角色
      • DIRE作為檢測指標
    • 實驗結果
      • 泛化能力和抗擾動
  • 人臉偽造監測(Face Forgery Detection)
    • 人臉偽造圖生成
  • 其他類型假圖檢測(Others types of Fake Image Detection)


請添加圖片描述

🌈你好呀!我是 是Yu欸
🌌 2024每日百字篆刻時光,感謝你的陪伴與支持 ~
🚀 歡迎一起踏上探險之旅,挖掘無限可能,共同成長!

前些天發現了一個人工智能學習網站,內容深入淺出、易于理解。如果對人工智能感興趣,不妨點擊查看。

前言

續篇:一文速覽深度偽造檢測(Detection of Deepfakes):未來技術的守門人

參考:https://mp.weixin.qq.com/s/inGjMdX9TTUa3hKWaMkd3A

視覺AIGC識別

根據已有的研究工作調研,將視覺AIGC識別粗略劃分為:

  • 人臉偽造檢測(Face Forgery Detection):包含人臉的AIG圖片/視頻的檢測,例如AI換臉、人臉操控等。此類方法主要關注帶有人臉相關的檢測方法,檢測方法可能會涉及人臉信息的先驗。
  • AIG整圖檢測(AI Generated-images Detection):檢測一整張圖是否由AI生成,檢測更加的泛化。這類方法相對更關注生成圖與真實圖更通用的底層區別,通常專注于整張圖,比如近年爆火的SD、Midjounery的繪圖;
  • 其他類型假圖檢測(Others types of Fake Image Detection):此類方法更偏向于 局部偽造、綜合偽造等一系列更復雜的圖片造假,當然人臉偽造也屬于局部、復雜,但是是人臉場景。將AIG圖與真實圖拼湊、合成的圖片識別也屬于這一類。
    這三種類型之間劃分并不明晰,很多方法同時具有多種檢測能力,可劃分為多種類型。嚴格意義上說AIG整圖和其他造假圖檢測類型可能都會包含人臉信息,但三種類型方法往往技術出發點也不同。

【誤差特征】DIRE for Diffusion-Generated Image Detection

Arxiv 2023

方法

作者發現DM 圖可以被近似地被擴散模型重建,但真實圖片不行。將重建圖和原圖的圖片差異記為擴散重建差(DIffusion Reconstruction Error,DIRE),則DIRE可以作為特征進行2分類訓練,判斷是否虛假,泛化性會高很多;

擴散模型的角色

擴散模型在這里充當了一種“數字時間機器”的角色,通過將圖像“倒帶”回過去的某個狀態,然后再“快進”到現在,來重建圖像。對于合成圖像而言,這種“時間旅行”的過程中丟失的信息較少,因為它們本身就是由類似的深度學習模型生成的,因此它們與擴散模型重建的版本更為接近。相反,真實圖像在這一過程中會丟失更多的細節,因為它們包含了更復雜和多樣的信息,這些信息在通過擴散模型的“濾鏡”時難以保留。

DIRE作為檢測指標

將DIRE視作一種“指紋差異儀”,它可以測量一個圖像經過時間機器旅行前后的變化量。對于合成圖像,這種變化相對較小,因為它們本質上已經是“時間旅行”的產物。對于真實圖像,變化較大,因為時間旅行過程中它們失去了更多的原始信息。

重建圖像差DIRE可以區分真實圖和合成圖的原因如下圖:

  • 合成圖在重建后變化往往較小;
  • 真實圖在重建后變化相對較大;

在這里插入圖片描述
在這里插入圖片描述

我的理解是,真實圖在重建時會丟失很多信息,而生成圖由于本身就是模型生成的,重建時信息變化相對不大。因此差異可以反映其真假。

該方法通過預訓練的擴散模型(Denoising Diffusion Implicit Models,DDIMs[7])對圖片進程重建,測量輸入圖像與重建圖像之間的誤差。其實這個方法和梯度特征的方法LGrad很像,區別在于上面是通過 Transformation Model轉換模型獲得圖像梯度,這里通過 DDIM 重建圖計算差。

實驗結果

此外,作者提出了一個數據集 DiffusionForensics,同時復現了8個擴散模型對提出方法進行識別(ADM、DDPM、iDDPM, PNDM, LDM, SD-v1, SD-v2, VQ-Diffusion);

  • 跨模型泛化較好:比如ADM的DIRE 對 StyleGAN 也支持,
  • 跨數據集泛化:LSUN-B訓練模型在ImageNet上也很好;
  • 抗擾動較好:對JPEG壓縮 和 高斯模糊的圖,性能很好;

最后看下實驗指標,看起來在擴散模型上效果很好,這ACC/AP都挺高的,不知道在GAN圖上效果如何。


實驗結果顯示,這種基于擴散重建差的方法在區分真實與合成圖像上表現出色,這就像是在深度偽造的海洋中擁有了一張精確的導航圖。這種方法在不同的擴散模型上都展現了高度的準確性,這表明了它作為一種檢測工具的潛力。

總的來說,這篇研究為深度偽造檢測領域提供了一個新的視角和工具,其通過利用擴散模型的獨特能力,提出了一個既直觀又有效的方法來區分真實與合成圖像。這種方法的成功展示了深度學習領域中“以毒攻毒”的潛力,即使用生成技術的原理來反擊深度偽造的問題。

泛化能力和抗擾動

這一方法之所以具有較好的跨模型和跨數據集泛化能力,可以類比于一種“通用翻譯器”,它不僅能理解不同語言(即由不同模型生成的圖像)之間的差異,還能在不同的環境(即不同的數據集)中有效工作。此外,其良好的抗擾動性能表明,這種方法像是具有一種“穩定的免疫系統”,能夠在面對圖像質量下降(如JPEG壓縮)或視覺干擾(如高斯模糊)時,依然保持高效的檢測能力。

人臉偽造監測(Face Forgery Detection)

人臉偽造圖生成

人臉偽裝圖根據身份信息是否更改劃分為身份信息不變類和身份替換類。

身份不變類偽造圖在圖片修改/生成時不修改圖片中人物的身份信息,包括:

  • 人臉編輯:編輯人臉的外部屬性,如年齡、性別或種族等。
  • 人臉再制定:保留源主體的身份,但操縱其口部或表情等固有屬性;
    https://github.com/harlanhong/awesome-talking-head-generation
    https://github.com/Rudrabha/Wav2Lip
  • 身份替換類偽造圖在圖片修改時同時改變其中人的身份信息
    • 人臉轉移:它將源臉部的身份感知和身份不相關的內容(例如表情和姿勢)轉移到目標臉部,換臉也換表情等等,相當于把自己臉貼在別人的頭上;
    • 換臉:它將源臉部的身份信息轉移到目標臉部,同時保留身份不相關的內容。即換臉,但不換表情,自己的臉在別人臉上做不變的事情;
    • 人臉堆疊操作(FSM):指一些方法的集合,其中部分方法將目標圖的身份和屬性轉移到源圖上,而其他方法則在轉移身份后修改交換后圖的屬性,多種方法的復合;

其他類型假圖檢測(Others types of Fake Image Detection)

  • 社交媒體中發的篡改圖:Robust Image Forgery Detection Against Transmission Over Online Social Networks, CVPR 2022: Paper Github
  • 通用圖片造假檢測(局部造假等):Hierarchical Fine-Grained Image Forgery Detection and Localization, CVPR 2023: Paper Github

本文來自互聯網用戶投稿,該文觀點僅代表作者本人,不代表本站立場。本站僅提供信息存儲空間服務,不擁有所有權,不承擔相關法律責任。
如若轉載,請注明出處:http://www.pswp.cn/news/711579.shtml
繁體地址,請注明出處:http://hk.pswp.cn/news/711579.shtml
英文地址,請注明出處:http://en.pswp.cn/news/711579.shtml

如若內容造成侵權/違法違規/事實不符,請聯系多彩編程網進行投訴反饋email:809451989@qq.com,一經查實,立即刪除!

相關文章

LabVIEW最佳傳輸系統設計

LabVIEW最佳傳輸系統設計 介紹了基于LabVIEW軟件開發的最佳基帶傳輸系統和最佳帶通傳輸系統的設計。通過軟件仿真實現了脈沖成形濾波器和匹配濾波器的設計,證明了系統在消除碼間干擾和抗噪聲方面的優異性能。此設計不僅激發了學生的學習興趣,還有助于提…

智能家居控制系統(51單片機)

smart_home_control_system 51單片機課設,智能家居控制系統 使用及轉載請標明出處(最好點個贊及star哈哈) Github地址,帶有PPT及流程圖 Gitee碼云地址,帶有PPT及流程圖 ? 以STC89C52為主控芯片,以矩陣鍵…

Java必須掌握的繼承的概述

Java的繼承是面向對象編程中的一個核心概念,它允許一個類繼承另一個類的屬性和方法。這不僅有助于代碼的重用,還使得代碼的管理和維護變得更加容易。在準備大廠面試時,理解繼承的各個方面是非常重要的。以下是一些關于Java繼承的概述和可能出…

Linux基本指令(上)

在Linux中,將文件夾稱為目錄,后面的內容都與目錄相關。 1. ls指令 語法: ls [選項][目錄或文件] 功能:對于目錄,該命令列出該目錄下的所有子目錄與文件。對于文件,將列出文件名以及其他信息。 常用選項 …

MySQL的索引和B+tree結構

目錄 0.關于索引的常見面試題 1.什么是索引? 索引的優缺點 2.索引的數據結構,為什么InnoDb引擎使用Btree作為索引的數據結構? 分析怎樣的索引才是好的 二插搜索樹 紅黑樹 B-Tree BTree 哈希 為什么 InnoDB 存儲引擎選擇使用 Btree 索…

iTOP-3588開發板快速測試手冊Android12系統功能測試

RK3588是一款低功耗、高性能的處理器,適用于基于arm的PC和Edge計算設備、個人移動互聯網設備等數字多媒體應用,RK3588支持8K視頻編解碼,內置GPU可以完全兼容OpenGLES 1.1、2.0和3.2。RK3588引入了新一代完全基于硬件的最大4800萬像素ISP&…

mac 配置faas 全局二進制命令

FaaS(即功能即服務-Function as a Services)是一種云計算服務,允許客戶執行代碼來響應事件,而無需管理通常與構建和啟動微服務應用程序相關的復雜基礎架構 在互聯網上托管軟件應用程序通常需要配置和管理虛擬服務器或物理服務器&…

洛谷題單_遞推與遞歸

P1255 數樓梯 - 洛谷 | 計算機科學教育新生態 (luogu.com.cn) //不滿分做法&#xff1a;沒有高精度 #include <bits/stdc.h> using namespace std; const int N5006; int dp[N];//dp[i]表示到第i節樓梯有dp[i]中方案 int main(){int n;cin>>n;dp[1]1;dp[0]1;for(i…

MySQL(基礎篇)——多表查詢

一.多表關系 一對多(多對一) 多對多一對一 1.一對多(多對一) a.案例&#xff1a;部門與員工的關系 b.關系&#xff1a;一個部門對應多個員工&#xff0c;一個員工對應一個部門 c.實現&#xff1a;在多的一方建立外鍵&#xff0c;指向一的一方的主鍵 2.多對多 a.案…

Elasticsearch入門-環境安裝ES和Kibana以及ES-Head可視化插件和瀏覽器插件es-client

Elasticsearch入門-環境安裝ES和Kibana 安裝 ES Windows安裝ESHead安裝瀏覽器插件 es-clientKibana 安裝 安裝es,安裝header 安裝kibana&#xff0c;安裝多種分詞器ik… 安裝 ES Windows安裝 ① 下載壓縮包并解壓官網鏈接&#xff1a;https://www.elastic.co/cn/downloads/ela…

JDK制作p12文件

生成密鑰對 首先&#xff0c;我們需要生成一對密鑰&#xff0c;用來進行證書的生成和簽名。可以使用Java的keytool工具來生成密鑰對。 keytool -genkeypair -alias mykey -keyalg RSA -keysize 2048 -validity 365 -keystore mykeystore.jks上述命令中的各個參數含義如下&…

canvas坐標系統 webgl坐標系統 uv紋理坐標系統 原點

一、canvas原點在左上角&#xff0c;x軸正方向向右&#xff0c;y軸正方向向下&#xff0c;一個點對應一個像素 二、webgl原點在正中間&#xff0c;x軸正方向向右&#xff0c;y軸正方向向上&#xff0c;數據顯示范圍在[-1,1]之間&#xff0c;超過此范圍不顯示數據 三、uv原點在左…

Eigen-矩陣切片和索引

矩陣切片和索引 一、概述二、基本的切片三、編譯時間大小和增量四、相反的順序五、索引數組六、自定義索引列表 一、概述 本頁介紹了操作符 () 為索引子集行和列提供的多種可能性。這個API已經在特性3.4中引入。它支持塊API提出的所有特性&#xff0c;以及更多。特別是&#x…

Java面試錯誤或者難點記錄

數據庫方向 1. mysql數據庫中的DATE_FORMAT函數作用是什么&#xff1f;sql server有相同作用的函數嗎&#xff1f; DATE_FORMAT函數是格式化日期或時間類型的數據&#xff0c;有兩個參數&#xff0c;第一個參數是日期或者時間數據&#xff0c;第二個參數是格式化字符串&#…

如何用ChatGPT+GEE+ENVI+Python進行高光譜,多光譜成像遙感數據處理?

原文鏈接&#xff1a;如何用ChatGPTGEEENVIPython進行高光譜&#xff0c;多光譜成像遙感數據處理&#xff1f; 第一&#xff1a;遙感科學 從攝影偵察到衛星圖像 遙感的基本原理 遙感的典型應用 第二&#xff1a;ChatGPT ChatGPT可以做什么&#xff1f; ChatGPT演示使用 …

工廠模式:沒你想像的那么難

工廠模式 工廠模式是一種創建型設計模式&#xff0c;它允許創建對象而無需指定將要創建的對象的具體類。它通過將對象的創建委托給一個單獨的方法或類來完成&#xff0c;從而隱藏了對象的實例化邏輯。這樣可以提高代碼的靈活性&#xff0c;減少了代碼中的重復和耦合。 在工廠…

2021年下半年教師資格證考試《高中信息技術》題

4.使用某轉碼軟件對一段時長為2分鐘的AVI視頻進行轉碼&#xff0c;轉碼后的視頻信息如圖4所示&#xff0c;計算存儲該視頻文件所需的空間大小為&#xff08;C &#xff09;。 A18MB B36MB C60MB D512MB 6.某21位二進制代碼100101011010011110101&#xff0c;已知該代碼由3個…

html基礎操練和進階修煉寶典

文章目錄 1.超鏈接標簽2.跳錨點3.圖片標簽4.表格5.表格的方向屬性6.子窗口7.音視頻標簽8.表單9.文件上傳10.input屬性 html修煉必經之路—各種類型標簽詳解加展示&#xff0c;關注點贊加收藏&#xff0c;防止迷路哦 1.超鏈接標簽 <!DOCTYPE html> <html lang"en…

再議【每天進步一點點】

概述 之前聽姜胡說&#xff0c;講到了他自己日更博客的故事&#xff0c;也就是每天去更新一篇博客文章。 日更&#xff0c;其實是一件很可怕的事情。 先不說文章的深度如何&#xff0c;單單從時間的耗費上&#xff0c;文字的積累上&#xff0c;以及對事物的敏感度上&#xf…

vue實現自定義樹形穿梭框功能

需求&#xff1a; 我們在開發過程中&#xff0c;會遇到需要將一個數據選擇做成穿梭框&#xff0c;但是要求穿梭框左側為樹形結構、右側為無層級結構的數據展示&#xff0c;ElementUI自身無法在穿梭框中添加樹形結構&#xff0c;網上搜到了大佬封裝的插件但是對于右側的無樹形結…