(aaai2025) SparseViT: 用于圖像篡改檢測的Spare-Coding Transformer

論文:(aaai2025) SparseViT: Nonsemantics-Centered, Parameter-Efficient Image Manipulation
Localization through Spare-Coding Transformer

代碼:https://github.com/scu-zjz/SparseViT

這個論文研究的是圖像篡改檢測(Image Manipulation Localization, IML)問題。作者指出,幾乎所有現有的模型都采用了“語義分割骨干網”與“手工設計特征”相結合的設計。作者認為,使用 sparse coding 對全局信息建模能夠有效的檢測圖像中的篡改區域。

論文的整體框架如下圖所示,包括兩個部分:encoder with sparse self-attention 和 融合多尺度特征的LFF。其中,encoder包括4個階段,前面2個階段為卷積,階段3和4為 sparse self-attention,sparse rate 包括8,4,2,1,在圖中用不同顏色標明。

Sparse Self-Attention: 對于輸入尺寸為 HxWxC 的特征,作者使用 sparsity rate 為S 來處理,將特征分解為大小為 SxS 個 non-overlapping patch,每個 patch 的尺寸為 (H/S)x(W/S),然后在每個 patch 內計算全局注意力。下圖展示了 sparse rate = 2 的一個示例。

Learnable Feature Fusion(LFF): 結構如下圖所示,階段3和4的特征F1到F6分別通過卷積和上采樣,變成一樣的尺寸,通道數量均為512,最后相加融合。作者給每個通道都設計了一個可學習的參數 γ \gamma γ,自適應的調整 feature map 的權重。

作者實驗分析了 sparse attention 的效果,可以看出稀疏化后,錨點的注意力更多地集中在包含非語義信息的與操作相關的邊緣區域,而不是周圍的語義區域。

其它實驗可以參考作者論文,這里不過多介紹。

本文來自互聯網用戶投稿,該文觀點僅代表作者本人,不代表本站立場。本站僅提供信息存儲空間服務,不擁有所有權,不承擔相關法律責任。
如若轉載,請注明出處:http://www.pswp.cn/bicheng/85914.shtml
繁體地址,請注明出處:http://hk.pswp.cn/bicheng/85914.shtml
英文地址,請注明出處:http://en.pswp.cn/bicheng/85914.shtml

如若內容造成侵權/違法違規/事實不符,請聯系多彩編程網進行投訴反饋email:809451989@qq.com,一經查實,立即刪除!

相關文章

C#測試調用Markdig解析Markdown的基本用法

Markdig是.NET平臺的高性能開源Markdown處理器,嚴格遵循 CommonMark 標準,確保解析一致性,其核心優勢在于擴展性強:通過模塊化管道模型,可輕松添加自定義語法或修改現有邏輯。Markdig內置支持表格、任務列表、數學公式…

MySQL 主從同步完整配置示例

以下是 MySQL 主從同步完整配置示例(基于 Linux 系統),包含主庫和從庫的配置步驟: 一、主庫(Master)配置 1. 安裝 MySQL(以 CentOS 為例) yum install -y mysql-server systemctl …

可信啟動與fTPM的交互驗證(概念驗證)

安全之安全(security)博客目錄導讀 目錄 一、組件構成 二、Arm FVP平臺PoC構建 三、在Armv8-A Foundation FVP上運行PoC 四、微調fTPM TA 可信啟動(Measured Boot)是通過密碼學方式度量啟動階段代碼及關鍵數據(例如使用TPM芯片&#xff…

SQL Server基礎語句4:數據定義

文章目錄 一、數據庫與架構1.1 創建與刪除數據庫1.1.1 使用CREATE DATABASE語句創建數據庫1.1.2 使用DROP DATABASE語句刪除數據庫1.1.3 使用SSMS創建數據庫1.1.4 使用SSMS刪除數據庫 1.2 CREATE SCHEMA:創建新架構1.2.1 Schema簡介1.2.2 使用CREATE SCHEMA語句創建…

上門按摩app會員系統框架搭建

一、邏輯分析 用戶注冊與登錄: 新用戶需要提供基本信息,如姓名、手機號、郵箱等進行注冊。手機號用于接收驗證碼進行身份驗證,郵箱可用于密碼找回等功能。注冊成功后,用戶可以使用手機號 / 郵箱和密碼進行登錄。登錄時需要驗證用戶…

java項目打包成jar包,并給jmeter使用

1.新建項目 編寫代碼,導入必要的jar包, 右鍵點擊項目,然后export,選擇main函數, package utils; import java.text.SimpleDateFormat; import java.util.Date; import java.util.Locale; import java.util.Random; …

【Qt開發】Qt音頻

Qt中,視頻播放的功能主要是通過 QMediaPlayer類和 QVideoWidget類來實現。在使用這兩個類時,需要在 .pro項目配置文件中添加對應的模塊——multimedia 和 multimediawidgets。 核心的API如下: 下面來模擬實現音頻文件的播放。 Widget::Widget…

橢球面上梯形面積的通用公式和圖幅公式

import numpy as np def ellipsoidal_trapezoid_area(a, b, phi1_deg, phi2_deg, delta_L_deg, is_map_sheetFalse): """ 計算橢球面上梯形面積的通用公式和圖幅公式 參數: a: 橢球長半軸(米) b: 橢球…

Pytest 入門:測試函數與測試類詳解

概述 在編寫自動化測試時,了解如何組織和管理測試用例是至關重要的。Pytest 提供了靈活的方式來定義測試函數和測試類,并支持多層次的設置(setup)和清理(teardown)機制,幫助你更高效地進行代碼驗證。本文將詳細介紹 測試函數 和 測試類 的概念、定義、注意點以及實際操…

大模型的部署簡單搭建

大模型的部署搭建 真的好久沒有進行博客的寫作了,原因,最近的自己生活有點小波動, 最近想想還是有空寫一篇文章,這篇文章的描述是學習的當下熱門AI 本期,介紹的也是AI相關的LLM(大語言模型) 這個好多人應該都是模糊的,包括我一開始沒有學習,就感覺牛逼的不行,今天我們親自部署實…

基于ssm英語學習交流平臺微信小程序源碼數據庫文檔

摘要 隨著信息技術在管理上越來越深入而廣泛的應用,管理信息系統的實施在技術上已逐步成熟。本文介紹了英語學習交流平臺小程序的開發全過程。通過分析英語學習交流平臺小程序管理的不足,創建了一個計算機管理英語學習交流平臺小程序的方案。文章介紹了英…

華為云Flexus+DeepSeek征文|在Dify-LLM平臺中開發童話故事精靈工作流AI Agent

華為云FlexusDeepSeek征文|在Dify-LLM平臺中開發童話故事精靈工作流AI Agent 🌟嗨,我是LucianaiB! 🌍 總有人間一兩風,填我十萬八千夢。 🚀 路漫漫其修遠兮,吾將上下而求索。 目錄…

從實踐出發談如何開發一款好用的RTMP播放器

近幾年,RTMP 播放器市場涌現出大量“宣傳型”產品。各種“低延遲”“不卡頓”“跨平臺”幾乎成為標配口號,宣傳文案看起來精彩紛呈,實際項目落地時卻屢屢暴露問題:啟動緩慢、黑屏、音畫不同步,甚至連基本的穩定播放都無…

STM32F1\F4\H7 CubeMx 定時器配置

目錄 1 定時器使用 1.1 CubeMX 配置 1.1.1 創建工程 1.1.2 時鐘配置 1.1.3 定時器配置 1.1.4 GPIO 配置 1.1.5 工程管理 1.2 keil5 配置 1.2.1 添加代碼 1.2.2 修改配置 1.2.3 下載程序 2 PWM使用 2.1 CubeMX 配置 2.1.1 PWM 配置 2.1.2 周期\頻率計算方法 2.2…

2025中科院2區SCI-狀態優化算法Status-based Optimization-附Matlab免費代碼

近年來,現實世界的優化問題變得越來越復雜,挑戰了傳統確定性方法的有效性。本文介紹了基于狀態的優化(SBO),這是一種受人類對地位提升的渴望啟發的高效算法。通過模擬個人如何接近、學習或從高地位人物那里獲得資源&am…

MySQL 啟動報錯 “The server quit without updating PID file“ 的全面解決方案(適用于 5.7/8.0 全版本)

摘要 在 MySQL 數據庫運維中,"The server quit without updating PID file" 是常見且棘手的啟動錯誤。本文結合 MySQL 官方文檔及實戰經驗,系統梳理該錯誤的 10 大核心成因與解決方案,覆蓋權限、配置、磁盤、SELinux 等多維度&…

運行時安全引擎RSE

安全之安全(security)博客目錄導讀 目錄 一、RSE 通信層 1.1 消息結構 1.2 源代碼文件 1.3 MHU 通信的 API 二、RSE 提供的運行時服務 2.1 運行時服務 API 2.2 軟件與 API 層次結構 三、基于 RSE 的 Measured Boot(度量啟動) 3.1 Measured Boo…

Elasticsearch、Faiss、Milvus在向量索引實現上的核心差

Faiss、Elasticsearch(ES)和Milvus在向量索引實現上的核心差異主要體現在架構定位、索引技術、擴展性及適用場景上,具體對比如下: 一、架構設計與定位? ?維度??Faiss??Elasticsearch??Milvus??核心定位?單機向量索引…

iot-dc3 項目windows本地運行保姆喂奶級教程

一.源碼拉取 當前時間:2025年06月18日12點02分 后臺接口服務:https://gitee.com/pnoker/iot-dc3.git 前端:https://gitee.com/pnoker/iot-dc3-web.git 請自行拉取至本地。 二.本地環境準備 其他基礎環境先不講了,如有需要請留言。 idea + VS Code。 IntelliJ IDEA 2024.2.…

內部網關協議配置實驗

一:靜態路由 簡述:在華為路由器中,使用ip route-static命令配置靜態路由。一條靜態路由主要包含以下要素。 目的地址:數據包要到達的目標IP地址 子網掩碼:用于指定目的地址的網絡部分和主機部分 下一跳地址&#xff08…