對抗攻擊-知識點

在這里插入圖片描述

文章目錄

      • 自然圖像往往靠近機器學習分類器學習到的決策邊界(decision boundaries)。
      • 正交方向--改變某一個不影響其它的
      • 特征降采樣(Feature Downsampling)
      • 通過黑盒攻擊的持續挑戰,我們才能構建真正安全可靠的智能系統
      • DCT圖像變換
    • 圖片通道數
      • 1. **PNG (Portable Network Graphics)**
      • 2. **JPEG/JPG (Joint Photographic Experts Group)**
      • 3. **RAW (原始傳感器數據)**
      • 通道對比總結

自然圖像往往靠近機器學習分類器學習到的決策邊界(decision boundaries)。

所以輕微擾動即可使預測錯誤。

正交方向–改變某一個不影響其它的

比如想象一張2x2的迷你圖片(4個像素),這時正交基就是4個互相垂直的方向:單獨增加像素1、像素2、像素3、像素4的亮度,且保證每次調整不會互相干擾。

  • 假設圖像有 d 個像素(如 224x224x3=150,528 維),正交基就是 d 個互相垂直的向量
      • 每個向量代表 一種獨立的像素修改模式
      • 任意兩個模式 互不干擾(修改模式A不會影響模式B的效果)

特征降采樣(Feature Downsampling)

特征降采樣(Feature Downsampling) 是深度學習(尤其是卷積神經網絡 CNN)中的一種核心操作,旨在逐步減少特征圖的空間尺寸(寬和高),同時增加其通道數(深度)

通過黑盒攻擊的持續挑戰,我們才能構建真正安全可靠的智能系統

通過黑盒攻擊(查詢幾百次才得到的對抗樣本)來訓練出魯棒性更強的模型

DCT圖像變換

  • 1 將RGB圖像轉換為亮度(Y)和色度(Cb, Cr)通道
    將RGB圖像轉換為亮度(Y)和色度(Cb, Cr)通道的步驟發生在DCT變換前

計算示例(像素值R=100, G=150, B=200):

Y = 0.299*100 + 0.587*150 + 0.114*200 ≈ 139.25
Cb = -0.1687*100 -0.3313*150 +0.5*200 +128 ≈ 113.23
Cr = 0.5*100 -0.4187*150 -0.0813*200 +128 ≈ 124.56

乘以固定系數即可

  • 2 DCT系數矩陣F(u,v)F(u, v)F(u,v),(核心目的)

F(u,v)=Σi=07Σj=07f(i,j)?Bu,v(i,j)F(u, v) = Σ_{i=0}^{7} Σ_{j=0}^{7} f(i, j) * B_{u,v}(i, j)F(u,v)=Σi=07?Σj=07?f(i,j)?Bu,v?(i,j)

F(u,v)F(u, v)F(u,v)是一個數值,不是波面
一個F(u,v)F(u, v)F(u,v)相當于 (u,v)確定基函數波面分別與64個像素點的乘積之和,表示了

DCT系數矩陣本質上是一個頻率能量分布圖:

每個位置對應特定方向/頻率的波面系數值表示該頻率分量(基函數波面)在圖像中的強度整體分布揭示圖像的空間頻率特征
8x8像素塊
投影到B0,0波面
得到F0,0系數
投影到B0,1波面
得到F0,1系數
...
...
投影到B7,7波面
得到F7,7系數

將系數按位置排列成8x8矩陣


  • 3 DCT固定的64個基函數波面

Bu,v(i,j)=C(u)?C(v)?cos((2i+1)uπ/16)?cos((2j+1)vπ/16)B_{u,v}(i,j) = C(u) * C(v) * cos( (2i+1)uπ / 16 ) * cos( (2j+1)vπ / 16 )Bu,v?(i,j)=C(u)?C(v)?cos((2i+1)uπ/16)?cos((2j+1)vπ/16)

i 相當于x,j 相當于y;
參數 uu 控制水平方向的頻率(即橫向條紋的密度);
參數 vv 控制垂直方向的頻率(即縱向條紋的密度)。
最終表達出來的是64個不同的波面
畫圖

在這里插入圖片描述

C(u)也是

對任何8x8像素塊,通過其得到的8x8基函數值都相同
在這里插入圖片描述>

  • DCT將圖片的信息分散到64個基函數波面上來存儲
  • 而人眼對左上角的低頻基函數波面更敏感
  • 這些低頻分量描述圖像中緩慢、平滑的變化,如大面積的色塊、亮度漸變、柔和邊緣。人眼對這些大面積、平緩變化的信息極其敏感。
  • 4 刪除高頻信息后還原圖片

圖片通道數

圖像通道數(Channels)取決于格式和存儲的數據類型。以下是主要區別:

1. PNG (Portable Network Graphics)

  • 典型通道數
    • RGB 模式:3 通道(紅、綠、藍)
    • RGBA 模式:4 通道(紅、綠、藍 + Alpha 透明度)
    • 灰度模式:1 通道(僅亮度)
    • 灰度+Alpha:2 通道(亮度 + 透明度)
  • 位深度:支持 8 位/通道(24 位色)或 16 位/通道(48 位色)
  • 透明支持:Alpha 通道實現平滑過渡透明

2. JPEG/JPG (Joint Photographic Experts Group)

  • 典型通道數
    • 僅支持 3 通道(紅、綠、藍)
    • 不支持透明度(無 Alpha 通道)
  • 特殊模式
    • 灰度 JPEG:1 通道(較少用)
  • 位深度:固定 8 位/通道(24 位色)
  • 透明替代方案:通過背景色模擬透明(效果生硬)

3. RAW (原始傳感器數據)

  • 核心通道數
    • 本質是 1 通道(每個像素只記錄單色光強度)
  • 實際處理
    • 通過 Bayer 濾鏡陣列重建為 3 通道 RGB
    • 專業軟件可提取 4 通道(R、G1、G2、B)或更多
  • 位深度:12-16 位/通道(佳能 CR2:14 位/通道)
  • 特殊通道
    • 可能包含紅外/深度等元數據通道

通道對比總結

格式典型通道數透明度支持位深度通道特性
PNG1/2/3/4? Alpha 通道8 或 16 位靈活支持多種模式
JPEG3 (或 1)?8 位固定純色彩數據,無擴展通道
RAW1 (重建為3)?12-16 位原始傳感器單通道 + 元數據

💡 注意

  • PNG 的 Alpha 通道讓邊緣融合更自然(如陰影/發光效果)
  • RAW 的"單通道"本質使其文件體積遠小于同分辨率 PNG(未壓縮時)
  • JPEG 的 3 通道固定結構是其壓縮效率高的原因之一

本文來自互聯網用戶投稿,該文觀點僅代表作者本人,不代表本站立場。本站僅提供信息存儲空間服務,不擁有所有權,不承擔相關法律責任。
如若轉載,請注明出處:http://www.pswp.cn/web/90788.shtml
繁體地址,請注明出處:http://hk.pswp.cn/web/90788.shtml
英文地址,請注明出處:http://en.pswp.cn/web/90788.shtml

如若內容造成侵權/違法違規/事實不符,請聯系多彩編程網進行投訴反饋email:809451989@qq.com,一經查實,立即刪除!

相關文章

7.26 作業

一、實驗要求及其拓撲圖: 本次實驗拓撲圖: 二、實驗IP地址劃分: 1. 公網地址(R5 作為 ISP,使用公網地址): R1 與 R5 之間接口:15.1.1.0/24,R1 側為 15.1.1…

Kafka運維實戰 14 - kafka消費者組消費進度(Lag)深入理解【實戰】

目錄什么是消費者 Lag舉例說明:Lag 的意義:Lag 監控和查詢kafka-consumer-groups基本語法常用命令示例1. 查看單個消費者組的詳細信息(最常用)2. 列出所有消費者組(只顯示名稱)3. 列出所有消費者組&#xf…

設計模式(十三)結構型:代理模式詳解

設計模式(十三)結構型:代理模式詳解代理模式(Proxy Pattern)是 GoF 23 種設計模式中的結構型模式之一,其核心價值在于為其他對象提供一種間接訪問的機制,以控制對原始對象的訪問。它通過引入一個…

24點數學游戲(窮舉法求解表達式)

摘要本畢業設計旨在利用MATLAB技術實現一個24點數學游戲,采用窮舉法求解所有可能的表達式組合。通過全排列數字、枚舉運算符及括號位置,結合遞歸回溯算法,系統能夠高效地搜索所有可能的運算路徑,并驗證結果是否為24。實驗結果表明…

【web應用】如何進行前后端調試Debug? + 前端JavaScript調試Debug?

文章目錄一、前后端:后端以Debug模式運行后端項目,打斷點二、前后端:前端項目在瀏覽器中調試三、單獨前端:前端JavaScript調試1、控制臺輸出2、網頁調試器中添加斷點3、debugger關鍵字一、前后端:后端以Debug模式運行后…

FreeCAD開發樓梯參數化三維模型和鋼格柵

根據樓梯標準圖集開發各種樓梯。上行左轉,上行右轉,對應的欄桿也是配套2種。樓梯總成鋼格柵標準里的跨度和承載 扁鋼尺寸,輕松切換和修改參數。格柵綜合本來格柵上橫桿是冷軋扭鋼筋,先繪制一個圓柱,再做一個內切正方形…

【AcWing 836題解】合并集合

AcWing 836. 合并集合 【題目描述】 在查看解析之前,先給自己一點時間思考哦! 【題解】 并查集是一種用于處理集合合并與查詢問題的數據結構,通常支持以下兩種操作: Find:查詢一個元素所在的集合。 Union&#xff1a…

MySQL鎖機制與MVCC原理剖析

在MySQL中,我們使用到了它的各種類鎖;按照它的維度,有各種鎖 從數據庫的操作粒度有,表鎖,行鎖。從數據庫的操作的類型,有讀鎖和寫鎖。性能上有樂觀鎖和悲觀鎖。 在上一篇文章中的事務隔離級別,需…

C++學習(線程相關)

目錄 一、線程庫thread 1.使用外部函數 2. 使用類的函數 3. 添加參數 二、線程庫 mutex 1.使用lock()方法 2.try_lock()方法 三、線程庫lock_guard 四、線程庫unique_lock 1.adopt_lock 2.defer_lock() 五、線程庫call_once 六、線程庫promise & future 七、c…

EPOLLONESHOT 深度解析:Linux epoll 的單次觸發機制

EPOLLONESHOT 深度解析:Linux epoll 的單次觸發機制 EPOLLONESHOT 是 Linux epoll 接口中的高級事件標志,用于實現精確的事件單次觸發控制。以下是其全面技術解析: 核心設計理念 #mermaid-svg-Xg5sCLdddqmKsvKG {font-family:"trebuchet…

深入解析MongoDB分片原理與運維實踐指南

深入解析MongoDB分片原理與運維實踐指南 技術背景與應用場景 隨著互聯網業務的高速發展,單節點MongoDB實例在數據量和訪問并發上都面臨瓶頸。為了解決數據存儲容量受限和讀寫性能下降的問題,MongoDB官方提供了分片(Sharding)方案&…

基于Django的天氣數據可視化分析預測系統

【86-Django】基于Django的天氣數據可視化分析預測系統(完整系統源碼開發筆記詳細部署教程)? 目錄 一、項目簡介 二、項目界面展示 三、項目視頻展示 四、技術架構 五、核心功能模塊 六、部署教程一、項目簡介 隨著全球氣候變化和極端天氣事件的頻發&am…

怎么放大單片機輸出電流

單片機作為電子系統的控制核心,其 I/O 口輸出電流通常較小(一般在 10-20mA 左右),難以直接驅動繼電器、電機、大功率 LED 等需要較大工作電流的外設。因此,在實際應用中需通過特定電路放大單片機輸出電流,實…

站長百科類網站pbootcms模板(自適應手機端)+利于SEO優化(下載)

站長百科類網站pbootcms模板(自適應手機端)利于SEO優化 模板介紹: PbootCMS內核開發的模板,該模板屬于新聞資訊、新聞博客類企業使用! 頁面簡潔簡單,容易管理,附帶測試數據! 模板特點: 1、手工書…

【Golang】Go語言函數

Go語言函數 文章目錄Go語言函數Go函數特點一、函數的基本格式定義二、匿名函數三、自執行函數四、閉包函數五、延遲調用Go函數特點 無需聲明原型支持不定 變參支持多返回值支持匿名函數和閉包函數也是一種類型,一個函數可以賦值給變量不支持嵌套,一個包…

JAVA算法練習題day2

雙指針4.移動零二刷昨天的題,學習了新的數據結構StringBuilder。專為頻繁字符串拼接設計的可變字符串類。(https://blog.csdn.net/m0_73941339/article/details/145651287)二刷完昨天的題目,做到這題腦子已經轉不動了。做雙指針,一般雙指針初…

LLM2Rec-新國立-KDD2025-微調LLM獲得蘊含協同信息的embedding

文章目錄1. 背景與問題任務背景動機LLM2Rec 兩大步驟2. 方法2.1 Collaborative Supervised Fine-tuning(CSFT)2.2 Item-level Embedding Modeling2.2.1 從單向注意力 → 雙向注意力(Bidirectional attention)2.2.2 商品級別的對比…

前端學習9:JavaScript--對象與原型

前言:適合有基礎的同學入門嘗試 / 復習回憶。對象基礎:1.創建用戶對象const user {// 屬性(鍵值對)name: "小島",age: 20,isAdmin: false, }2.方法(函數屬性)sayHello() {console.log(你好&…

網絡:應用層

網絡:應用層 我們要知道,所有的問題解決都是在應用層。:happy: 協議是一種約定,也就是雙方約定好的結構化的數據。但是在讀寫數據時我們都是按字符串的方式來發送接受的,那么我們應該如和傳輸結構化的數據呢?應用層協…

rust-包和箱子

📦 圖解 Rust 代碼組織層級 #mermaid-svg-fBDy1PDZZ6bi000z {font-family:"trebuchet ms",verdana,arial,sans-serif;font-size:16px;fill:#333;}#mermaid-svg-fBDy1PDZZ6bi000z .error-icon{fill:#552222;}#mermaid-svg-fBDy1PDZZ6bi000z .error-text{fi…