卷積神經網絡 - 一維卷積、二維卷積

卷積(Convolution),也叫褶積,是分析數學中一種重要的運算。在信號處理或圖像處理中,經常使用一維或二維卷積,本博文我們來學習一維卷積和二維卷積。

理解一維卷積和二維卷積的核心在于把握維度對特征提取方式的影響。我們從數學定義、幾何意義和應用場景三個維度展開分析,并通過對比揭示其本質差異。

一、數學定義對比

1.?一維卷積 (1D Convolution)

特性

  • 滑動方向:單一方向(時間軸/序列方向)

  • 感受野:連續區間

  • 參數數量:K×Cin×Cout

2.?二維卷積 (2D Convolution)

特性

  • 滑動方向:兩個正交方向(高度+寬度)

  • 感受野:矩形區域

  • 參數數量:Kh?×Kw?×Cin?×Cout?

二、幾何意義解析

1.?一維卷積的幾何視角

特征提取模式

  • 在時間軸上滑動的局部窗口

  • 捕獲時序相關性(如語音中的音素過渡)

  • 典型模式檢測:

    • 上升沿檢測核:[1, 0, -1]

    • 振動檢測核:[1, -2, 1]

2.?二維卷積的幾何視角

特征提取模式

  • 在平面網格上滑動的局部窗口

  • 捕獲空間相關性(如圖像中的邊緣走向)

  • 典型模式檢測:

    • 水平邊緣檢測核:

    • 45度對角線檢測核:

三、計算過程對比演示

案例1:一維卷積實例

輸入序列[3, 5, 2, 6, 8]
卷積核[0.5, -1]
計算過程(步長=1,無填充):

位置1: 3×0.5 + 5×(-1) = 1.5 -5 = -3.5  
位置2: 5×0.5 + 2×(-1) = 2.5 -2 = 0.5  
位置3: 2×0.5 + 6×(-1) = 1 -6 = -5  
位置4: 6×0.5 + 8×(-1) = 3 -8 = -5

輸出[-3.5, 0.5, -5, -5]

案例2:二維卷積實例

輸入矩陣

卷積核

計算過程(步長1,無填充):

位置(1,1): 
1×1 + 3×0 + 4×(-1) + 6×0.5 = 1 -4 +3 = 0位置(1,2): 
3×1 + 2×0 + 6×(-1) + 5×0.5 = 3 -6 +2.5 = -0.5位置(2,1): 
4×1 + 6×0 + 7×(-1) + 9×0.5 = 4 -7 +4.5 = 1.5位置(2,2): 
6×1 + 5×0 + 9×(-1) + 8×0.5 = 6 -9 +4 = 1

輸出矩陣

四、本質差異深度分析

維度特征提取方向參數空間不變性典型應用
1D單方向時序關系O(K)時間平移語音識別、股票預測
2D二維空間關系O(K^2)空間平移圖像分類、醫學影像

關鍵差異點

  1. 鄰域結構

    • 1D:線性鄰域(前序-當前-后續)

    • 2D:平面鄰域(包含空間拓撲關系)

  2. 參數復雜度

    • 1D參數量隨核長度線性增長

    • 2D參數量隨核尺寸平方增長

  3. 平移不變性

    • 1D處理時間平移(早/晚出現相同模式)

    • 2D處理空間平移(不同位置相同物體)

  4. 特征組合方式

    • 1D通過堆疊卷積層捕獲長程依賴

    • 2D通過分層卷積建立多尺度表征

五、統一數學框架

兩種卷積都可以納入張量卷積的一般形式:

  • 對于1D卷積,其中一個維度退化(如j=0)

  • 對于2D卷積,兩個維度都保持活躍

幾何解釋

  • 1D:在直線上滑動的線段檢測器

  • 2D:在平面上滑動的平面檢測器

六、現代擴展形式

擴展類型1D實現2D實現目的
空洞卷積間隔采樣時序點棋盤式采樣擴大感受野
可分離卷積深度分離時序卷積空間分離卷積降低參數量
動態卷積時間自適應的核空間自適應的核增強靈活性

七、選擇指導原則

  1. 數據類型決定維度

    • 時間序列 → 1D卷積

    • 圖像/視頻 → 2D/3D卷積

  2. 特征方向性需求

    • 需要捕獲空間方向特征 → 2D卷積

    • 僅需序列模式 → 1D卷積

  3. 計算資源約束

    • 資源有限時優先1D

    • 允許復雜計算時使用2D

終極理解
一維卷積是時序特征提取器,關注事件發生的順序規律;二維卷積是空間特征提取器,關注模式的幾何分布。

二者的本質區別在于:
1D卷積處理的是因果性(causality),2D卷積處理的是共現性(co-occurrence)。這種維度差異決定了它們在特征表示、參數設計和應用場景上的根本不同。

八、示例

典型類比:
現實場景卷積對應
金屬探測器掃沙灘在二維空間滑動檢測
心電圖機走紙在時間軸上滑動分析
驗鈔燈照射紙幣多層級特征驗證
一維卷積示例:

下層為輸入信號序列, 上層為卷積結果。連接邊上的數字為濾波器中的權重。下圖的卷積結果為近似值。

二維卷積示例

在數學卷積的定義中,核翻轉指的是在計算卷積前,將卷積核進行反轉操作。具體來說:

  • 一維卷積:如果卷積核為 [a, b, c],翻轉后得到 [c, b, a]。
  • 二維卷積:如果卷積核為

翻轉操作即先水平翻轉,再垂直翻轉,結果為

這種翻轉是數學卷積定義的一部分,確保了卷積運算的交換性和其他數學性質。需要注意的是,在很多深度學習框架中實際使用的操作更接近于交叉相關(不翻轉卷積核),但嚴格的數學卷積要求核翻轉。以上的例子為嚴格的數學卷積,即先翻轉

在圖像處理中,卷積經常作為特征提取的有效方法。一幅圖像在經過卷積操作后得到結果稱為特征映射(Feature Map)。下圖給出在圖像處理中幾種常用的濾波器,以及其對應的特征映射。圖中最上面的濾波器是常用的高斯濾波器,可以用來對圖像進行平滑去噪;中間和最下面的濾波器可以用來提取邊緣特征。

九、特性和關鍵優勢:

卷積就像用同一個「特征掃描儀」在數據上逐段檢查,專注尋找重復出現的局部模式。

想象你拿手機掃描超市貨架找可樂:

  1. 掃描動作:手機攝像頭每次對準貨架的一小塊區域(局部連接)

  2. 同一標準:無論掃描哪個位置,都用相同的"可樂logo識別程序"(權重共享)

  3. 滑動檢測:從左到右移動手機,直到找到紅底白字的經典標志(滑動窗口)

  • 效率高:1個掃描器重復使用,避免重復造輪子

  • 專注細節:每次只看局部,不受無關信息干擾

  • 模式專家:專門檢測平移不變的特征(如無論貓咪在圖片哪個位置都能識別)

終極記憶口訣:
"小窗滑動,同標檢測,特征抓取,高效省力"

本文來自互聯網用戶投稿,該文觀點僅代表作者本人,不代表本站立場。本站僅提供信息存儲空間服務,不擁有所有權,不承擔相關法律責任。
如若轉載,請注明出處:http://www.pswp.cn/news/898172.shtml
繁體地址,請注明出處:http://hk.pswp.cn/news/898172.shtml
英文地址,請注明出處:http://en.pswp.cn/news/898172.shtml

如若內容造成侵權/違法違規/事實不符,請聯系多彩編程網進行投訴反饋email:809451989@qq.com,一經查實,立即刪除!

相關文章

java學習總結(六)Spring IOC

一、Spring框架介紹 Spring優點: 1、方便解耦,簡化開發,IOC控制反轉 Spring 就是一個大工廠,可以將所有對象創建和依賴關系維護交給Spring 2、AOP 編程的支持 Spring 提供面向切編程,可以方便的實現對序進行權限攔截、運監控等…

大模型推理:LM Studio在Mac上部署Deepseek-R1模型

LM Studio LM Studio是一款支持離線大模型部署的推理服務框架,提供了易用的大模型部署web框架,支持Linux、Mac、Windows等平臺,并提供了OpenAI兼容的SDK接口,主要使用LLama.cpp和MLX推理后端,在Mac上部署時選擇MLX推理…

AI技術學習筆記系列004:GPU常識

顯卡架構是GPU設計的核心,不同廠商有其獨特的架構演進。以下是主要廠商的顯卡架構概述: 一、NVIDIA Tesla(2006-2010) 代表產品:GeForce 8000系列(G80)。特點:首款統一著色架構&…

實驗- 分片上傳 VS 直接上傳

分片上傳和直接上傳是兩種常見的文件上傳方式。分片上傳將文件分成多個小塊,每次上傳一個小塊,可以并行處理多個分片,適用于大文件上傳,減少了單個請求的大小,能有效避免因網絡波動或上傳中斷導致的失敗,并…

Android視頻渲染SurfaceView強制全屏與原始比例切換

1.創建UI添加強制全屏與播放按鈕 2.SurfaceView控件設置全屏顯示 3.全屏點擊事件處理實現 4.播放點擊事件處理 5.使用接口更新強制全屏與原始比例文字 強制全屏/原始比例 點擊實現

數據結構——串、數組和廣義表

串、數組和廣義表 1. 串 1.1 串的定義 串(string)是由零個或多個字符組成的有限序列。一般記為 S a 1 a 2 . . . a n ( n ≥ 0 ) Sa_1a_2...a_n(n\geq0) Sa1?a2?...an?(n≥0) 其中,S是串名,單引號括起來的字符序列是串的值, a i a_i a…

無再暴露源站!群聯AI云防護IP隱匿方案+防繞過實戰

一、IP隱藏的核心原理 群聯AI云防護通過三層架構實現源站IP深度隱藏: 流量入口層:用戶訪問域名解析至高防CNAME節點(如ai-protect.example.com)智能調度層:基于AI模型動態分配清洗節點,實時更新節點IP池回…

1.5.3 掌握Scala內建控制結構 - for循環

Scala的for循環功能強大&#xff0c;支持單重和嵌套循環。單重for循環語法為for (變量 <- 集合或數組 (條件)) {語句組}&#xff0c;可選篩選條件&#xff0c;循環變量依次取集合值。支持多種任務&#xff0c;如輸出指定范圍整數&#xff08;使用Range、to、until&#xff0…

【MySQL基礎-9】深入理解MySQL中的聚合函數

在數據庫操作中&#xff0c;聚合函數是一類非常重要的函數&#xff0c;它們用于對一組值執行計算并返回單個值。MySQL提供了多種聚合函數&#xff0c;如COUNT、SUM、AVG、MIN和MAX等。這些函數在數據分析和報表生成中扮演著關鍵角色。本文將深入探討這些聚合函數的使用方法、注…

windows版本的時序數據庫TDengine安裝以及可視化工具

了解時序數據庫TDengine&#xff0c;可以點擊官方文檔進行詳細查閱 安裝步驟 首先找到自己需要下載的版本&#xff0c;這邊我暫時只寫windows版本的安裝 首先我們需要點開官網&#xff0c;找到發布歷史&#xff0c;目前TDengine的windows版本只更新到3.0.7.1&#xff0c;我們…

Web測試

7、Web安全測試概述 黑客技術的發展歷程 黑客基本涵義是指一個擁有熟練電腦技術的人&#xff0c;但大部分的媒體習慣將“黑客”指作電腦侵入者。 黑客技術的發展 在早期&#xff0c;黑客攻擊的目標以系統軟件居多。早期互聯網Web并非主流應用&#xff0c;而且防火墻技術還沒有…

華為OD機試 - 最長的完全交替連續方波信號(Java 2023 B卷 200分)

題目描述 給定一串方波信號,要求找出其中最長的完全連續交替方波信號并輸出。如果有多個相同長度的交替方波信號,輸出任意一個即可。方波信號的高位用1標識,低位用0標識。 說明: 一個完整的信號一定以0開始并以0結尾,即010是一個完整的信號,但101,1010,0101不是。輸入的…

游戲引擎學習第163天

我們可以在資源處理器中使用庫 因為我們的資源處理器并不是游戲的一部分&#xff0c;所以它可以使用庫。我說過我不介意讓它使用庫&#xff0c;而我提到這個的原因是&#xff0c;今天我們確實有一個選擇——可以使用庫。 生成字體位圖的兩種方式&#xff1a;求助于 Windows 或…

7、什么是死鎖,如何避免死鎖?【高頻】

&#xff08;1&#xff09;什么是死鎖&#xff1a; 死鎖 是指在兩個或多個進程的執行時&#xff0c;每個進程都持有資源 并 等待其他進程 釋放 它所需的資源&#xff0c;如果此時所有的進程一直占有資源而不釋放&#xff0c;就會陷入互相等待的一種僵局狀態。 死鎖只有同時滿足…

Compose 實踐與探索十四 —— 自定義布局

自定義布局在 Compose 中相對于原生的需求已經小了很多&#xff0c;先講二者在本質上的邏輯&#xff0c;再說它們的使用場景&#xff0c;兩相對比就知道為什么 Compose 中的自定義布局的需求較小了。 原生是在 xml 布局文件不太方便或者無法滿足需求時才會在代碼中通過自定義 …

【C++】:C++11詳解 —— 入門基礎

目錄 C11簡介 統一的列表初始化 1.初始化范圍擴展 2.禁止窄化轉換&#xff08;Narrowing Conversion&#xff09; 3.解決“最令人煩惱的解析”&#xff08;Most Vexing Parse&#xff09; 4.動態數組初始化 5. 直接初始化返回值 總結 聲明 1.auto 類型推導 2. declty…

oracle刪除表中重復數據

需求&#xff1a; 刪除wfd_procs_nodes_rwk表中&#xff0c;huser_id、dnode_id、rwk_name字段值相同的記錄&#xff0c;如果有多條&#xff0c;只保留一條。 SQL&#xff1a; DELETE FROM wfd_procs_nodes_rwk t WHERE t.rowid > (SELECT MIN(t1.rowid)FROM wfd_procs_n…

ESP32學習 -從STM32工程架構進階到ESP32架構

ESP32與STM32項目文件結構對比解析 以下是對你提供的ESP32項目文件結構的詳細解釋&#xff0c;并與STM32&#xff08;以STM32CubeIDE為例&#xff09;的常見結構進行對比&#xff0c;幫助你理解兩者的差異&#xff1a; 1. ESP32項目文件解析 文件/目錄作用STM32對應或差異set…

整形在內存中的存儲(例題逐個解析)

目錄 一.相關知識點 1.截斷&#xff1a; 2.整形提升&#xff1a; 3.如何 截斷&#xff0c;整型提升&#xff1f; &#xff08;1&#xff09;負數 &#xff08;2&#xff09;正數 &#xff08;3&#xff09;無符號整型&#xff0c;高位補0 注意&#xff1a;提升后得到的…

HTML中滾動加載的實現

設置div的overflow屬性&#xff0c;可以使得該div具有滾動效果&#xff0c;下面以div中包含的是table來舉例。 當table的元素較多&#xff0c;以至于超出div的顯示范圍的話&#xff0c;觀察下該div元素的以下3個屬性&#xff1a; clientHeight是div的顯示高度&#xff0c;scrol…