PyTorch中卷積層torch.nn.Conv2d

在 PyTorch 中,卷積層主要由?torch.nn.Conv1dtorch.nn.Conv2d?和?torch.nn.Conv3d?實現,分別對應一維、二維和三維卷積操作。以下是詳細說明:

1. 二維卷積 (Conv2d) - 最常用

import torch.nn as nn# 基本參數
conv = nn.Conv2d(in_channels=3,    # 輸入通道數 (如RGB圖像為3)out_channels=16,  # 輸出通道數/卷積核數量kernel_size=3,    # 卷積核大小 (可以是int或tuple, 如(3,3))stride=1,         # 步長 (默認1)padding=1,        # 邊界填充 (默認0)dilation=1,       # 空洞卷積參數 (默認1)groups=1,         # 分組卷積參數 (默認1)bias=True         # 是否使用偏置 (默認True)
)
計算輸出尺寸:

比如:高度

?

2. 使用示例?

import torch# 輸入張量 (batch_size=4, 通道=3, 高=32, 寬=32)
x = torch.randn(4, 3, 32, 32)# 卷積層
conv = nn.Conv2d(3, 16, kernel_size=3, padding=1)
output = conv(x)
print(output.shape)  # torch.Size([4, 16, 32, 32])

3. 特殊卷積類型

(1) 空洞卷積 (Dilated Convolution)
nn.Conv2d(3, 16, kernel_size=3, dilation=2)  # 擴大感受野
(2) 分組卷積 (Grouped Convolution)
nn.Conv2d(16, 32, kernel_size=3, groups=4)  # 將輸入/輸出通道分為4組
(3) 深度可分離卷積 (Depthwise Separable)
# 等價于 groups=in_channels
depthwise = nn.Conv2d(16, 16, kernel_size=3, groups=16)
pointwise = nn.Conv2d(16, 32, kernel_size=1)  # 1x1卷積

4. 一維和三維卷積

Conv1d (時序數據/文本)
conv1d = nn.Conv1d(in_channels=256, out_channels=100, kernel_size=3)
# 輸入形狀: (batch, channels, sequence_length)
Conv3d (視頻/體積數據)
conv3d = nn.Conv3d(1, 32, kernel_size=(3,3,3))
# 輸入形狀: (batch, channels, depth, height, width)

5. 轉置卷積 (反卷積)

nn.ConvTranspose2d(16, 8, kernel_size=2, stride=2)  # 常用于上采樣

6. 初始化權重

# 常用初始化方法
nn.init.kaiming_normal_(conv.weight, mode='fan_out')
nn.init.constant_(conv.bias, 0.1)

7. 可視化卷積核

import matplotlib.pyplot as pltweights = conv.weight.detach().cpu()
plt.figure(figsize=(10,5))
for i in range(16):plt.subplot(4,4,i+1)plt.imshow(weights[i,0], cmap='gray')
plt.show()

8. 總結:

  1. 卷積核參數共享,大大減少參數量

  2. padding='same'?可保持輸入輸出尺寸相同 (PyTorch 1.9+)

  3. 通常配合?BatchNorm?和?ReLU?使用

  4. 使用?print(conv)?可查看層結構

實際應用中,卷積層常與池化層交替使用構建CNN架構,如:

self.conv_block = nn.Sequential(nn.Conv2d(3, 32, 3, padding=1),nn.BatchNorm2d(32),nn.ReLU(),nn.MaxPool2d(2)
)

本文來自互聯網用戶投稿,該文觀點僅代表作者本人,不代表本站立場。本站僅提供信息存儲空間服務,不擁有所有權,不承擔相關法律責任。
如若轉載,請注明出處:http://www.pswp.cn/news/900446.shtml
繁體地址,請注明出處:http://hk.pswp.cn/news/900446.shtml
英文地址,請注明出處:http://en.pswp.cn/news/900446.shtml

如若內容造成侵權/違法違規/事實不符,請聯系多彩編程網進行投訴反饋email:809451989@qq.com,一經查實,立即刪除!

相關文章

從 ZStack 獲取物理機與云主機信息并導出 Excel 文件

文章目錄 從 ZStack 獲取物理機與云主機信息并導出 Excel 文件環境zstack 官網客戶端封裝講解 獲取物理機信息講解 獲取云主機信息并關聯物理機講解 導出數據到 Excel 文件講解 運行主程序講解 總結最終文檔效果完整代碼 從 ZStack 獲取物理機與云主機信息并導出 Excel 文件 在…

5.好事多磨 -- TCP網絡連接Ⅱ

前言 第4章節通過回聲服務示例講解了TCP服務器端/客戶端的實現方法。但這僅是從編程角度的學習,我們尚未詳細討論TCP的工作原理。因此,將詳細講解TCP中必要的理論知識,還將給出第4章節客戶端問題的解決方案。 一、回聲客戶端完美實現 第4章…

sql server數據庫可疑修復

sql server數據庫可疑修復 從上圖可以看到數據庫nchrdb顯示可疑,導致原因為NC系統在增加公共薪資項目的時候,擴展字段報錯了,第一次遇到這種情況,折騰了很久終于解決,記下解決方案: 1,將SQL數據…

Flutter之頁面布局二

目錄: 1、列表布局1.1、基礎列表1.2、水平滑動的列表1.3、網格列表1.3、不同列表項的列表1.4、包含間隔的列表1.6、長列表 2、滾動2.1、浮動的頂欄2.2、平衡錯位滾動 1、列表布局 1.1、基礎列表 import package:flutter/material.dart;void main() > runApp(con…

ARM------硬件程序開發

硬件程序開發流程 相關硬件的工作原理 理解硬件的工作原理,明確硬件的功能和用途。 硬件連接 將硬件設備正確連接到開發板上。 編寫程序 根據硬件功能編寫相應的程序代碼。 調試驗證 通過調試工具驗證程序的正確性,確保硬件功能正常。 控制LED的…

《QT從基礎到進階·七十四》Qt+C++開發一個python編譯器,能夠編寫,運行python程序改進版

1、概述 源碼放在文章末尾 根據上一篇文章回顧下利用QtC實現了一個簡易的python編譯器,類似pycharm或vsCode這樣的編譯器,該python編譯器目前實現了如下功能: (1)支持編寫python程序 (2)編寫代…

Winform MQTT客戶端連接方式

項目中使用到Winform的數據轉發服務,所以記錄下使用到的方法。 一.創建單例模板 using System; using System.Collections.Generic; using System.Linq; using System.Text; using System.Threading.Tasks;namespace ConsoleApp.Scripts {public class SingleTon&…

Windows強制刪除任何你想刪除的文件和文件夾

Windows強制刪除任何你想刪除的文件和文件夾 本教程適用于 Windows 10/11 系統,工具和命令均經過驗證。 為什么刪除會失敗? 權限不足:文件或文件夾可能需要管理員權限才能刪除。文件被占用:某個程序正在使用目標文件&#xff0c…

Jmeter如何使用MD5進行加密?

在軟件測試中,使用 JMeter 對數據進行 MD5 加密是一項常見需求,尤其是在模擬用戶登錄等涉及密碼加密的場景時。下面詳細介紹在 JMeter 里運用 MD5 加密的具體步驟。 1. 添加 BeanShell 預處理器 JMeter 本身沒有直接的 MD5 加密功能,但可以…

4-c語言中的數據類型

一.C 語?中的常量 1.生活中的數據 整數: 100,200,300,400,500 小數: 11.11 22.22 33.33 字母: a,b,c,d A,B,C,D 在 C 語?中我們把字?叫做字符. 字符?單引號引?。例如A’ 單詞…

中鈞科技通過數字賦能,編織“數字互聯網”助力數字化進程!

時間飛逝轉眼間2025年已過去四分之一,作為一名95后回顧當下的生活,忍不住感慨10年和現在的對比。發現現在的手機支付、網上掛號、APP打車、在線學習、網絡訂餐、線上協同辦公都以逐漸成為人們生活、工作的常態。也正是在這樣的常態背景下,加快…

AI重塑云基礎設施,亞馬遜云科技打造AI定制版IaaS“樣板房”

AI正在徹底重塑云基礎設施。 IDC最新《2025年IDC MarketScape:全球公有云基礎設施即服務(IaaS)報告》顯示,AI正在通過多種方式重塑云基礎設施,公有云IaaS有望繼續保持快速增長,預計2025年全球IaaS的整體規…

高效深度學習lecture01

lecture01 零樣本學習(Zero-Shot Learning, ZSL): 模型可以在沒有見過某種特定任務或類別的訓練樣本的情況下,直接完成對應的任務 利用知識遷移 模型在一個任務上訓練時學到的知識,能夠遷移到其他任務上比如,模型知道“狗”和“…

使用 iPerf 測試內網兩臺機器之間的傳輸速度

在現代網絡管理中,確保內部網絡(內網)的高效運行是至關重要的。為了評估和優化網絡性能,我們需要一種可靠的方法來測試內網中不同設備間的傳輸速率。iPerf 作為一款廣泛使用的工具,能夠幫助我們準確測量兩個節點之間的…

視頻設備軌跡回放平臺EasyCVR如何搭建公共娛樂場所遠程視頻監控系統

一、背景介紹 由于KTV、酒吧、足療店等服務場所人員流動頻繁、環境復雜,一直是治安管理的重點區域。為有效打擊 “黃賭毒”、打架斗毆、尋釁滋事等違法犯罪的活動,打造安全有序的娛樂消費環境,我國相關部門將加大對這類場所的清查與管控力度…

vue進度條組件

<div class"global-mask" v-if"isProgress"><div class"contentBox"><div class"progresstitie">數據加載中請稍后</div><el-progress class"progressStyle" :color"customColor" tex…

Css:如何解決絕對定位子元素內容被父級元素overflow:hidden屬性剪裁

一、問題描述 今天小伙伴提了一個bug&#xff0c;在點擊列表項的“…”按鈕應該出現的懸浮菜單顯示不完整&#xff1a; 二、問題排查 一般這種問題&#xff0c;是由于懸浮菜單采用的是絕對定位&#xff0c;而父級采用了overflow:hidden屬性。但需要注意的是&#xff0c;這里的…

JavaScript基礎--01-JS簡介

字面量&#xff1a;數字、字符串、布爾值 前言JavaScript背景Web前端有三層&#xff1a;發展歷史JavaScript的發展&#xff1a;蒸蒸日上 JavaScript介紹JavaScript入門易學性JavaScript是腳本語言JavaScript的組成 JavaScript 的特點特點1&#xff1a;解釋型語言特點2&#xff…

[leetcode] 面試經典 150 題——篇9:二叉樹(番外:二叉樹的遍歷方式)

二叉樹的遍歷是指按照某種順序訪問二叉樹中的每個節點。常見的遍歷方式有四種&#xff1a;前序遍歷&#xff08;Pre-order Traversal&#xff09;、中序遍歷&#xff08;In-order Traversal&#xff09;、后序遍歷&#xff08;Post-order Traversal&#xff09;以及層序遍歷&am…

es基本概念

Elasticsearch 的架構與基本概念 Elasticsearch&#xff08;簡稱 ES&#xff09;是一個開源的分布式搜索和分析引擎&#xff0c;基于 Apache Lucene 構建。它被廣泛用于全文搜索、日志分析、實時數據分析等場景。以下是其架構概述及其基本概念的詳細解釋。 Elasticsearch 的架…