torch常用和預期輸入輸出

import torch
import torch.nn as nn
import torch.nn.functional as F

nn中定義的是類，functional里面定義的是函數操作。

輸出shape的計算公式：
$out\_shape = round\_mode (\frac{in\_shape + 2 * padding - kernel\_size}{stride} + 1)$
默認的round_mode為floor，即向下取整。可以通過ceil_mode開關，指定為向上取整。

pool

平均池化

avg_pool2d

F.avg_pool2d(input, kernel_size, stride=None, padding=0, ceil_mode=False, count_include_pad=True, divisor_override=None)->Tensor
input: [B, C, iH, iW]
kernel_size: 池化區域尺寸。單獨的數或者[kH, kW]元組。
stride: 池化操作步長。單獨的數或者[sH, sW]元組，默認值是kernel_size。
padding:輸入兩邊padding數目。單獨的數或者[padH, padW]元組。默認值是0。
ceil_mode: 如果為True，計算輸出shape時使用ceil模式，否則為floor模式。默認是False。

在一個 $kH \times kW$ 的區域內做步長為 $sH \times sW$ 的 $2 D$ 平均池化操作。這里的 $i H$ ， $k H$ ， $sH$ 命名有點迷惑性，初看以為是相乘，其實每個就是一個獨立名稱，分別代表了 $input\_height$ ， $kernel\_height$ ， $stride\_height$ 。

實際的底層pool計算邏輯：
$out(N_i, C_j, h, w) = \frac{1}{kH\times kW}\sum_{m=0}^{kH-1}\sum_{n=0}^{kW-1}input(N_i, C_j, stride[0] \times h + m, stride[1] \times w + n)$

input = torch.rand(1, 3, 64, 64)
output = F.avg_pool2d(input, kernel_size=4, stride=2, padding=1) # [1, 3, 32, 32]

AvgPool2d

nn.AvgPool2d(input, kernel_size, stride=None, padding=0, ceil_mode=False, count_include_pad=True, divisor_override=None)

作用和F.avg_pool2d()是一樣的，只是一個是函數，一個是類。

自適應平均池化

adaptive_avg_pool2d

F.adaptive_avg_pool2d(input, output_size)

具體參見下面的AdaptiveAvgPool2d。

AdaptiveAvgPool2d

nn.AdaptiveAvgPool2d(output_size)

不同于上面的AvgPool2d指定了濾波器的各種參數，得到輸出特征。這里是指定輸出特征的尺寸，算法自行計算出合適的濾波器參數，輸出特征可以滿足指定的尺寸要求。

本文來自互聯網用戶投稿，該文觀點僅代表作者本人，不代表本站立場。本站僅提供信息存儲空間服務，不擁有所有權，不承擔相關法律責任。
如若轉載，請注明出處：http://www.pswp.cn/news/166586.shtml
繁體地址，請注明出處：http://hk.pswp.cn/news/166586.shtml
英文地址，請注明出處：http://en.pswp.cn/news/166586.shtml

如若內容造成侵權/違法違規/事實不符，請聯系多彩編程網進行投訴反饋email:809451989@qq.com，一經查實，立即刪除！