PyTorch張量操作中dim參數的核心原理與應用技巧：

今天在搭建神經網絡模型中重寫forward函數時，對輸出結果在最后一個維度上應用 Softmax 函數，將輸出轉化為概率分布。但對于dim的概念不是很熟悉，經過查閱后整理了一下內容。

PyTorch張量操作精解：深入理解`dim`參數的維度規則與實踐應用

在PyTorch中，張量（Tensor）的維度操作是深度學習模型實現的基礎。dim參數作為高頻出現的核心概念，其取值邏輯直接影響張量運算的結果。本文將從??維度索引與張量階數的本質區別??出發，系統解析dim在不同場景下的行為規則，并通過代碼示例展示其實際應用。

??維度索引（Dimension Index）??
指定操作沿哪個軸執行。索引范圍從0（最外層）到ndim-1（最內層）。
例：二維張量中，dim=0表示行方向（垂直），dim=1表示列方向（水平）。
??張量階數（Tensor Order）??
描述張量自身的維度數量，如標量（0階）、向量（1階）、矩陣（2階）。
??關鍵區別??：dim=0不表示“一維張量”，而是“操作沿最外層軸進行”。

負索引dim=-k等價于??dim = ndim - k??，其中ndim是總維度數

x = torch.rand(2, 3, 4)  # ndim=3
x.sum(dim=-1)            # 等價于 dim=2（最內層維度）

僅含單一維度，索引只能是0或-1（二者等價）

v = torch.tensor([1, 2, 3])
v.sum(dim=0)   # 輸出：tensor(6)
v.sum(dim=-1)  # 同上

支持兩個維度索引，正負索引對應關系如下：

操作方向	正索引	負索引
行方向（垂直）	`dim=0`	`dim=-2`
列方向（水平）	`dim=1`	`dim=-1`

??代碼驗證??：

m = torch.tensor([[1, 2], [3, 4]])
m.sum(dim=0)    # 沿行求和 → tensor([4, 6])
m.sum(dim=-1)   # 沿列求和 → tensor([3, 7])[6](@ref)

索引范圍擴展為0到ndim-1或-ndim到-1：

cube = torch.arange(24).reshape(2, 3, 4)
cube.sum(dim=1)     # 沿第二個維度壓縮
cube.sum(dim=-2)    # 同上[3,6](@ref)

sum(),?mean(),?max()等函數通過dim指定壓縮方向：

# 三維張量沿不同軸求和
cube.sum(dim=0)  # 形狀變為(3,4)
cube.sum(dim=1)  # 形狀變為(2,4)[6](@ref)

??保持維度??：使用keepdim=True避免降維（適用于廣播場景）

cube.sum(dim=1, keepdim=True)  # 形狀(2,1,4)

??拼接（torch.cat）??：dim指定拼接方向

x = torch.tensor([[1, 2], [3, 4]])
y = torch.tensor([[5, 6]])
torch.cat((x, y), dim=0)  # 行方向拼接（新增行）[7](@ref)

??切分（torch.split）??：dim指定切分軸向

x = torch.arange(10).reshape(5, 2)
x.split([2, 3], dim=0)  # 分割為2行和3行兩部分[7](@ref)

??torch.index_select??：按索引選取數據

t = torch.tensor([[1, 2], [3, 4], [5, 6]])
indices = torch.tensor([0, 2])
t.index_select(dim=0, index=indices)  # 選取第0行和第2行[3,7](@ref)

??torch.gather??：根據索引矩陣收集數據

# 沿dim=1收集指定索引值
torch.gather(t, dim=1, index=torch.tensor([[0], [1]]))[5,7](@ref)

??圖像處理??：轉換通道順序（NHWC → NCHW）

images = images.permute(0, 3, 1, 2)  # dim重排[6,8](@ref)

??注意力機制??：沿特征維度計算Softmax

attention_scores = torch.softmax(scores, dim=-1)  # 最內層維度[6](@ref)

??損失函數??：交叉熵沿類別維度計算

loss = F.cross_entropy(output, target, dim=1)  # 類別所在維度[6](@ref)

??維度不匹配??

x = torch.rand(3, 4)
y = torch.rand(3, 5)
torch.cat([x, y], dim=1)  # 正確（列數相同）
torch.cat([x, y], dim=0)  # 報錯（行數不同）[6](@ref)

💡 ??高效實踐口訣??：

??看形狀??：x.shape確定總維數ndim
??定方向??：根據操作目標選擇dim（正負索引等效）
??驗維度??：操作后維度數減1（除非keepdim=True）

本文來自互聯網用戶投稿，該文觀點僅代表作者本人，不代表本站立場。本站僅提供信息存儲空間服務，不擁有所有權，不承擔相關法律責任。
如若轉載，請注明出處：http://www.pswp.cn/web/83773.shtml
繁體地址，請注明出處：http://hk.pswp.cn/web/83773.shtml
英文地址，請注明出處：http://en.pswp.cn/web/83773.shtml

如若內容造成侵權/違法違規/事實不符，請聯系多彩編程網進行投訴反饋email:809451989@qq.com，一經查實，立即刪除！