【PyTorch實戰：Tensor變形】5、 PyTorch Tensor指南：從基礎操作到Autograd與GPU加速實戰

在這里插入圖片描述

一、Tensor核心概念解析

1.1 什么是Tensor？

Tensor是PyTorch中最基本的數據結構，也是深度學習框架的核心計算單元。我們可以將Tensor理解為多維數組的統一表示，它在PyTorch中的地位相當于NumPy中的ndarray，但具有兩個關鍵增強特性：GPU加速支持和自動求導能力。
在這里插入圖片描述

1.2 為什么需要Tensor？

PyTorch重新設計Tensor而不是直接使用NumPy數組，主要基于兩個深度學習的關鍵需求：

GPU加速：深度學習涉及大量并行計算，GPU擁有數千個核心，非常適合處理Tensor這樣的海量數據。Tensor可以輕松在CPU和GPU之間切換，實現計算加速。
自動求導：神經網絡訓練的核心是計算梯度。Tensor的requires_grad屬性可以標記需要計算梯度的參數，PyTorch的Autograd引擎會自動追蹤所有相關運算并計算梯度。

簡單公式表示：PyTorch Tensor = NumPy Array + GPU Support + Autograd

二、Tensor的創建與數據類型

2.1 基本創建方式

PyTorch提供了多種創建Tensor的方法，與NumPy的API設計高度一致：

import torch
import numpy as np# 從Python列表直接創建
x = torch.tensor([1, 2, 3, 4])
print(f"從列表創建的Tensor: {x}")# 使用內置函數創建特殊Tensor
zeros = torch.zeros(2, 3)    # 創建2x3的全0Tensor
ones = torch.ones(2, 3)      # 創建2x3的全1Tensor
rand_tensor = torch.rand(2, 3)  # 創建2x3的Tensor，元素來自[0,1)均勻分布
randn_tensor = torch.randn(2, 3) # 創建2x3的Tensor，元素來自標準正態分布
arange_tensor = torch.arange(0, 10, 2) # 類似range，tensor([0, 2, 4, 6, 8])
eye_tensor = torch.eye(3)    # 創建3x3的單位矩陣# 指定數據類型和設備創建
special_tensor = torch.tensor([1, 2, 3], dtype=torch.float32, device='cuda' if torch.cuda.is_available() else 'cpu')

2.2 Tensor數據類型詳解

PyTorch Tensor支持多種數據類型，每種類型都有特定的使用場景：

數據類型	對應PyTorch類	說明	常見用途
32位浮點	torch.float32	單精度浮點數	深度學習中最常用的類型
64位浮點	torch.float64	雙精度浮點數	高精度數值計算
16位浮點	torch.float16	半精度浮點數	GPU內存緊張時使用
8位無符號整型	torch.uint8	無符號8位整數	圖像處理(0-255像素值)
8位有符號整型	torch.int8	有符號8位整數	量化模型
32位整型	torch.int32	32位整數	一般整數運算
64位整型	torch.int64	64位整數	索引和標簽(常用)
布爾型	torch.bool	布爾類型	掩碼和條件運算

# 數據類型示例
float_tensor = torch.tensor([1.0, 2.0, 3.0], dtype=torch.float32)
int_tensor = torch.tensor([1, 2, 3], dtype=torch.int64)
bool_tensor = torch.tensor([True, False, True], dtype=torch.bool)# 數據類型轉換
original = torch.tensor([1, 2, 3])  # 默認int64
converted = original.float()        # 轉換為float32
print(f"原始類型: {original.dtype}, 轉換后類型: {converted.dtype}")

2.3 特殊Tensor創建方法

除了基本創建方法，PyTorch還提供了多種特殊Tensor的創建函數：

# 創建與現有Tensor相同形狀的Tensor
example = torch.randn(3, 4)
zeros_like = torch.zeros_like(example)  # 與example形狀相同的全0Tensor
ones_like = torch.ones_like(example)    # 與example形狀相同的全1Tensor
rand_like = torch.rand_like(example)    # 與example形狀相同的隨機Tensor# 創建線性空間Tensor
linear_space = torch.linspace(0, 10, 5)  # tensor([0., 2.5, 5., 7.5, 10.])
log_space = torch.logspace(0, 2, 3)      # tensor([1., 10., 100.])# 創建隨機排列
random_perm = torch.randperm(10)         # 0-9的隨機排列# 創建對角Tensor
diagonal = torch.diag(torch.tensor([1, 2, 3]))  # 對角線為1,2,3的矩陣

三、Tensor屬性詳解

3.1 核心屬性

每個Tensor都有多個重要屬性，用于描述其特征和狀態：

# 創建一個示例Tensor
t = torch.randn(2, 3, 4, requires_grad=True)print("形狀:", t.shape)        # torch.Size([2, 3, 4])
print("維度數:", t.dim())       # 3
print("元素總數:", t.numel())   # 24
print("數據類型:", t.dtype)     # torch.float32
print("設備:", t.device)       # cpu 或 cuda:0
print("是否需要梯度:", t.requires_grad)  # True
print("是否連續存儲:", t.is_contiguous())  # True
print("梯度:", t.grad)         # None (尚未計算梯度)

3.2 設備屬性與GPU加速

Tensor的設備屬性決定了它在何處進行計算，這對于深度學習性能至關重要：

# 檢查GPU可用性
cuda_available = torch.cuda.is_available()
print(f"CUDA可用: {cuda_available}")# 設備無關的代碼編寫方式
device = torch.device("cuda" if cuda_available else "cpu")
print(f"使用設備: {device}")# 創建時指定設備
x = torch.tensor([1, 2, 3], device=device)# 在設備間移動Tensor
if cuda_available:cpu_tensor = torch.ones(3)gpu_tensor = cpu_tensor.to('cuda')  # 移動到GPUback_to_cpu = gpu_tensor.cpu()      # 移回CPU# 使用.to()方法同時改變設備和數據類型transformed = cpu_tensor.to('cuda', dtype=torch.float64)

3.3 梯度追蹤與requires_grad

requires_grad是PyTorch Tensor最獨特的屬性之一，它開啟了自動求導功能：

# 創建需要梯度的Tensor（模型參數）
weights = torch.randn(5, 3, requires_grad=True)
bias = torch.zeros(3, requires_grad=True)# 創建不需要梯度的Tensor（輸入數據）
input_data = torch.randn(10, 5, requires_grad=False)# 前向傳播（自動構建計算圖）
output = input_data @ weights + bias  # 矩陣乘法和加法
loss = output.pow<

本文來自互聯網用戶投稿，該文觀點僅代表作者本人，不代表本站立場。本站僅提供信息存儲空間服務，不擁有所有權，不承擔相關法律責任。
如若轉載，請注明出處：http://www.pswp.cn/web/95820.shtml
繁體地址，請注明出處：http://hk.pswp.cn/web/95820.shtml
英文地址，請注明出處：http://en.pswp.cn/web/95820.shtml

如若內容造成侵權/違法違規/事實不符，請聯系多彩編程網進行投訴反饋email:809451989@qq.com，一經查實，立即刪除！