Python訓練營打卡——DAY33（2025.5.22）

簡單的神經網絡

一、PyTorch的安裝

二、準備工作

三、數據的準備

四、模型架構定義

五、模型訓練（CPU版本）

1. 定義損失函數和優化器

2. 開始循環訓練

3. 可視化結果

六、通俗解釋

1. 環境安裝（相當于買鍋碗瓢盆）??

2. 數據準備（洗菜切菜）??

3. 模型定義（設計菜譜）??

??4. 訓練過程（炒菜實操）??

??5. 評估與可視化（考試和總結）??

6. ??通俗總結??

7. 類比問答??

簡單的神經網絡

默認大家已經有一定的神經網絡基礎，該部分已經在復試班的深度學習部分介紹完畢，如果沒有，你需要自行了解下MLP的概念。

你需要知道

梯度下降的思想
激活函數的作用
損失函數的作用
優化器
神經網絡的概念

神經網絡由于內部比較靈活，所以封裝的比較淺，可以對模型做非常多的改進，而不像機器學習三行代碼固定。

一、PyTorch的安裝

我們后續完成深度學習項目中，主要使用的包為pytorch，所以需要安裝，你需要去配置一個新的環境。

未來在復現具體項目時候，新環境命名最好是python版本_pytorch版本_cuda版本，例如 py3.10_pytorch2.0_cuda12.2 ,因為復雜項目對運行環境有要求，所以需要安裝對應版本的包。

我們目前主要不用這么嚴格，先創建一個命名為DL的新環境即可,也可以沿用之前的環境

conda create -n DL python=3.8
conda env list 
conda activate DL
conda install jupyter （如果conda無法安裝jupyter就參考環境配置文檔的pip安裝方法）
pip insatll scikit-learn
然后對著下列教程安裝pytorch

深度學習主要是簡單的并行計算，所以gpu優勢更大，簡單的計算cpu發揮不出來他的價值，我們之前說過顯卡和cpu的區別：

cpu是1個博士生，能夠完成復雜的計算，串行能力強。
gpu是100個小學生，能夠完成簡單的計算，人多計算的快。

這里的gpu指的是英偉達的顯卡，它支持cuda可以提高并行計算的能力。

如果你是amd的顯卡、蘋果的電腦，那樣就不需要安裝cuda了，直接安裝pytorch-gpu版本即可。cuda只支持nvidia的顯卡。

安裝教程

或者去b站隨便搜個pytorch安裝視頻。

怕麻煩直接安裝cpu版本的pytorch，跑通了用云服務器版本的pytorch-gpu
gpu的pytorch還需要額外安裝cuda cudnn組件

二、準備工作

可以在你電腦的cmd中輸入nvidia-smi來查看下顯卡信息

其中最重要的2個信息，分別是：

顯卡目前驅動下最高支持的cuda版本，12.7
顯存大小，12288 MiB ÷ 1024 = 12

PS:之所以輸入這個命令，可以彈出這些信息，是因為為系統正確安裝了 NVIDIA 顯卡驅動程序，并且相關路徑被添加到了環境變量中。如果你不是英偉達的顯卡，自然無法使用這個命令。

import torch
torch.cuda

<module 'torch.cuda' from 'd:\\Anaconda\\envs\\yolov5\\lib\\site-packages\\torch\\cuda\\__init__.py'>

import torch# 檢查CUDA是否可用
if torch.cuda.is_available():print("CUDA可用！")# 獲取可用的CUDA設備數量device_count = torch.cuda.device_count()print(f"可用的CUDA設備數量: {device_count}")# 獲取當前使用的CUDA設備索引current_device = torch.cuda.current_device()print(f"當前使用的CUDA設備索引: {current_device}")# 獲取當前CUDA設備的名稱device_name = torch.cuda.get_device_name(current_device)print(f"當前CUDA設備的名稱: {device_name}")# 獲取CUDA版本cuda_version = torch.version.cudaprint(f"CUDA版本: {cuda_version}")
else:print("CUDA不可用。")

CUDA可用！
可用的CUDA設備數量: 1
當前使用的CUDA設備索引: 0
當前CUDA設備的名稱: NVIDIA GeForce RTX 3080 Ti
CUDA版本: 11.1

這里的cuda版本是實際安裝的cuda驅動的版本，需要小于顯卡所支持的最高版本

上述這段代碼，可以以后不斷復用，檢查是否有pytorch及cuda相關信息，我們今天先用cpu訓練，不必在意，有沒有cuda不影響。

三、數據的準備

預處理補充：

注意事項：

（1）分類任務中，若標簽是整數（如 0/1/2 類別），需轉為long類型（對應 PyTorch 的torch.long），否則交叉熵損失函數會報錯。

（2）回歸任務中，標簽需轉為float類型（如torch.float32）。

# 仍然用4特征，3分類的鳶尾花數據集作為我們今天的數據集
from sklearn.datasets import load_iris
from sklearn.model_selection import train_test_split
import numpy as np# 加載鳶尾花數據集
iris = load_iris()
X = iris.data  # 特征數據
y = iris.target  # 標簽數據
# 劃分訓練集和測試集
X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.2, random_state=42)# 打印下尺寸
print(X_train.shape)
print(y_train.shape)
print(X_test.shape)
print(y_test.shape)

(120, 4)
(120,)
(30, 4)
(30,)

# 歸一化數據，神經網絡對于輸入數據的尺寸敏感，歸一化是最常見的處理方式
from sklearn.preprocessing import MinMaxScaler
scaler = MinMaxScaler()
X_train = scaler.fit_transform(X_train)
X_test = scaler.transform(X_test) #確保訓練集和測試集是相同的縮放

# 將數據轉換為 PyTorch 張量，因為 PyTorch 使用張量進行訓練
# y_train和y_test是整數，所以需要轉化為long類型，如果是float32，會輸出1.0 0.0
X_train = torch.FloatTensor(X_train)
y_train = torch.LongTensor(y_train)
X_test = torch.FloatTensor(X_test)
y_test = torch.LongTensor(y_test)

四、模型架構定義

定義一個簡單的全連接神經網絡模型，包含一個輸入層、一個隱藏層和一個輸出層。

定義層數+定義前向傳播順序

import torch
import torch.nn as nn
import torch.optim as optim

class MLP(nn.Module): # 定義一個多層感知機（MLP）模型，繼承父類nn.Moduledef __init__(self): # 初始化函數super(MLP, self).__init__() # 調用父類的初始化函數# 前三行是八股文，后面的是自定義的self.fc1 = nn.Linear(4, 10)  # 輸入層到隱藏層self.relu = nn.ReLU()self.fc2 = nn.Linear(10, 3)  # 隱藏層到輸出層
# 輸出層不需要激活函數，因為后面會用到交叉熵函數cross_entropy，交叉熵函數內部有softmax函數，會把輸出轉化為概率def forward(self, x):out = self.fc1(x)out = self.relu(out)out = self.fc2(out)return out# 實例化模型
model = MLP()

其實模型層的寫法有很多，relu也可以不寫，在后面前向傳播的時候計算下即可，因為relu其實不算一個層，只是個計算而已。

    # def forward(self,x): #前向傳播#     x=torch.relu(self.fc1(x)) #激活函數#     x=self.fc2(x) #輸出層不需要激活函數，因為后面會用到交叉熵函數cross_entropy#     return x