minist數據集分類模型的訓練

minist數據集訓練

訓練方法:利用pytorch來實現minist數據集的分類模型訓練

訓練模型如下圖所示

img

模型代碼:

import torch
from torch import nn
from torch.nn import Flattenclass Net(nn.Module):def __init__(self):super().__init__()self.module = nn.Sequential(nn.Conv2d(1,4,5,1,0),nn.MaxPool2d(2),nn.Conv2d(4,8,5,1,0),nn.MaxPool2d(2),# torch.Size([8, 4, 4])Flatten(),# torch.Size([64, 128])nn.Linear(8*16,16),# torch.Size([64, 16])nn.Linear(16, 10) #torch.Size([64, 10]))def forward(self, x):x = self.module(x)return xif '__name__' == '__mian__':net = Net()input = torch.ones((64,1, 28, 28))output = net(input)print(output.shape)

現在開始編寫代碼訓練模型

基本思路:

  1. 讀取數據集并整理
  2. 將數據集放入模型中訓練,每次記錄訓練的損失loss以及準確率

實測訓練大概10輪后,正確率能達到98%以上

import torch.optim
import  torchvision
from torch.utils.data import DataLoader
from torch.utils.tensorboard import  SummaryWriter
from module import *
dataset_transform = torchvision.transforms.Compose([torchvision.transforms.ToTensor()])train_set = torchvision.datasets.MNIST(root='../dataset_MNIST',train=True,transform=dataset_transform,download=True)
test_set = torchvision.datasets.MNIST(root='../dataset_MNIST',train=False,transform=dataset_transform,download=True)print('訓練數據集size{}'.format(len(train_set)))
print('測試數據集size{}'.format(len(test_set)))train_loader = DataLoader(dataset=train_set, batch_size=64)
test_loader = DataLoader(dataset=test_set,batch_size=64)# for data in train_loader:
#     imgs,target = data
#     print('imgs',imgs.shape) # torch.Size([64, 1, 28, 28])
#     print('target',target)
#     breakwriter = SummaryWriter('../p10')
cuda_available = torch.cuda.is_available()net = Net()
if cuda_available:net = net.cuda()# 定義損失函數
loss_fn = nn.CrossEntropyLoss()
if cuda_available:loss_fn = loss_fn.cuda()# 優化器
learning_rate = 0.01
optimizer = torch.optim.SGD(net.parameters(), lr=learning_rate)# 設置訓練參數
# 訓練次數
total_train_step = 0
total_test_step = 0
# 訓練輪數
epoch = 10for i in range(10):print('------------第{}輪訓練開始------------'.format(i))net.train()for data in train_loader:imgs,targets = dataif cuda_available:imgs = imgs.cuda()targets = targets.cuda()outputs = net(imgs)loss = loss_fn(outputs,targets)#優化器優化模型optimizer.zero_grad()loss.backward()optimizer.step()total_train_step += 1if total_train_step % 100 == 0:print('訓練次數:{} loss:{}'.format(total_train_step, loss.item()))# 開始測試net.eval()total_test_loss = 0total_accuracy = 0with torch.no_grad():for data in test_loader:imgs,targets = dataif cuda_available:imgs = imgs.cuda()targets = targets.cuda()outputs = net(imgs)loss = loss_fn(outputs, targets)total_test_loss += loss.item()accuracy = (outputs.argmax(1) == targets).sum()total_accuracy += accuracyprint("整體測試集的Loss:{}".format(total_test_loss))writer.add_scalar("test_loss", total_test_loss, total_test_step)total_test_step += 1print("整體測試集的正確率:{}".format(total_accuracy / len(test_set)))if i == 9:torch.save(net, "train_model_{}.pth".format(i))print('模型已保存')writer.close()

上面已經將最后一次訓練的的模型保存了,那么現在就可以用一個圖片來測試一下這個模型

from module import *
import torchvision.transforms
from PIL import  Image
dataset_transform = torchvision.transforms.Compose([torchvision.transforms.ToTensor()])
test_set = torchvision.datasets.MNIST('../dataset_MNIST',train=False,transform=dataset_transform,download=False)model = torch.load("train_model_9.pth")
model.eval()
for i in range(10):img, target = test_set[i]print('--------------第{}張圖片--------------'.format(i))print("圖片尺寸",img.shape)print("標簽",target)img = torch.reshape(img,(1,1,28,28))img = img.cuda()with torch.no_grad():output = model(img)print(output)print(output.argmax(1))

這里要注意的一點是,因為訓練模型時使用了nvida的cuda驅動,那么在使用模型的時候,也需要將圖片進行一點修改,具體是

 img = img.cuda()

測試結果如下:

--------------第0張圖片--------------
圖片尺寸 torch.Size([1, 28, 28])
標簽 7
tensor([[  0.1551,  -2.2232,   5.1375,   3.1896,  -9.0812,  -3.7413, -16.3016,16.5437,  -2.3190,   2.7608]], device='cuda:0')
tensor([7], device='cuda:0')
--------------第1張圖片--------------
圖片尺寸 torch.Size([1, 28, 28])
標簽 2
tensor([[  8.5477,   6.7017,  15.3023,   6.9958, -12.9011,  -3.1987,   2.8130,-12.9218,   4.8305, -17.2936]], device='cuda:0')
tensor([2], device='cuda:0')
--------------第2張圖片--------------
圖片尺寸 torch.Size([1, 28, 28])
標簽 1
tensor([[-1.4329,  9.1416,  0.7603, -2.0579,  1.7856, -3.9744,  0.1253,  2.0046,-0.6214, -2.1419]], device='cuda:0')
tensor([1], device='cuda:0')
--------------第3張圖片--------------
圖片尺寸 torch.Size([1, 28, 28])
標簽 0
tensor([[13.5426, -6.6119,  1.1040, -5.3236, -6.8938,  2.2850,  3.4611, -2.5504,-0.0393, -0.4295]], device='cuda:0')
tensor([0], device='cuda:0')
--------------第4張圖片--------------
圖片尺寸 torch.Size([1, 28, 28])
標簽 4
tensor([[-2.2200, -3.2653, -3.9221, -7.7044, 12.9432, -5.3840, -0.3826,  1.3231,-2.7672,  6.4946]], device='cuda:0')
tensor([4], device='cuda:0')
--------------第5張圖片--------------
圖片尺寸 torch.Size([1, 28, 28])
標簽 1
tensor([[-2.1054, 10.7492, -0.0951, -2.4075,  3.1492, -5.6566, -1.9704,  4.0755,-0.5151, -0.8886]], device='cuda:0')
tensor([1], device='cuda:0')
--------------第6張圖片--------------
圖片尺寸 torch.Size([1, 28, 28])
標簽 4
tensor([[-7.6890,  0.1027, -5.0862, -4.9066, 10.8449, -1.0489, -2.3638,  2.8111,4.3393,  3.6312]], device='cuda:0')
tensor([4], device='cuda:0')
--------------第7張圖片--------------
圖片尺寸 torch.Size([1, 28, 28])
標簽 9
tensor([[-7.3084, -1.4986, -1.5550,  2.7101,  2.4086,  2.5202, -7.5940,  0.3350,2.0277,  7.9211]], device='cuda:0')
tensor([9], device='cuda:0')
--------------第8張圖片--------------
圖片尺寸 torch.Size([1, 28, 28])
標簽 5
tensor([[ -0.5667, -15.0522,  -2.6193,  -2.5653,  -1.2110,  13.1138,   5.9642,-7.2953,   4.0217,   1.9577]], device='cuda:0')
tensor([5], device='cuda:0')
--------------第9張圖片--------------
圖片尺寸 torch.Size([1, 28, 28])
標簽 9
tensor([[-2.5326, -8.8390, -2.7222, -2.3805,  2.1510, -1.2283, -7.7543,  5.7798,5.2312, 11.3871]], device='cuda:0')
tensor([9], device='cuda:0')Process finished with exit code 0
s

說明準確率都還挺高的,這么模型訓練的還可以


好了,這就是minist數據集訓練了

寫完這個就算是入門了

b站上有一個pytorch很好的入門視頻

土堆pytorch入門

講的很不錯的,學完就能入門了

本文來自互聯網用戶投稿,該文觀點僅代表作者本人,不代表本站立場。本站僅提供信息存儲空間服務,不擁有所有權,不承擔相關法律責任。
如若轉載,請注明出處:http://www.pswp.cn/web/41248.shtml
繁體地址,請注明出處:http://hk.pswp.cn/web/41248.shtml
英文地址,請注明出處:http://en.pswp.cn/web/41248.shtml

如若內容造成侵權/違法違規/事實不符,請聯系多彩編程網進行投訴反饋email:809451989@qq.com,一經查實,立即刪除!

相關文章

ChatGPT對話:Scratch編程中一個單詞,如balloon,每個字母行為一致,如何優化編程

【編者按】balloon 7個字母具有相同的行為,根據ChatGPT提供的方法,優化了代碼,方便代碼維護與復用。初學者可以使用7個字母精靈,復制代碼到不同精靈,也能完成這個功能,但不是優化方法,也沒有提高…

__builtin_constant_p 常量檢查函數

__builtin_constant_p 詳細介紹 功能:__builtin_constant_p 是 GCC (GNU Compiler Collection) 提供的一個內置函數,用于在編譯時檢測一個表達式是否是常量。它返回一個整型值: 如果表達式 exp 是編譯時常量,則返回 1。否則&…

【sklearn模型訓練全指南】深入理解機器學習模型的構建過程

標題:【sklearn模型訓練全指南】深入理解機器學習模型的構建過程 在機器學習中,模型訓練是一個核心過程,它涉及到從數據中學習并獲得預測能力。scikit-learn(簡稱sklearn)作為Python中一個廣泛使用的機器學習庫&#…

FairJob:促進在線廣告系統公平性研究

在人工智能(AI)與人類動態的交匯處,既存在機遇也存在挑戰,特別是在人工智能領域。盡管取得了進步,但根植于歷史不平等中的持續偏見仍然滲透在我們的數據驅動系統中,這些偏見不僅延續了不公平現象&#xff0…

Centos新手問題——yum無法下載軟件

起因:最近在學習centos7,在VM上成功安裝后,用Secure進行遠程登陸。然后準備下載一個C編譯器,看網絡上的教程,都是用yum來下載,于是我也輸入了命令: yum -y install gcc* 本以為會自動下載&…

使用Python繪制雷達圖

使用Python繪制雷達圖 雷達圖效果代碼 雷達圖 雷達圖,也稱為蛛網圖或星型圖,是一種二維圖表,用于顯示多變量數據。每個變量在一個從中心點向外輻射的軸上表示,軸的數量與變量的數量相同。雷達圖通常用于比較多個樣本的多維數據&a…

docker部署redis/mongodb/

一、redis 創建/root/redis/conf/redis.conf 全部執行命令如下 docker run -it -d --name redis -p 6379:6379 --net mynet --ip 172.18.0.9 -m 400m -v /root/redis/conf:/usr/local/etc/redis -e TXAsia/Shangehai redis redis-server /usr/local/etc/redis/redis.conf 部署…

C#——密封類詳情

密封類 密封類是密封方法的擴展,用于確保某個類不會被繼承。在C#中,你可以使用sealed關鍵字來聲明一個密封類。 public sealed class SealedClass {// 類成員定義 } 如果使用密封類繼承的話,程序會報錯!!&#xff0…

01:spring

文章目錄 一:常見面試題1:什么是Spring框架?1.1:spring官網中文1.2:spring官網英文 2:談談自己對于Spring IOC和AOP的理解2.1:IOCSpring Bean 的生命周期主要包括以下步驟: 2.2&…

Centos7開放端口

在CentOS 7中,開放端口的命令主要通過firewall-cmd工具來執行。以下是詳細的步驟和命令說明: 一、使用firewall-cmd開放端口 查看當前的防火墻區域(zone) 執行命令: firewall-cmd --get-active-zones此命令將顯示當前…

代碼的壞味道——長函數

前言:一個函數應該盡量做一件事情,如果非要做多個事情,要做函數提取,每次迭代應該考慮到是否有重復代碼或者可以優化的代碼。 長函數:長函數的產生: 邏輯是平鋪直敘的需求迭代沒有考慮優化,一次…

解決微信讀書和Apple Books導入epub電子書不顯示圖片的問題

title: 解決微信讀書和Apple Books導入epub電子書不顯示圖片的問題 tags: 個人成長 categories:雜談 最近找到一本很喜歡的書的電子版的epub版,發現無論是導入微信讀書,還是Apple家的Books, 都無法正常顯示圖片。 于是我用calibre打開epub電子書&#x…

安卓虛擬位置修改

隨著安卓系統的不斷更新,確保軟件和應用與最新系統版本的兼容性變得日益重要。本文檔旨在指導用戶如何在安卓14/15系統上使用特定的功能。 2. 系統兼容性更新 2.1 支持安卓14/15:更新了對安卓14/15版本的支持,確保了軟件的兼容性。 2.2 路…

linux中可執行文件為什么不能拷貝覆蓋

對于一個普通的文件,假如有兩個文件,分別是file和file1,我們使用 cp file1 file的方式使用file1的內容來覆蓋file的內容,這樣是可以的。 但是對于可執行文件來說,當這個文件在執行的時候,是不能通過cp的方…

將 KNX 接入 Home Assistant 之四 功能測試

一:測試標準的KNX網關功能 測試軟件識別是否正常 可以看到再ETS6和ETS5上都能正常識別 測試數據收發 可以正常發送數據 測試配置設備參數(下載配置) 可以看出,在ETS5上是可以正常下載參數的 但是 ETS6下載是失敗的&#xff…

k8s-第十一節-Job和CronJob

Job Kubernetes jobs主要是針對短時和批量的工作負載。它是為了結束而運行的,而不是像deployment、replicasets、replication controllers和DaemonSets等其他對象那樣持續運行。 Kubernetes Jobs會一直運行到Job中指定的任務完成。也就是說,如果pods給…

Pandas 學習筆記(四)--CSV文件

CSV文件 CSV(Comma-Separated Values,逗號分隔值,有時也稱為字符分隔值,因為分隔字符也可以不是逗號),其文件以純文本形式存儲表格數據(數字和文本)。 讀取與寫入 讀取csv文件 i…

可視化作品集(08):能源電力領域

能源電力領域的可視化大屏,有著巨大的用武之地,不要小看它。 監控能源生產和消耗情況: 通過可視化大屏,可以實時監控能源生產和消耗情況,包括發電量、能源供應情況、能源消耗情況等,幫助管理者及時了解能…

C語言 | Leetcode C語言題解之第218題天際線問題

題目: 題解: struct pair {int first, second; };struct Heap {struct pair* heap;int heapSize;bool (*cmp)(struct pair*, struct pair*); };void init(struct Heap* obj, int n, bool (*cmp)(struct pair*, struct pair*)) {obj->heap malloc(si…

調制信號識別系列 (一):基準模型

調制信號識別系列 (一):基準模型 說明:本文包含對CNN和CNNLSTM基準模型的復現,模型架構參考下述兩篇文章 文章目錄 調制信號識別系列 (一):基準模型一、論文1、DL-PR: Generalized automatic modulation classification method b…