小白的進階之路系列之十五----人工智能從初步到精通pytorch綜合運用的講解第八部分

torch.nn 究竟是什么?

PyTorch 提供了設計精良的模塊和類,如 torch.nn、torch.optim、Dataset 和 DataLoader,幫助你創建和訓練神經網絡。為了充分利用它們的能力并根據你的問題進行定制,你需要真正理解它們到底在做什么。為了幫助你理解這一點,我們將首先在不使用這些模塊的任何功能的情況下,在 MNIST 數據集上訓練一個基本的神經網絡;我們最初只使用最基本的 PyTorch 張量功能。然后,我們將每次增量添加 torch.nntorch.optimDatasetDataLoader 中的一個功能,準確展示每個部分的作用,以及它是如何使代碼更簡潔或更靈活的。

本教程假設你已安裝 PyTorch,并熟悉張量操作的基礎知識。(如果你熟悉 Numpy 數組操作,你會發現此處使用的 PyTorch 張量操作幾乎相同)。

MNIST 數據設置

我們將使用經典的 MNIST 數據集,該數據集包含手寫數字(0 到 9)的黑白圖像。

我們將使用 pathlib 來處理路徑(它是 Python 3 標準庫的一部分),并將使用 requests 下載數據集。我們只在使用時導入模塊,這樣你就可以清楚地看到每一步使用了什么。

from pathlib import Path
import requestsDATA_PATH = Path("data")
PATH = DATA_PATH / "mnist"PATH.mkdir(parents=True, exist_ok=True)URL = "https://github.com/pytorch/tutorials/raw/main/_static/"
FILENAME = "mnist.pkl.gz"if not (PATH / FILENAME).exists():content = requests.get(URL + FILENAME).content(PATH / FILENAME).open("wb").write(content)

該數據集采用 numpy 數組格式,并使用 pickle(一種 Python 特有的數據序列化格式)存儲。

import pickle
import gzipwith gzip.open((PATH / FILENAME).as_posix(), "rb") as f:((x_train, y_train), (x_valid, y_valid), _) = pickle.load(f, encoding="latin-1")

每張圖像是 28 x 28 像素,并以長度為 784 (=28x28) 的扁平行存儲。讓我們看一張;我們需要先將其重塑為 2D 形式。

from matplotlib import pyplot
import numpy as nppyplot.imshow(x_train[0].reshape((28, 28)), cmap="gray")
# ``pyplot.show()`` only if not on Colab
try:import google.colab
except ImportError:pyplot.show()
print(x_train.shape)
# plt.show()

輸出為:

(50000, 784)

得到的圖像:

在這里插入圖片描述

PyTorch 使用 torch.tensor 而非 numpy 數組,因此我們需要轉換數據。

import torchx_train, y_train, x_valid, y_valid = map(torch.tensor, (x_train, y_train, x_valid, y_valid)
)
n, c = x_train.shape
print(x_train, y_train)
print(x_train.shape)
print(y_train.min(), y_train.max())

輸出為:

tensor([[0., 0., 0.,  ..., 0., 0., 0.],[0., 0., 0.,  ..., 0., 0., 0.],[0., 0., 0.,  ..., 0., 0., 0.],...,[0., 0., 0.,  ..., 0., 0., 0.],[0., 0., 0.,  ..., 0., 0., 0.],[0., 0., 0.,  ..., 0., 0., 0.]]) tensor([5, 0, 4,  ..., 8, 4, 8])
torch.Size([50000, 784])
tensor(0) tensor(9)

從頭開始構建神經網絡(不使用 torch.nn

我們首先只使用 PyTorch 張量操作創建一個模型。我們假設你已經熟悉神經網絡的基礎知識。(如果你不熟悉,可以在

本文來自互聯網用戶投稿,該文觀點僅代表作者本人,不代表本站立場。本站僅提供信息存儲空間服務,不擁有所有權,不承擔相關法律責任。
如若轉載,請注明出處:http://www.pswp.cn/pingmian/85487.shtml
繁體地址,請注明出處:http://hk.pswp.cn/pingmian/85487.shtml
英文地址,請注明出處:http://en.pswp.cn/pingmian/85487.shtml

如若內容造成侵權/違法違規/事實不符,請聯系多彩編程網進行投訴反饋email:809451989@qq.com,一經查實,立即刪除!

相關文章

JavaScript 數據結構詳解

最近在復習JavaScript的基礎知識,和第一次學確實有了很不一樣的感受,第一次學的比較淺,但是回頭再進行學習的時候,發現有很多遺漏的東西,所以今天想分享一下新學到的知識,后面會一點一點補充更新 JavaScrip…

c++面試題(14)------順時針打印矩陣

操作系統:ubuntu22.04 IDE:Visual Studio Code 編程語言:C11 題目描述 輸入一個矩陣,按照從外向里以順時針的順序依次打印出每一個元素。 例如: 輸入矩陣: [[ 1, 2, 3 ],[ 4, 5, 6 ],[ 7, 8, 9 ] ]輸出&…

《Go語言圣經》defer

《Go語言圣經》defer 核心概念:defer語句的執行時機 defer是Go語言的一個關鍵字,它的作用是:延遲執行一個函數調用,該調用會在包圍它的函數返回前一刻執行。 關鍵點: defer語句會在函數即將返回時執行,…

WEB3 的 WebSocket Provider連接方式

1. 什么是 WebSocket Provider? WebSocket Provider 是 web3.js 中用于通過 WebSocket 協議 與以太坊節點(如 Infura、Geth、Parity)建立持久化連接的通信方式。它允許雙向實時數據傳輸,適用于需要實時監聽區塊鏈事件的場景。 核心特點 雙向通信:客戶端和服務器可以主動…

三國大模型:智能重構下的亂世文明圖譜

引言:當赤壁烽煙遇見深度學習 一件動態的《全本三國演義》正通過全息投影技術演繹群雄逐鹿的史詩。這個虛實交融的場景,恰似三國大模型技術的隱喻——以人工智能為紐帶,連接起漢末三國的烽火狼煙與數字時代的文明重構。作為人工智能與歷史學…

AWS數據庫遷移實戰:本地MySQL零停機上云方案

一、遷移場景 本地環境&#xff1a;自建MySQL 5.7&#xff08;數據量500GB&#xff09;&#xff0c;業務要求遷移停機時間<5分鐘 目標架構&#xff1a; 二、遷移四步法 步驟1&#xff1a;環境準備&#xff08;耗時30分鐘&#xff09; 1.1 創建Aurora MySQL # AWS CLI創…

uni-app 安卓 iOS 離線打包參考

App 離線打包 原生工程配置 安卓&#xff1a;【uniapp】uniapp 離線打包安卓應用或者云打包發布 app 步驟&問題記錄 iOS&#xff1a;uni-app實現XCode蘋果本地離線打包APP

mysql History List Length增長

HLL 持續增長導致問題 History List Length&#xff08;HLL&#xff09;是InnoDB存儲引擎中用于衡量未清理的undo日志記錄數量的指標。當HLL持續增長時&#xff0c;可能對數據庫性能和業務產生以下影響&#xff1a; 事務處理延遲增加 高HLL值意味著大量未清理的undo日志&…

VMware替代 | 南京地鐵采用ZStack ZSphere虛擬化承載核心業務

南京地鐵作為中國主要城市軌道交通系統之一&#xff0c;運營規模龐大&#xff0c;地鐵線路覆蓋全市主要區域。其核心業務系統&#xff08;包括列車調度、信號控制、乘客信息系統等&#xff09;原部署在VMware平臺上。然而&#xff0c;隨著VMware產品全面轉向訂閱制&#xff0c;…

Electron自動更新詳解—包教會版

★ 本人在公司項目中實現的Electron更新功能。 ★ 將實現更新過程的每一步都總結了出來&#xff0c;以及過程中我遇到了哪些問題&#xff0c;如何去解決的問題&#xff0c;有哪些注意事項。 ★ 使用貼合實際應用的HTTP服務器做為載體實現更新&#xff0c;而非github。 開始&…

Apache RocketMQ 消息過濾的實現原理與騰訊云的使用實踐

導語 本文將系統闡述 Apache RocketMQ 消息過濾機制的技術架構與實踐要點。首先從業務應用場景切入&#xff0c;解析消息過濾的核心價值&#xff1b;接著介紹 Apache RocketMQ 支持的兩種消息過濾實現方式&#xff0c;幫助讀者建立基礎認知框架&#xff1b;隨后深入剖析 SQL 語…

安卓JetPack篇——LifeCycle原理

LifeCycle 一、什么是Lifecycle 具備宿主生命周期感知能力的組件。它能持有組件&#xff08;如Activity或Fragment&#xff09;生命周期狀態的信息&#xff0c;并且允許其他觀察者監聽宿主的狀態。 二、基本原理 1、安卓10以下版本 隱形的Fragment注入在LifecycleOwner&am…

CSS 圓角邊框屬性(`border-radius`)筆記

一、作用&#xff1a; 用于設置元素四個角的圓角效果&#xff0c;讓元素不再死板&#xff0c;更加柔和。 二、基本語法&#xff1a; border-radius: 圓角大小; 單位&#xff1a;px&#xff08;像素&#xff09;或 %&#xff08;百分比&#xff09; 示例&#xff1a; div { ?…

python自助棋牌室管理系統

目錄 技術棧介紹具體實現截圖系統設計研究方法&#xff1a;設計步驟設計流程核心代碼部分展示研究方法詳細視頻演示試驗方案論文大綱源碼獲取/詳細視頻演示 技術棧介紹 Django-SpringBoot-php-Node.js-flask 本課題的研究方法和研究步驟基本合理&#xff0c;難度適中&#xf…

計算機——硬盤分區和格式化

硬盤驅動器 硬盤驅動器&#xff08;HDD&#xff09;是一種成熟、經濟的大容量存儲解決方案。它的核心優勢在于每GB成本低和超大容量。然而&#xff0c;其機械結構帶來的速度瓶頸、噪音、功耗和對物理沖擊的敏感性是其主要的缺點。隨著 SSD 價格的持續下降和性能的絕對領先&…

從IEC到UL:技術主權競爭下的斷路器合規性戰略

1 國際標準體系割裂的現狀 在全球低壓電器領域&#xff0c;國際標準體系呈現出日益明顯的割裂態勢。當前主要存在四大標準體系&#xff1a;國際通用的??IEC標準體系??、歐洲采用的??EN標準體系??、北美實施的??UL與CSA標準體系??&#xff0c;以及具有地域特色的?…

第十六屆藍橋杯_省賽B組(D).產值調整

題目如下 這道題看似很簡單&#xff0c;其實還是得觀察一下&#xff0c;要不然就會… 話不多說回到題目&#xff0c;這個題的坑就在于當A,B,C三個產值相同的時候&#xff0c;再怎么變還是之前的產值&#xff0c;或者也可以通過另外一種方法理解&#xff1a; 通過一個案例來舉…

設計模式 | 單例模式——餓漢模式 懶漢模式

單例模式 文章目錄 單例模式一、餓漢模式&#xff08;Eager Initialization&#xff09;1. 定義2. 特點3. 餓漢單例模式&#xff08;定義時-類外初始化&#xff09;4. 實現細節 二、懶漢模式&#xff08;Lazy Initialization&#xff09;1. 定義2. 特點3. 懶漢單例模式&#xf…

dify本地部署及添加ollama模型(ubuntu24.04)

說明&#xff1a;ubuntu是虛擬機的&#xff0c;用的橋接模式&#xff0c;與本地同局域網不同ip地址。 參考VM虛擬機網絡配置&#xff08;ubuntu24橋接模式&#xff09;&#xff1a;配置靜態IP前提&#xff1a;需要有docker及docker-compose環境 參考ubuntu24安裝docker及docker…

Python爬蟲實戰:研究multiprocessing相關技術

一、引言 1.1 研究背景與意義 隨著互聯網信息的爆炸式增長,網絡爬蟲已成為獲取海量數據的重要工具。傳統的單線程爬蟲在面對大規模數據采集任務時效率低下,無法充分利用現代計算機多核 CPU 的優勢。多線程爬蟲雖然在一定程度上提高了效率,但受限于 Python 的全局解釋器鎖(…