MNIST 數據集mnist.npz詳解

MNIST 數據集是機器學習領域最著名的數據集之一,全稱為"Modified National Institute of Standards and Technology"數據庫。它包含了大量手寫數字的圖像,是入門機器學習和深度學習的經典數據集。
在這里插入圖片描述

1. MNIST 數據集概述

60,000 張訓練圖像
10,000 張測試圖像
每張圖像是 28×28 像素的灰度圖像
每個圖像對應一個 0-9 的數字標簽

2. .npz 格式

mnist.npz 文件是 MNIST 數據集的一種常見存儲格式,它將四個 NumPy 數組打包在一個文件中:
x_train: 訓練圖像,形狀為 (60000, 28, 28)
y_train: 訓練標簽,形狀為 (60000,)
x_test: 測試圖像,形狀為 (10000, 28, 28)
y_test: 測試標簽,形狀為 (10000,)
在這里插入圖片描述

3. 如何獲取 MNIST 數據集

3.1. 使用 Keras/TensorFlow 內置函數

新建get_mnist.py

import numpy as np
from tensorflow.keras.datasets import mnist# 加載 MNIST 數據集
(x_train, y_train), (x_test, y_test) = mnist.load_data()# 保存為 .npz 文件# np.savez('mnist.npz', x_train=x_train, y_train=y_train, x_test=x_test, y_test=y_test)
np.savez_compressed('mnist.npz', x_train=x_train, y_train=y_train, x_test=x_test, y_test=y_test)
print("MNIST 數據集已保存為 mnist.npz 文件")
3.2 從官方網站下載

MNIST 數據集可以從官方網站在線獲取:
http://yann.lecun.com/exdb/mnist/
官方網站提供了四個文件:
train-images-idx3-ubyte.gz: 訓練集圖像
train-labels-idx1-ubyte.gz: 訓練集標簽
t10k-images-idx3-ubyte.gz: 測試集圖像
t10k-labels-idx1-ubyte.gz: 測試集標簽

本文來自互聯網用戶投稿,該文觀點僅代表作者本人,不代表本站立場。本站僅提供信息存儲空間服務,不擁有所有權,不承擔相關法律責任。
如若轉載,請注明出處:http://www.pswp.cn/news/920041.shtml
繁體地址,請注明出處:http://hk.pswp.cn/news/920041.shtml
英文地址,請注明出處:http://en.pswp.cn/news/920041.shtml

如若內容造成侵權/違法違規/事實不符,請聯系多彩編程網進行投訴反饋email:809451989@qq.com,一經查實,立即刪除!

相關文章

深入理解HTTPS:從概念到實戰優化

深入理解HTTPS:從概念到實戰優化一:概述二:工作流程三:創建自簽名證書四:案例1)案例一:HTTPS 搭建2)案例二:HTTP/2 搭建3)案例三:HTTP 重定向 HTT…

MySQL數據備份與恢復全攻略

一、數據備份與恢復按照備份方式分類:物理備份,直接復制數據庫的物理文件,可以直接拷貝和恢復;邏輯備份,通過SQL語句導出數據庫結構和數據,可用于不同版本和不同類型的MySQL數據庫之間的數據遷移。按照數據…

單機多卡間大張量傳輸迷惑行為?

老鐵們我最近真的好慘😭,一個大模型在單機多卡上運行就是出錯,debug看的老眼昏花,最后發現大張量在設備間直接傳輸會有很發癲的行為,還請大家幫我看看🙇?摒棄屎山一樣的代碼,簡單運行下列腳本i…

無法將“pnpm”項識別為 cmdlet、函數、腳本文件或可運行程序的名稱。請檢查名稱的拼寫,如果包括路徑,請確保路徑正確,然后再試一次。

1 問題描述今天使用pnpm安裝如下報錯:pnpm : 無法將“pnpm”項識別為 cmdlet、函數、腳本文件或可運行程序的名稱。請檢查名稱的拼寫,如果包括路徑,請確保路徑正確,然后再試一次。 所在位置 行:1 字符: 1pnpm install~~~~ Categor…

內核編譯 day61

二:內核啟動 一:流程 sudo vim /etc/network/interfaces sudo chmod 0666 /etc/default/tft...... //修改可讀uboot命令: help/? : 幫助手冊,列出uboot支持的所有命令 printenv/print 打印環境變量 sete…

【YOLOv5部署至RK3588】模型訓練→轉換RKNN→開發板部署

已在GitHub開源與本博客同步的YOLOv5_RK3588_object_detect項目,地址:https://github.com/A7bert777/YOLOv5_RK3588_object_detect/tree/main 詳細使用教程,可參考README.md或參考本博客第六章 模型部署 文章目錄一、項目回顧二、模型選擇介紹…

Telematics Control Unit(TCU)的系統化梳理

1、Telematics Control Unit (TCU)概述 TCU中文名為遠程信息處理控制單元,很多場合都稱為Telematics Box,又叫TBox,顧名思義,一般都為一個獨立的盒子(如圖2、圖3所示),負責和云端的遠程信息交互…

Appium學習筆記

adb構成client端,在電腦上,負責發送adb命令daemon守護進程,在手機上,負責接收和執行adb命令server端,在電腦上,負責管理client和daemon之間的通信![[Pasted image 20250825201322.png]]包名,對應…

棧指針(Stack Pointer)是什么?

棧指針(Stack Pointer)是什么? 首先,用一個簡單易懂的方式解釋棧指針(Stack Pointer)。 核心比喻:摞起來的書 想象有一摞書整齊地堆在桌面上: 這摞書就是“棧”(Stack),它是一種后進先出(LIFO) 的數據結構。你只能從最頂部拿走一本書(“彈出”),或者把一本新…

數據結構:紅黑樹(Red-Black Tree)

目錄 從AVL樹的“煩惱”說起 如何用“顏色”來定義“大致平衡”?—— 紅黑樹的五個規則 五個規則如何保證“大致平衡”? 用 C/C 代碼定義紅黑樹的結構 定義顏色和節點結構 定義樹的結構和哨兵節點 從AVL樹的“煩惱”說起 我們從已經了解的 AVL 樹出…

Ubuntu22.04安裝VMware Tools

文章目錄前言安裝open-mv-tools前言 本教程使用的版本是Ubuntu22.04.5,由于虛擬機上面的重新安裝VMware Tools是灰的,于是自動下載安裝open-mv-tools, 安裝open-mv-tools 打開終端,更新一下 sudo apt update這一步可能需要先…

DBeaver連接SQL Server時添加驅動后仍提示找不到驅動的解決方法

DBeaver連接SQL Server時添加驅動后仍提示找不到驅動的解決方法 在使用DBeaver連接SQL Server時,即使您已手動添加驅動文件,系統仍提示“找不到驅動”,這通常是由驅動配置錯誤、版本不兼容或SQL Server設置問題引起的。以下我將逐步為您提供解…

JVM之【類加載系統】

目錄 前言 類加載過程 類加載 執行過程 加載階段 連接階段 初始化階段 類加載器 BootstrapClassLoader ExtClassLoader AppClassLoader 類加載器之間的關系 雙親委派機制 核心思想 好處 源碼分析 類加載器之間的父子層級關系 雙親委派的體現 前言 上文中提到…

【 限流技術 | 從四大限流算法到Redisson令牌桶實踐 】

引言:為什么需要限流?在現代分布式系統中,服務的穩定性是至關重要的。在遇到突發的請求量激增,惡意的用戶訪問,亦或是請求頻率過高給下游服務帶來較大壓力時,我們常常需要通過緩存、限流、熔斷降級、負載均…

深入解析Java NIO多路復用原理與性能優化實踐指南

深入解析Java NIO多路復用原理與性能優化實踐指南 技術背景與應用場景 在高并發網絡編程中,傳統的阻塞 I/O 模型往往因每個連接都占用一個線程或一個系統調用而導致線程資源浪費、線程切換開銷劇增等問題,難以滿足數萬甚至數十萬并發連接的負載要求。Jav…

目標檢測數據集 第006期-基于yolo標注格式的汽車事故檢測數據集(含免費分享)

目錄 目標檢測數據集 第006期-基于yolo標注格式的汽車事故檢測數據集(含免費分享) 超實用汽車事故檢測數據集分享,助力計算機視覺研究! 1、背景 2、數據詳情 數據集基本信息 結構組成 標注格式與示例 類標簽說明 數據增強情況 3、應用場景 4、…

應用密碼學(書籍學習筆記、基礎知識) 一

本博客為讀《應用密碼學》所得筆記 文章目錄一、 加密與解密1.2 秘鑰Key1.2.1 引入秘鑰K1.2.2 加密秘鑰K1,解密秘鑰K2二、對稱算法 VS 公開密鑰算法**① 對稱算法** - 傳統密碼算法 **(Symmetric Algorithm) 🔑****② 非對稱算法特點** - 公開秘鑰算法 *…

【攻防世界】Web_php_include

1.信息收集題目&#xff1a;Web_php_include &#xff1a;PHP文件包含漏洞2.思路&#xff1a;1.代碼審計&#xff1a;<?php show_source(__FILE__); echo $_GET[hello]; $page$_GET[page]; while (strstr($page, "php://")) { //在一個字符串中查…

cmake--CPack/deb

deb包的需求 怎么使用cmake把項目的依賴想打包為deb包,把項目的可執行文件和依賴文件打包為deb包,又怎么樣配置apt源,讓項目在jenkins構建之后,可以通過sudo apt install 下載deb包和安裝到任意主機上? 整體流程概覽 使用CMake構建項目:確保你的項目可以被CMake正確編譯…

七十五、【Linux數據庫】部署Redis服務 、 部署LNMP+Redis

Redis 與 LNMP 集成功能概述 Redis 核心功能 內存數據存儲:高速讀寫性能 數據結構豐富:字符串、哈希、列表、集合等 持久化支持:RDB快照和AOF日志 發布訂閱:消息隊列功能 高可用:主從復制、哨兵模式、集群 LNMP+Redis 集成價值 會話共享:多Web服務器共享Session 數據緩存…