PyTorch圖像數據轉換為張量（Tensor）并進行歸一化的標準操作

PyTorch圖像數據轉換為張量（Tensor）并進行歸一化的標準操作

diannao/2025/9/6 16:47:25/文章來源:https://blog.csdn.net/2301_79749195/article/details/151230190

transform = ToTensor() 是 PyTorch 中用于將圖像數據轉換為張量（Tensor）并進行歸一化的標準操作，以下是對其功能的逐層解析及關鍵細節：

核心功能總結

功能	描述
類型轉換	將 PIL Image / numpy 數組 → PyTorch Tensor (dtype: `torch.float32`)
數值歸一化	像素值從 `[0, 255]` → `[0.0, 1.0]` (通過 ÷255 實現)
維度重排	(H×W×C)* → (C×H×W)

注：(*) 僅當輸入為 numpy 數組時需滿足此內存布局，PIL Image 無需關注此規則

完整轉換流程詳解

1. 輸入數據來源

支持兩種常見格式：

PIL Image（推薦）：直接讀取的圖片對象
Numpy Array：形狀需為 (H, W, C)（Height × Width × Channels）

2. 執行的操作

graph LR
A[原始圖像] --> B{數據源判斷}
B -->|PIL Image| C[拆分通道 + 轉Float + /255]
B -->|Numpy Array| D[轉置維度 + 轉Float + /255]
C & D --> E[生成 Torch Tensor]

3. 具體變化示例

以灰度圖為例（單通道）：

階段	數據形式	取值范圍	數據類型	備注
原始PIL圖像	PIL Image	`[0, 255]`	uint8	高度×寬度
轉換后Tensor	`torch.Tensor`	`[0.0, 1.0]`	float32	`[Channel, Height, Width]`

彩色圖像（RGB三通道）同理，每個通道獨立歸一化。

關鍵技術點解析

為何要除以255？

物理意義：將8位整型（0~255）映射到浮點型的連續區間[0,1]，符合神經網絡對輸入范圍的要求
數學優勢：避免大數值導致的梯度爆炸，加速收斂
對比實驗：不除以255的訓練損失通常比歸一化的高數十倍

維度重排的必要性

PyTorch設計規范：要求張量采用 (Batch_Size, Channels, Height, Width) 格式

本文來自互聯網用戶投稿，該文觀點僅代表作者本人，不代表本站立場。本站僅提供信息存儲空間服務，不擁有所有權，不承擔相關法律責任。
如若轉載，請注明出處：http://www.pswp.cn/diannao/98075.shtml
繁體地址，請注明出處：http://hk.pswp.cn/diannao/98075.shtml
英文地址，請注明出處：http://en.pswp.cn/diannao/98075.shtml

如若內容造成侵權/違法違規/事實不符，請聯系多彩編程網進行投訴反饋email:809451989@qq.com，一經查實，立即刪除！

相關文章

HarmonyOS學習

HarmonyOS學習

一，DevEoc Studio基本內容學習項目工程目錄entry 默認的項目入口模塊ets 界面相關文件（目前都放入pages文件內即可）resource資源文件，配置文件index.est默認文件’ ‘開頭的一般為裝飾器，修飾功能，來約定后…

閱讀更多...

【大前端】Vue 和 React 主要區別

【大前端】Vue 和 React 主要區別

Vue 與 React 的主要區別在前端開發領域，Vue 和 React 是兩大最受歡迎的框架/庫。盡管它們都可以幫助我們構建現代化的 Web 應用，但在設計理念、開發方式、生態系統等方面有許多不同。本文將從多個角度對兩者進行對比。目錄框架與庫的定位核心理念…

閱讀更多...

高級RAG策略學習（五）——llama_index實現上下文窗口增強檢索RAG

高級RAG策略學習（五）——llama_index實現上下文窗口增強檢索RAG

LlamaIndex上下文窗口實現詳解概述本文檔詳細講解基于LlamaIndex框架實現的上下文窗口RAG系統，重點分析關鍵步驟、語法結構和參數配置。 1. 核心導入與環境配置 1.1 必要模塊導入 from llama_index.core import Settings from llama_index.llms.dashscope import …

閱讀更多...

Doris 數據倉庫例子

Doris 數據倉庫例子

基于 Apache Doris 構建數據倉庫的方案和具體例子。Doris 以其高性能、易用性和實時能力，成為構建現代化數據倉庫（特別是 OLAP 場景）的優秀選擇。一、為什么選擇 Doris 構建數據倉庫？Doris（原名 Palo）是一個…

閱讀更多...

WebRTC進階--WebRTC錯誤Failed to unprotect SRTP packet, err=9

WebRTC進階--WebRTC錯誤Failed to unprotect SRTP packet, err=9

文章目錄原因分析 SRTP Anti-Replay 機制客戶端源碼 err=9 的定義：為什么會觸發 replay_fail ? 解決方向原因分析 SRTP Anti-Replay 機制 SRTP 收包時會用一個 Replay Window（64/128個序列號大小）檢查 seq 是否合理。如果你構造的恢復包 recover_seq 比當前接收窗口…

閱讀更多...

Web服務與Nginx詳解

Web服務與Nginx詳解

文章目錄前言一、Web 概念1.1 Web 的基本概念1.1.1 特點1.2 B/S 架構模型1.3 Web 請求與響應過程1.4 靜態資源與動態資源1.5 Web 的發展階段1.6 實驗：搭建最小 Web 服務1.6.1 實驗目標1.6.2 實驗步驟1.7 小結二、HTTP 與 HTTPS 協議2.1 HTTP 與 HTTPS 的區別2.2 HTT…

閱讀更多...

CC-Link IE FB 轉 DeviceNet 實現歐姆龍 PLC 與松下機器人在 SMT 生產線錫膏印刷環節的精準定位控制

CC-Link IE FB 轉 DeviceNet 實現歐姆龍 PLC 與松下機器人在 SMT 生產線錫膏印刷環節的精準定位控制

案例背景在電子制造行業，SMT（表面貼裝技術）生產線對設備的精準控制要求極高。某電子制造企業的 SMT 生產線中，錫膏印刷機、SPI（錫膏厚度檢測儀）等前段設備采用了基于 CC-Link IE FB 主站的歐姆龍 NJ 系列 P…

閱讀更多...

IP5326_BZ 支持C同口輸入輸出的移動電源芯片 2.4A的充放電電流支持4LED指示燈

IP5326_BZ 支持C同口輸入輸出的移動電源芯片 2.4A的充放電電流支持4LED指示燈

IP5326 是一款集成升壓轉換器、鋰電池充電管理、電池電量指示的多功能電源管理 SOC，為移動電源提供完整的電源解決方案。得益于 IP5326 的高集成度與豐富功能,使其在應用時僅需極少的外圍器件，并有效減小整體方案的尺寸，降低 BOM 成本。IP532…

閱讀更多...

若依基礎學習

若依基礎學習

若依基礎學習 1.修改數據庫密碼以及連接名： RuoYi-Vue-master\ruoyi-admin\src\main\resources\application-druid.yml2.各個文件作用： ruoyi-admin (主啟動)├── ruoyi-framework (框架核心)│ ├── ruoyi-common (通用工具)│ └── ruoyi-sy…

閱讀更多...

靶向肽Dcpep

靶向肽Dcpep

名稱：靶向肽Dcpep三字母序列：NH2-Phe-Tyr-Pro-Ser-Tyr-His-Ser-Thr-Pro-Gln-Arg-Pro-OH單字母序列：NH2-FYPSYHSTPQRP-OH分子式：C69H94N18O19分子量：1479.62備注：僅供科研，不用于人體簡述&#x…

閱讀更多...

華為在國內搞的研發基地有多野？標桿游學帶你解鎖“研發界頂流”

華為在國內搞的研發基地有多野？標桿游學帶你解鎖“研發界頂流”

寶子們！原來華為在國內有這么多“寶藏研發基地”，之前總覺得遙不可及走進深圳坂田總部——1.3平方公里的園區，走進去就像進了“科技版大觀園”，21層研發主樓看著就很有氣勢，天鵝湖邊的路全用科學家名字命名&#xff0c…

閱讀更多...

linux缺頁中斷頻繁怎么定位

linux缺頁中斷頻繁怎么定位

1，怎么看內存是否有缺頁中斷查看日志: dmesg | grep “do fault” perf record -e page-faults -g -p <PID> 系統級監控：使用 vmstat 查看全局缺頁中斷（si/so 表示換入/換出頁數） vmstat 1 # 每秒刷新，觀察 si/so 列 iostat顯示磁盤使用情況，舉例iostat -x …

閱讀更多...

06-Hadoop生態系統組件(2)

06-Hadoop生態系統組件(2)

4. 數據查詢組件 4.1 Apache Hive詳解 from typing import Dict, List, Any, Optional, Tuple, Union from dataclasses import dataclass from enum import Enum from datetime import datetime import re import jsonclass HiveTableType(Enum):"""Hive表類型…

閱讀更多...

【自動化實戰】Python操作Excel/WORD/PDF：openpyxl與docx庫詳解

【自動化實戰】Python操作Excel/WORD/PDF：openpyxl與docx庫詳解

在現代辦公環境中，我們經常需要處理各種文檔格式，如Excel表格、Word文檔和PDF文件。手動處理這些文檔不僅耗時，而且容易出錯。Python提供了多個強大的庫來實現文檔處理的自動化，本文將重點介紹如何使用openpyxl和docx庫來操作Exce…

閱讀更多...

構建安全的自動駕駛：軟件測試中的編碼規范與AI驗證

構建安全的自動駕駛：軟件測試中的編碼規范與AI驗證

自動駕駛不再只是未來想象，它正在以驚人的速度走向現實。但這一變革也帶來了軟件開發的全新命題。與傳統車輛不同，自動駕駛依賴復雜的AI模型、傳感系統和車載決策單元，必須應對更多現實環境的不確定性。在強監管、高風險、快節奏的背景下&…

閱讀更多...

2025高教社數學建模國賽C題 - NIPT的時點選擇與胎兒的異常判定（完整參考論文）

2025高教社數學建模國賽C題 - NIPT的時點選擇與胎兒的異常判定（完整參考論文）

基于機器學習與統計模型的NIPT檢測優化與異常判定問題研究摘要非侵入性產前檢測（NIPT）作為一種無創安全的胎兒染色體異常篩查技術，在現代產前醫療中發揮著重要作用，其準確性與檢測時機及異常判定的科學性直接影響臨床決策。然而，男胎Y染色體濃度受孕周數、孕婦BMI等多…

閱讀更多...

一種基于注解與AOP的Spring Boot接口限流防刷方案

一種基于注解與AOP的Spring Boot接口限流防刷方案

1. 添加Maven依賴<dependencies><dependency><groupId>org.springframework.boot</groupId><artifactId>spring-boot-starter-web</artifactId></dependency><dependency><groupId>org.springframework.boot</groupI…

閱讀更多...

代碼隨想錄二刷之“貪心算法”～GO

代碼隨想錄二刷之“貪心算法”～GO

簡單題目 1.455. 分發餅干 - 力扣（LeetCode） func findContentChildren(g []int, s []int) int {sort.Ints(g)sort.Ints(s)index : 0for i : 0;i<len(s);i{if index < len(g) && g[index] < s[i]{index}}return index }感悟&#xff…

閱讀更多...

Pod自動重啟問題排查：JDK 17 EA版本G1GC Bug導致的應用崩潰

Pod自動重啟問題排查：JDK 17 EA版本G1GC Bug導致的應用崩潰

Pod自動重啟問題排查：JDK 17 EA版本G1GC Bug導致的應用崩潰問題背景在生產環境中，我們遇到了一個嚴重的穩定性問題：應用Pod頻繁自動重啟，導致服務不穩定。通過深入分析JVM崩潰日志，最終定位到是JDK 17 EA版本中G1GC的一個已知Bug導致的。問題現象 1. Pod重啟表現應…

閱讀更多...

HTML文本格式化標簽

HTML文本格式化標簽

HTML提供了多種標簽用于文本的格式化，這些標簽可以改變文本的外觀（如粗細、斜體）或賦予文本特定的含義（如強調、引用）。1. 基本文本樣式標簽（1）粗體文本使用<b>或<strong>標簽可以使…

閱讀更多...

最新文章