PyTorch中 torch.utils.data.DataLoader 的詳細解析和讀取點云數據示例

一、DataLoader 是什么?

torch.utils.data.DataLoader 是 PyTorch 中用于加載數據的核心接口,它支持:

  • 批量讀取(batch)
  • 數據打亂(shuffle)
  • 多線程并行加載(num_workers)
  • 自動將數據打包成 batch
  • 數據預處理和增強(搭配 Dataset 使用)

二、常見參數詳解

參數含義
dataset傳入的 Dataset 對象(如自定義或 torchvision.datasets
batch_size每個 batch 的樣本數量
shuffle是否打亂數據(通常訓練集為 True)
num_workers并行加載數據的線程數(越大越快,但依機器決定)
drop_last是否丟棄最后一個不足 batch_size 的 batch
pin_memory若為 True,會將數據復制到 CUDA 的 page-locked 內存中(加速 GPU 訓練)
collate_fn自定義打包 batch 的函數(可用于變長序列、圖神經網絡等)
sampler控制數據采樣策略,不能與 shuffle 同時使用
persistent_workers若為 True,worker 在 epoch 間保持運行狀態(提高效率,PyTorch 1.7+)

三、基本使用示例

搭配 Dataset 使用

from torch.utils.data import Dataset, DataLoaderclass MyDataset(Dataset):def __init__(self):self.data = [i for i in range(100)]def __len__(self):return len(self.data)def __getitem__(self, idx):return self.data[idx]dataset = MyDataset()
loader = DataLoader(dataset, batch_size=8, shuffle=True, num_workers=2)for batch in loader:print(batch)

四、自定義 collate_fn 示例

適用于:變長數據(如文本、點云)或特殊處理需求

from torch.nn.utils.rnn import pad_sequencedef my_collate_fn(batch):# 假設每個樣本是 list 或 tensor(變長)batch = [torch.tensor(item) for item in batch]padded = pad_sequence(batch, batch_first=True, padding_value=0)return paddedloader = DataLoader(dataset, batch_size=4, collate_fn=my_collate_fn)

五、使用注意事項

  1. Windows 平臺注意:

    • 設置 num_workers > 0 時,必須使用:

      if __name__ == '__main__':DataLoader(...)
      
  2. 過多線程數可能導致瓶頸:

    • 通常 num_workers = cpu_count() // 2 較穩定
  3. GPU 加速:

    • 訓練時推薦設置 pin_memory=True 可提高 GPU 訓練數據傳輸效率。
  4. 不要同時設置 shuffle=Truesampler

    • 否則會報錯,二者功能沖突。

六、訓練中的典型使用方式

for epoch in range(num_epochs):for i, batch in enumerate(train_loader):inputs, labels = batchinputs, labels = inputs.to(device), labels.to(device)optimizer.zero_grad()outputs = model(inputs)loss = criterion(outputs, labels)loss.backward()optimizer.step()

七、調試技巧與加速建議

場景建議
數據加載慢增加 num_workers
GPU 等數據設置 pin_memory=True
Dataset 中有耗時操作考慮預處理或使用緩存
debug 模式設置 num_workers=0,禁用多進程

八、與 TensorDataset、ImageFolder 配合

from torchvision.datasets import ImageFolder
from torchvision import transformstransform = transforms.Compose([transforms.Resize((224, 224)),transforms.ToTensor(),
])dataset = ImageFolder(root='your/image/folder', transform=transform)
loader = DataLoader(dataset, batch_size=32, shuffle=True, num_workers=4)

九、點云數據處理場景應用實例

點云數據處理 場景中,使用 torch.utils.data.DataLoader 時,常遇到如下需求:

  • 每幀點云大小不同(變長 Tensor)
  • 點云數據 + 標簽(如語義、實例)
  • 使用 .bin.pcd.npy 等格式加載
  • 數據增強(如旋轉、裁剪、噪聲)
  • GPU 加速 + 批量訓練

1. 點云數據 Dataset 示例(以 .npy 文件為例)

import os
import numpy as np
import torch
from torch.utils.data import Dataset, DataLoaderclass PointCloudDataset(Dataset):def __init__(self, root_dir, transform=None):self.root_dir = root_dirself.files = sorted([f for f in os.listdir(root_dir) if f.endswith('.npy')])self.transform = transformdef __len__(self):return len(self.files)def __getitem__(self, idx):point_cloud = np.load(os.path.join(self.root_dir, self.files[idx]))  # shape: [N, 3] or [N, 6]point_cloud = torch.tensor(point_cloud, dtype=torch.float32)if self.transform:point_cloud = self.transform(point_cloud)return point_cloud

2. 自定義 collate_fn(處理變長點云)

def collate_pointcloud_fn(batch):"""輸入: List of [N_i x 3] tensors輸出: - 合并后的 [B x N_max x 3] tensor- 每個樣本的真實點數 list"""max_points = max(pc.shape[0] for pc in batch)padded = torch.zeros((len(batch), max_points, batch[0].shape[1]))lengths = []for i, pc in enumerate(batch):lengths.append(pc.shape[0])padded[i, :pc.shape[0], :] = pcreturn padded, torch.tensor(lengths)

3. 加載器構建示例

dataset = PointCloudDataset("/path/to/your/pointclouds")loader = DataLoader(dataset,batch_size=8,shuffle=True,num_workers=4,pin_memory=True,collate_fn=collate_pointcloud_fn
)for batch_points, batch_lengths in loader:# batch_points: [B, N_max, 3]# batch_lengths: [B]print(batch_points.shape)

4. 可選擴展功能

功能實現方法
點云旋轉/縮放自定義 transform(例如隨機旋轉矩陣乘點云)
加載 .pcd使用 open3d, pypcd, 或 pclpy
同時加載標簽在 Dataset 中返回 (point_cloud, label),修改 collate_fn
voxel downsampling使用 open3d.geometry.VoxelDownSample
GPU 加速point_cloud = point_cloud.cuda(non_blocking=True)

5. 訓練循環中使用

for epoch in range(num_epochs):for batch_pc, batch_len in loader:batch_pc = batch_pc.to(device)# 可用 batch_len 做 mask 或 attention maskout = model(batch_pc)...

本文來自互聯網用戶投稿,該文觀點僅代表作者本人,不代表本站立場。本站僅提供信息存儲空間服務,不擁有所有權,不承擔相關法律責任。
如若轉載,請注明出處:http://www.pswp.cn/bicheng/83205.shtml
繁體地址,請注明出處:http://hk.pswp.cn/bicheng/83205.shtml
英文地址,請注明出處:http://en.pswp.cn/bicheng/83205.shtml

如若內容造成侵權/違法違規/事實不符,請聯系多彩編程網進行投訴反饋email:809451989@qq.com,一經查實,立即刪除!

相關文章

在MDK中自動部署LVGL,在stm32f407ZGT6移植LVGL-8.4,運行demo,顯示label

在MDK中自動部署LVGL,在stm32f407ZGT6移植LVGL-8.4 一、硬件平臺二、實現功能三、移植步驟1、下載LVGL-8.42、MDK中安裝LVGL-8.43、配置RTE4、配置頭文件 lv_conf_cmsis.h5、配置lv_port_disp_template 四、添加心跳相關文件1、在STM32CubeMX中配置TIM7的參數2、使能…

德思特新聞 | 德思特與es:saar正式建立合作伙伴關系

德思特新聞 2025年5月9日,德思特科技有限公司(以下簡稱“德思特”)與德國嵌入式系統專家es:saar GmbH正式達成合作伙伴關系。此次合作旨在將 es:saar 的先進嵌入式開發與測試工具引入中國及亞太市場,助力本地客戶提升產品開發效率…

fork函數小解

學了好久終于搞懂fork函數的一些作用 1. fork函數作用:用于創建新的子進程 這是fork最根本的功能,在父進程里創建新的子進程、 但是創建新的子進程之后呢? 子進程和父進程的關系是什么樣的? 為什么fork得到的子進程返回值為0&am…

opencv(C++) 變換圖像與形態學操作

文章目錄 使用腐蝕和膨脹圖像形態濾波器實現案例使用形態學濾波器對圖像進行開運算和閉運算實現案例在灰度圖像上應用形態學操作算子形態學梯度(Morphological Gradient)黑帽變換(Black-hat Transform)使用分水嶺算法進行圖像分割使用 MSER 提取顯著區域MSER 檢測與可視化使…

測試工程師學LangChain之promptTemplate 實戰筆記

一、引言:大模型時代的測試自動化革命 2025 年,隨著大模型(如 DeepSeek)在自動化測試領域的廣泛應用,Prompt 編寫已成為測試工程師的核心技能之一。 為什么? 大模型輸出的質量 90% 取決于輸入的 PromptLangChain 的 PromptTemplate 提供了參數化 Prompt 的標準化方案Ope…

CP2K 軟件介紹與使用指南

CP2K 軟件介紹與使用指南 一、CP2K簡介 CP2K是一款開源的量子化學和固態物理模擬軟件包,主要用于原子尺度模擬,特別擅長以下領域: 第一性原理計算:基于密度泛函理論(DFT)的電子結構計算分子動力學(MD):包括從頭算分…

npm、pnpm、yarn使用以及區別

npm 使用 安裝包&#xff1a;在項目目錄下&#xff0c;npm install <包名> 用于本地安裝包到 node_modules 目錄&#xff0c;并添加到 package.json 的 dependencies 中&#xff1b;npm install -g <包名> 用于全局安裝&#xff0c;適用于命令行工具等。初始化項目…

2025年北京市職工職業技能大賽第六屆信息通信行業網絡安全技能大賽復賽CTF部分WP-哥斯拉流量分析

2025年北京市職工職業技能大賽第六屆信息通信行業網絡安全技能大賽復賽CTF部分WP-哥斯拉流量分析 一、流量分析 題目沒有任何提示,附件gzl.pcap 解題哥斯拉流量300多KB包很多,沒啥經驗只能挨個看回來之后又狠狠得擼了一把哥斯拉流量分析我這里用的是哥斯拉4.0.1 測試鏈接…

GitLab 18.0 正式發布,15.0 將不再受技術支持,須升級【六】

GitLab 是一個全球知名的一體化 DevOps 平臺&#xff0c;很多人都通過私有化部署 GitLab 來進行源代碼托管。極狐GitLab 是 GitLab 在中國的發行版&#xff0c;專門為中國程序員服務。可以一鍵式部署極狐GitLab。 學習極狐GitLab 的相關資料&#xff1a; 極狐GitLab 官網極狐…

React 項目中封裝 Excel 導入導出組件:技術分享與實踐

文章目錄 前言一、為什么需要封裝 Excel 組件&#xff1f;二、技術選型三、核心實現1. 安裝依賴2. 封裝Excel導出3. 封裝導入組件 &#xff08;UploadExcel&#xff09; 總結 前言 在 React 項目中&#xff0c;處理 Excel 文件的導入和導出是常見的業務需求。無論是導出報表數…

RustDesk 搭建自建服務器并設置服務自啟動

目錄 0. 介紹 1. 事前準備 1.1 有公網 ip 的云服務器一臺 1.2 服務端部署包 1.3 客戶端安裝包 2. 部署 2.1 服務器環境準備 2.2 上傳服務端部署包 2.3 運行 pm2 3. 客戶端使用 3.1 安裝 3.2 配置 3.2.1 解鎖網絡設置 3.2.2 ID / 中級服務器 3.3 啟動效果 > …

基于Qt封裝數據庫基本增刪改查操作,支持多線程,并實現SQLite數據庫單例訪問

抽出來的&#xff0c;直接用就行 頭文件CPP文件使用示例 頭文件 #ifndef DATABASECOMMON_H #define DATABASECOMMON_H/** 單例封裝SQLite通用操作&#xff0c;支持多線程調用&#xff1b;可擴展兼容其他數據庫&#xff0c;照著SysRunDatabase寫&#xff0c;并且重載openDataba…

AI筆記 - 網絡模型 - mobileNet

網絡模型 mobileNet mobileNet V1網絡結構深度可分離卷積空間可分![在這里插入圖片描述](https://i-blog.csdnimg.cn/direct/aff06377feac40b787cfc882be7c6e5d.png) 參考 mobileNet V1 網絡結構 MobileNetV1可以理解為VGG中的標準卷積層換成深度可分離卷積 可分離卷積主要有…

第十五篇:MySQL 高級實戰項目:構建高可用、可觀測、性能優化一體化數據庫平臺

本篇聚焦于如何基于 MySQL 構建一個真正面向生產環境的數據庫平臺&#xff0c;集成高可用、可觀測與性能調優三大核心能力&#xff0c;助力穩定、可擴展的系統運行。 一、項目背景與目標 在實際生產環境中&#xff0c;數據庫系統需要應對以下挑戰&#xff1a; 業務高速增長帶來…

華為OD機試真題——文件目錄大小(2025 A卷:100分)Java/python/JavaScript/C++/C語言/GO六種語言最佳實現

2025 A卷 100分 題型 本文涵蓋詳細的問題分析、解題思路、代碼實現、代碼詳解、測試用例以及綜合分析; 并提供Java、python、JavaScript、C++、C語言、GO六種語言的最佳實現方式! 2025華為OD真題目錄+全流程解析/備考攻略/經驗分享 華為OD機試真題《文件目錄大小》: 目錄 題…

qwen 2.5 并行計算機制:依靠 PyTorch 和 Transformers 庫的分布式能力

qwen 2.5 并行計算機制:依靠 PyTorch 和 Transformers 庫的分布式能力 完整可運行代碼: import torch import torch.nn.functional as F from transformers

TIDB創建索引失敗 mkdir /tmp/tidb/tmp_ddl-4000/1370: no such file or directory.

TIDB創建索引失敗&#xff1a;解決“mkdir /tmp/tidb/tmp_ddl-4000/1370: no such file or directory”問題 在使用 TIDB 數據庫時&#xff0c;我們有時會遇到創建索引失敗的問題。常見的錯誤信息為&#xff1a; mkdir /tmp/tidb/tmp_ddl-4000/1370: no such file or directo…

華為OD機試真題—— 最少數量線段覆蓋/多線段數據壓縮(2025A卷:100分)Java/python/JavaScript/C++/C語言/GO六種最佳實現

2025 A卷 100分 題型 本文涵蓋詳細的問題分析、解題思路、代碼實現、代碼詳解、測試用例以及綜合分析; 并提供Java、python、JavaScript、C++、C語言、GO六種語言的最佳實現方式! 2025華為OD真題目錄+全流程解析/備考攻略/經驗分享 華為OD機試真題《最少數量線段覆蓋/多線段數…

EasyRTC嵌入式音視頻實時通話SDK助力AI與IoT智能硬件打造音視頻交互多場景應用

一、引言? 在數字化浪潮下&#xff0c;AI與IoT深度融合重塑智能硬件產業。實時音視頻通信是智能硬件交互的核心&#xff0c;其性能關乎用戶體驗與場景拓展。EasyRTC嵌入式音視頻實時通話SDK基于WebRTC技術&#xff0c;以輕量、易擴展的特性&#xff0c;為AI與IoT智能硬件融合…

第十四章 MQTT訂閱

系列文章目錄 系列文章目錄 第一章 總體概述 第二章 在實體機上安裝ubuntu 第三章 Windows遠程連接ubuntu 第四章 使用Docker安裝和運行EMQX 第五章 Docker卸載EMQX 第六章 EMQX客戶端MQTTX Desktop的安裝與使用 第七章 EMQX客戶端MQTTX CLI的安裝與使用 第八章 Wireshark工具…