聲明:筆記是做項目時根據B站博主視頻學習時自己編寫,請勿隨意轉載!
一、說在前面的一些話
1、torchvision
需要用到torchvision里的一些模塊,之前第一期配置環境的時候已經安裝過torchvision!
torchvision是PyTorch生態系統中的一個關鍵庫,專門為計算機視覺任務設計和優化。它提供了豐富的功能和工具:
- 數據集:內置了多種廣泛使用的圖像和視頻數據集,如MNIST、CIFAR10/100、Fashion-MNIST、ImageNet、COCO等,以torch.utils.data.Dataset的形式實現,方便與PyTorch數據加載器(DataLoader)集成。
- 數據預處理工具:通過torchvision.transforms模塊提供了豐富的數據增強和預處理操作,包括但不限于裁剪、旋轉、翻轉、歸一化、調整大小、顏色轉換等,這些操作對于訓練穩健的深度學習模型至關重要。
- 預訓練模型:提供了一些常用的預訓練模型,如ResNet、VGG、Inception等,這些模型在大型數據集(如ImageNet)上進行過訓練,并可以直接使用或進行微調。
- 圖像分類、目標檢測和語義分割:提供了常用的圖像分類、目標檢測和語義分割任務的模型和數據集,如CIFAR-10、PASCAL VOC、COCO等。
- 可視化工具:提供了一些可視化工具,如TensorBoard的集成、圖像和視頻的顯示等,方便進行模型調試和結果展示。