數據集相關類代碼回顧理解 | StratifiedShuffleSplit\transforms.ToTensor\Counter

【PyTorch】圖像多分類項目

目錄

StratifiedShuffleSplit

transforms.ToTensor

Counter


StratifiedShuffleSplit

sss = StratifiedShuffleSplit(n_splits=1, test_size=0.2, random_state=0)

創建StratifiedShuffleSplit對象,用于將數據集劃分為訓練集和測試集。

  • n_splits=1:劃分次數為1,大于1則多次劃分,每次劃分生成一組新訓練集和新測試集。
  • test_size=0.2:測試集比例為0.2,即測試集的大小占總樣本的20%
  • random_state=0:隨機種子為0,類似random的種子,保證每次抽樣到的數據一樣?

StratifiedShuffleSplit是scikit-learn庫中的一個類,用于創建訓練集和測試集的劃分,同時保持每個類別中的樣本比例一致。核心思想:分層抽樣。

StratifiedShuffleSplit?類的工作原理:

先根據每個類別的樣本數量將數據集劃分為盡可能相等的子集(分層)

然后在這些子集中隨機選擇樣本拆分創建訓練集和測試集(隨機拆分)

插入空格更好理解:Stratified Shuffle Split分層隨機拆分類!

transforms.ToTensor

data_transformer = transforms.Compose([transforms.ToTensor()])

?transforms.ToTensor()的作用是將PIL圖像或NumPy數組轉換為PyTorch張量,并且將圖像的像素值從[0, 255]范圍縮放到[0.0, 1.0]范圍,即在[0.0, 1.0]范圍內對像素值進行歸一化。轉換后的張量形狀為(C, H, W)

Compose是 torchvision.transforms 模塊的一個類,創建一個Compose對象時,需要傳入一個包含一個或多個變換操作的列表。Compose對象一般包含四個變換操作:調整圖像大小、從中心裁剪圖像、將圖像轉換為張量以及歸一化。

Counter

counter_train=collections.Counter(y_train)

用于統計圖像標簽,即每類標簽圖像數量,Counter是用于計數的子類字典。例如PyTorch torchvision包中STL-10數據集的訓練數據集:

本文來自互聯網用戶投稿,該文觀點僅代表作者本人,不代表本站立場。本站僅提供信息存儲空間服務,不擁有所有權,不承擔相關法律責任。
如若轉載,請注明出處:http://www.pswp.cn/news/914034.shtml
繁體地址,請注明出處:http://hk.pswp.cn/news/914034.shtml
英文地址,請注明出處:http://en.pswp.cn/news/914034.shtml

如若內容造成侵權/違法違規/事實不符,請聯系多彩編程網進行投訴反饋email:809451989@qq.com,一經查實,立即刪除!

相關文章

【環境配置】KAG - Windows 安裝部署

前言 本博客將介紹如何在 Windows 系統上 部署運行 KAG 項目,將使用 WSL 和 Docker 和 Vscode 幫助我們之后利用 KAG 開發個人知識庫問答項目。 KAG(Knowledge-Augmented Generation)知識增強生成系統 是一個融合知識圖譜與大語言模型能力的…

《探索電腦麥克風聲音采集多窗口實時可視化技術》

引言在當今數字化信息飛速發展的時代,聲音作為一種重要的信息載體,其處理和分析技術日益受到廣泛關注。聲音可視化技術,作為聲音處理領域的關鍵技術之一,具有極為重要的價值。它能夠將抽象的聲音信號轉化為直觀的視覺圖像&#xf…

加工進化論:SPL 一鍵加速日志轉指標

作者:勞貴泓(泓逸) 1. 背景 日志服務的 SPL(Search Processing Language)自推出以來,憑借其強大的數據處理能力,已經成為眾多開發者和企業實現高效數據分析的首選工具。隨著業務場景的不斷拓展…

Web 應用防火墻:守護應用安全的核心屏障

當你在調試 Web 應用時,是否遇到過這樣的情況:剛修復的 XSS 漏洞又被繞過,數據庫日志里突然出現詭異的 SQL 語句,或者用戶反饋登錄后信息被篡改?這些問題的背后,往往是 Web 應用面臨的持續安全威脅。據 OWA…

Python 網絡爬蟲的基本流程及 robots 協議詳解

數據驅動的時代,網絡爬蟲作為高效獲取互聯網信息的工具,其規范化開發離不開對基本流程的掌握和對 robots 協議的遵守。本文將系統梳理 Python 網絡爬蟲的核心流程,并深入解讀 robots 協議的重要性及實踐規范。 一、Python 網絡爬蟲的基本流程 Python 網絡爬蟲的工作過程可…

字節二面(狠狠拷打系列):什么是http1.1,2.0,3.0,分別在什么場景里面用的多

文章目錄從單行到新紀元:HTTP/0.9、1.0、1.1、2.0與3.0的核心區別HTTP/0.9:協議的黎明 (1991)HTTP/1.0:功能擴展與標準化 (1996)HTTP/1.1:持久連接與性能優化 (1997)HTTP/2.0:二進制與多路復用 (2015)HTTP/3.0&#xf…

Java教程:JavaWeb ---MySQL高級

?博客主頁: https://blog.csdn.net/m0_63815035?typeblog 💗《博客內容》:大數據開發、.NET、Java.測試開發、Python、Android、Go、Node、Android前端小程序等相關領域知識 📢博客專欄: https://blog.csdn.net/m0_…

Audio筆試和面試題型解析

本專欄預計更新90期左右。當前第27期-音頻部分. 音頻硬件在消費電子(手機、電腦、耳機、智能音箱)、汽車、專業音響等領域是用戶體驗的關鍵組成部分。大廠(如蘋果、三星、Google、華為、小米、各種汽車Tier 1供應商等)的硬件工程師在設計和優化音頻系統時,需要對喇叭(揚…

DeepSeek俄羅斯方塊網頁版HTML5(附源碼)

用DeepSeek生成一個俄羅斯方塊游戲網頁版的,基于HTML5,效果很棒。 提示詞prompt 幫我做一個俄羅斯方塊 網頁版的 基于HTML5游戲功能說明 基本功能: 完整的俄羅斯方塊游戲邏輯 7種不同形狀的方塊 分數計算系統 等級提升系統(速度會隨等級提高)…

企業電商平臺搭建:ZKmall開源商城服務器部署與容災方案

企業級電商平臺最核心的訴求,就是得讓 “業務一直在線”—— 不管是平時運營要穩如磐石,還是突然出故障了能火速恢復,都離不開靠譜的服務器部署架構和周全的容災方案。ZKmall 開源商城攢了 6000 多家企業客戶的實戰經驗,琢磨出一套…

【軟件運維】前后端部署啟動的幾種方式

.sh啟動 #!/bin/bash# 解析軟鏈接,獲取真實腳本目錄 SOURCE"${BASH_SOURCE[0]}" while [ -L "$SOURCE" ]; doDIR"$( cd -P "$( dirname "$SOURCE" )" && pwd )"SOURCE"$(readlink "$SOURCE&q…

[爬蟲知識] DrissionPage:強大的自動化工具

相關爬蟲實戰案例:[爬蟲實戰] 使用 DrissionPage 自動化采集小紅書筆記 相關爬蟲專欄:JS逆向爬蟲實戰 爬蟲知識點合集 爬蟲實戰案例 逆向知識點合集 前言: 在當今數據驅動的世界里,網絡爬蟲和自動化測試扮演著越來越重要的角…

數據分析師如何構建自己的底層邏輯?

目錄 一、什么是“底層邏輯”? 二、底層邏輯的核心是什么?三句話講清楚 1. 你到底在解決什么問題? 2. 你有沒有一套“框架”來組織你的分析思路? 3. 你能不能用數據說出“結論 因果 建議”? 三、從 BI 視角出發…

殘差連接+層歸一化:Transformer訓練穩定秘訣

什么是:殘差連接+層歸一化 殘差連接 (Residual Connection):防止梯度消失 核心原理 簡單理解:走樓梯時,既可以走樓梯,也可以坐電梯,最后在同一層匯合。 # 殘差連接的數學表示 輸出 = F(輸入) + 輸入 # ↑處理后 ↑原始輸入具體數值例子 處理句子"我愛學習…

公網 IP 不穩定監控實戰:用多點 Ping 策略實現高可達率保障

更多云服務器知識,盡在hostol.com 你有沒有遇到過這種情況:明明服務器的監控系統說一切正常,服務狀態綠油油一片,但用戶那邊卻反饋“時好時壞”、“丟包嚴重”甚至“根本連不上”。你掏出手機連上公網去試試,誒&#…

uniapp類似抖音視頻滑動

最近需求說要做個類似抖音那種視頻的&#xff0c;我二話不說就用了swiper-view組件&#xff0c;但是效果不太理想&#xff0c;后面改用css屬性先放效果圖&#xff1a;<template><view class"video-scroll-container" touchstart"handleTouchStart"…

Umi-OCR 的 Docker(win制作鏡像,Linux(Ubuntu Server 22.04)離線部署)

前置博客&#xff1a;Ubuntu-Server 22.04.4 詳細安裝圖文教程 wget命令在windows終端下不能使用的原因及解決辦法 在 Ubuntu 22.04 LTS 上離線安裝 Docker 手把手教你在Win11下安裝docker Umi-OCR 完整部署流程 第一步&#xff1a;在 Windows 上構建/獲取 Umi-OCR Docker…

AI Agent革命:當大模型學會使用工具、記憶與規劃

以下是針對Lilian Weng的AI Agent綜述文章&#xff08;原文鏈接&#xff09;的深度解析與整理&#xff1a; AI Agent革命&#xff1a;當大模型學會使用工具、記憶與規劃 ——解析LLM驅動的下一代智能體技術架構 一、核心范式轉變 傳統AI模型&#xff08;如ChatGPT&#xff09…

Claude Code:完爆 Cursor 的編程體驗

前言 最近&#xff0c;聽說Claude Code這款代碼輔助編寫產品很強&#xff0c;有人把Cursor比作實習生水平&#xff0c;Claude Code比作高級工程師水平。 起初不以為意&#xff0c;因為特殊原因&#xff0c;Claude 無法直接訪問。然而&#xff0c;有人做了鏡像站&#xff0c;可以…

ModbusTCP通訊

supply服務-ModbusTCP通訊&#xff1a; winForm-HZHControls-Sqllite本地小項目架構補充&#xff1a;