cifar10 c語言,Python3讀取深度學習CIFAR-10數據集出現的若干問題解決

今天在看網上的視頻學習深度學習的時候,用到了CIFAR-10數據集。當我興高采烈的運行代碼時,卻發現了一些錯誤:

# -*- coding: utf-8 -*-

import pickle as p

import numpy as np import os def load_CIFAR_batch(filename): """ 載入cifar數據集的一個batch """ with open(filename, 'r') as f: datadict = p.load(f) X = datadict['data'] Y = datadict['labels'] X = X.reshape(10000, 3, 32, 32).transpose(0, 2, 3, 1).astype("float") Y = np.array(Y) return X, Y def load_CIFAR10(ROOT): """ 載入cifar全部數據 """ xs = [] ys = [] for b in range(1, 6): f = os.path.join(ROOT, 'data_batch_%d' % (b,)) X, Y = load_CIFAR_batch(f) xs.append(X) ys.append(Y) Xtr = np.concatenate(xs) Ytr = np.concatenate(ys) del X, Y Xte, Yte = load_CIFAR_batch(os.path.join(ROOT, 'test_batch')) return Xtr, Ytr, Xte, Yte

1

2

3

4

5

6

7

8

9

10

11

12

13

14

15

16

17

18

19

20

21

22

23

24

25

26

27

28

29

30

31

32

錯誤代碼如下:

'gbk' codec can't decode byte 0x80 in position 0: illegal multibyte sequence

1

于是乎開始各種搜索問題,問大佬,網上的答案都是類似:

cd311254677653b15395f38833269c6f.png

然而并沒有解決問題!還是錯誤的!(我大概搜索了一下午吧,都是上面的答案)

哇,就當我很絕望的時候,我終于發現了一個新奇的答案,抱著試一試的態度,嘗試了一下:

def load_CIFAR_batch(filename):

""" 載入cifar數據集的一個batch """ with open(filename, 'rb') as f: datadict = p.load(f, encoding='latin1') X = datadict['data'] Y = datadict['labels'] X = X.reshape(10000, 3, 32, 32).transpose(0, 2, 3, 1).astype("float") Y = np.array(Y) return X, Y

1

2

3

4

5

6

7

8

9

10

竟然成功了,這里沒有報錯了!欣喜之余,我就很好奇,encoding=’latin1’到底是啥玩意呢,以前沒有見過啊?于是,我搜索了一下,了解到:

Latin1是ISO-8859-1的別名,有些環境下寫作Latin-1。ISO-8859-1編碼是單字節編碼,向下兼容ASCII,其編碼范圍是0x00-0xFF,0x00-0x7F之間完全和ASCII一致,0x80-0x9F之間是控制字符,0xA0-0xFF之間是文字符號。

因為ISO-8859-1編碼范圍使用了單字節內的所有空間,在支持ISO-8859-1的系統中傳輸和存儲其他任何編碼的字節流都不會被拋棄。換言之,把其他任何編碼的字節流當作ISO-8859-1編碼看待都沒有問題。這是個很重要的特性,MySQL數據庫默認編碼是Latin1就是利用了這個特性。ASCII編碼是一個7位的容器,ISO-8859-1編碼是一個8位的容器。

還沒等我高興起來,運行后,又發現了一個問題:

memory error

1

什么鬼?內存錯誤!哇,原來是數據大小的問題。

X = X.reshape(10000, 3, 32, 32).transpose(0,2,3,1).astype("float")

1

這告訴我們每批數據都是10000 * 3 * 32 * 32,相當于超過3000萬個浮點數。 float數據類型實際上與float64相同,意味著每個數字大小占8個字節。這意味著每個批次占用至少240 MB。你加載6這些(5訓練+ 1測試)在總產量接近1.4 GB的數據。

for b in range(1,2):

f = os.path.join(ROOT, 'data_batch_%d' % (b,)) X, Y = load_CIFAR_batch(f) xs.append(X) ys.append(Y)

1

2

3

4

5

所以如有可能,如上代碼所示只能一次運行一批。

到此為止,錯誤基本搞定,下面貼出正確代碼:

# -*- coding: utf-8 -*-

import pickle as p

import numpy as np import os def load_CIFAR_batch(filename): """ 載入cifar數據集的一個batch """ with open(filename, 'rb') as f: datadict = p.load(f, encoding='latin1') X = datadict['data'] Y = datadict['labels'] X = X.reshape(10000, 3, 32, 32).transpose(0, 2, 3, 1).astype("float") Y = np.array(Y) return X, Y def load_CIFAR10(ROOT): """ 載入cifar全部數據 """ xs = [] ys = [] for b in range(1, 2): f = os.path.join(ROOT, 'data_batch_%d' % (b,)) X, Y = load_CIFAR_batch(f) xs.append(X) #將所有batch整合起來 ys.append(Y) Xtr = np.concatenate(xs) #使變成行向量,最終Xtr的尺寸為(50000,32,32,3) Ytr = np.concatenate(ys) del X, Y Xte, Yte = load_CIFAR_batch(os.path.join(ROOT, 'test_batch')) return Xtr, Ytr, Xte, Yte

1

2

3

4

5

6

7

8

9

10

11

12

13

14

15

16

17

18

19

20

21

22

23

24

25

26

27

28

29

30

31

32

import numpy as np

from julyedu.data_utils import load_CIFAR10

import matplotlib.pyplot as plt plt.rcParams['figure.figsize'] = (10.0, 8.0) plt.rcParams['image.interpolation'] = 'nearest' plt.rcParams['image.cmap'] = 'gray' # 載入CIFAR-10數據集 cifar10_dir = 'julyedu/datasets/cifar-10-batches-py' X_train, y_train, X_test, y_test = load_CIFAR10(cifar10_dir) # 看看數據集中的一些樣本:每個類別展示一些 print('Training data shape: ', X_train.shape) print('Training labels shape: ', y_train.shape) print('Test data shape: ', X_test.shape) print('Test labels shape: ', y_test.shape)

順便看一下CIFAR-10數據組成:

9e72ea20e2a50ce454268449a2a9356a.png

本文來自互聯網用戶投稿,該文觀點僅代表作者本人,不代表本站立場。本站僅提供信息存儲空間服務,不擁有所有權,不承擔相關法律責任。
如若轉載,請注明出處:http://www.pswp.cn/news/259388.shtml
繁體地址,請注明出處:http://hk.pswp.cn/news/259388.shtml
英文地址,請注明出處:http://en.pswp.cn/news/259388.shtml

如若內容造成侵權/違法違規/事實不符,請聯系多彩編程網進行投訴反饋email:809451989@qq.com,一經查實,立即刪除!

相關文章

Java程序性能優化

一、避免在循環條件中使用復雜表達式 在不做編譯優化的情況下,在循環中,循環條件會被反復計算,如果不使用復雜表達式,而使循環條件值不變的話,程序將會運行的更快。 例子: import java.util.vector; class …

asp.net表單提交方法:GET\POST介紹

表單form的提交有兩種方式&#xff0c;一種是get的方法&#xff0c;一種是post 的方法&#xff0c;如果沒有特殊指定&#xff0c;默認為post。看下面代碼,理解ASP.NET Get和Post兩種提交的區別: 1.< form id"form1" method"get" runat"server"…

各種排序算法總結

轉載&#xff1a;http://blog.csdn.net/warringah1/article/details/8951220 明天就要去參加阿里巴巴的實習生筆試了&#xff0c;雖然沒想著能進去&#xff0c;但是態度還是要端正的&#xff0c;也沒什么可以準備的&#xff0c;復習復習排序吧。 1 插入排序 void InsertSort(in…

CentOS7 上安裝 Zookeeper-3.4.9 服務

在 CentOS7 上安裝 zookeeper-3.4.9 服務1、創建 /usr/local/services/zookeeper 文件夾&#xff1a; mkdir -p /usr/local/services/zookeeper 2、進入到 /usr/local/services/zookeeper 目錄中&#xff1a; cd /usr/local/services/zookeeper 3、下載 zookeeper-3.4.9.…

c語言在程序中顯示現在星期幾,C語言程序設計: 輸入年月日 然后輸出是星期幾...

該樓層疑似違規已被系統折疊 隱藏此樓查看此樓#include main(){int year,month,day0,a,b,week,c,i,sum0,days,d;printf("please input year,month,days\n");scanf("%d,%d,%d",&year,&month,&days);for(i1;i{if (year%40){if(year%1000){if (ye…

static之用法

本文轉載于http://www.cnblogs.com/stoneJin/archive/2011/09/21/2183313.html 在C語言中&#xff0c;static的字面意思很容易把我們導入歧途&#xff0c;其實它的作用有三條。 &#xff08;1&#xff09;先來介紹它的第一條也是最重要的一條&#xff1a;隱藏。 當我們同時編譯…

HTTP響應報文與工作原理詳解

HTTP 是一種請求/響應式的協議&#xff0c;即一個客戶端與服務器建立連接后&#xff0c;向服務器發送一個請求;服務器接到請求后&#xff0c;給予相應的響應信息。 超文本傳輸協議(Hypertext Transfer Protocol&#xff0c;簡稱HTTP)是應用層協議。HTTP 是一種請求/響應式的協議…

優先隊列priority_queue 用法詳解

轉載&#xff1a; 1.優先隊列priority_queue 用法詳解 2.STL系列之五 priority_queue 優先級隊列 優先隊列是隊列的一種&#xff0c;不過它可以按照自定義的一種方式&#xff08;數據的優先級&#xff09;來對隊列中的數據進行動態的排序 每次的push和pop操作&#xff0c;隊…

android自定義畫板,android 自定義控件 -- 畫板

如圖&#xff1a;package com.example.myview;import android.content.Context;import android.graphics.Canvas;import android.graphics.Color;import android.graphics.Paint;import android.graphics.Path;import android.graphics.Paint.Style;import android.util.Attrib…

postgreSQl pathman 用法語句總結

2019獨角獸企業重金招聘Python工程師標準>>> --新建主表 create table part_test(id int, info text, crt_time timestamp not null); --插入測試數據 insert into part_test select id,md5(random()::text),clock_timestamp() (id|| hour)::interval from generat…

Oracle查詢筆記

-- tanslate(str,from_str,to_str) -- 將str中的from_str替換成to_str select translate(hello,e,o) t from dual;-- instr(str,des_str) -- 可以實現like功能 select instr(hello,g),instr(hello,h),instr(hello,l) from dual; -- decode(value,s1,r1,s2,r2,default) -- 類似于…

全排列算法及實現

轉載&#xff1a; 1.http://blog.csdn.net/hackbuteer1/article/details/6657435 2.http://blog.sina.com.cn/s/blog_9f7ea4390101101u.html 3.http://www.slyar.com/blog/stl_next_permutation.html 4.http://www.cplusplus.com/reference/algorithm/next_permutation/ 5…

ssh配置文件詳解

配置“/etc/ssh/sshd_config”文件 “/etc/ssh/sshd_config”是OpenSSH的配置文件&#xff0c;允許設置選項改變這個daemon的運行。這個文件的每一行包含“關鍵詞&#xff0d;值”的匹配&#xff0c;其中“關鍵詞”是忽略大小寫的。下面列出來的是最重要的關鍵詞&#xff0…

EC+VO+SCOPE for ES3

詞法環境 詞法作用域 詞法作用域&#xff08;lexcical scope&#xff09;。即JavaScript變量的作用域是在定義時決定而不是執行時決定&#xff0c;也就是說詞法作用域取決于源碼。 詞法環境 用于定義特定變量和函數標識符在ECMAScript代碼的詞法嵌套結構上的關聯關系&#xff0…

你真的會寫二分檢索嗎?

轉載&#xff1a;http://blog.chinaunix.net/uid-1844931-id-3337784.html 前幾天在論壇上看到有統計說有80%的程序員不能夠寫對簡單的二分法。二分法不是很簡單的嗎&#xff1f; 這難道不是聳人聽聞&#xff1f; 其實&#xff0c;二分法真的不那么簡單&#xff0c;尤其是二…

android listview動態加載網絡圖片不顯示,Android Listview異步動態加載網絡圖片

Android Listview異步動態加載網絡圖片詳見&#xff1a; http://blog.sina.com.cn/s/blog_62186b460100zsvb.html標簽&#xff1a; Android SDK代碼片段(5)[代碼] (1)定義類MapListImageAndText管理ListViewItem中控件的內容01 package com.google.zxing.client.android.AsyncL…

C#-面向對象的多態思想 ---ShinePans

總結: 多態是面向對象的核心.---------能夠理解為一個方法,多種實現, 在這里能夠用虛方法,抽象類,接口能夠實現多態 1.首先利用接口來實現多態: 接口相當于"功能,"接口能夠實現多繼承,分為 顯式實現接口和隱式實現接口 keyword為interface格式: interface 接口名 { …

wxpy 0.1.2微信機器人 / 優雅的微信個人號API

微信機器人 / 優雅的微信個人號API&#xff0c;基于 itchat&#xff0c;全面優化接口&#xff0c;更有 Python 范兒。用來干啥一些常見的場景控制路由器、智能家居等具有開放接口的玩意兒跑腳本時自動把日志發送到你的微信加群主為好友&#xff0c;自動拉進群中跨號或跨群轉發消…

c++中try catch的用法

在c中&#xff0c;可以直接拋出異常之后自己進行捕捉處理&#xff0c;如&#xff1a;&#xff08;這樣就可以在任何自己得到不想要的結果的時候進行中斷&#xff0c;比如在進行數據庫事務操作的時候&#xff0c;如果某一個語句返回SQL_ERROR則直接拋出異常&#xff0c;在catch塊…

const in c and cpp

http://c-faq.com/ansi/constasconst.html 轉載于:https://www.cnblogs.com/invisible/p/3333575.html