python 邏輯回歸準確率是1,Python利用邏輯回歸模型解決MNIST手寫數字識別問題詳解...

本文實例講述了Python利用邏輯回歸模型解決MNIST手寫數字識別問題。分享給大家供大家參考，具體如下：

1、MNIST手寫識別問題

MNIST手寫數字識別問題：輸入黑白的手寫阿拉伯數字，通過機器學習判斷輸入的是幾。可以通過TensorFLow下載MNIST手寫數據集，通過import引入MNIST數據集并進行讀取，會自動從網上下載所需文件。

%matplotlib inline

import tensorflow as tf

import tensorflow.examples.tutorials.mnist.input_data as input_data

mnist=input_data.read_data_sets('MNIST_data/',one_hot=True)

import matplotlib.pyplot as plt

def plot_image(image): #圖片顯示函數

plt.imshow(image.reshape(28,28),cmap='binary')

plt.show()

print("訓練集數量：",mnist.train.num_examples,

"特征值組成：",mnist.train.images.shape,

"標簽組成：",mnist.train.labels.shape)

batch_images,batch_labels=mnist.train.next_batch(batch_size=10) #批量讀取數據

print(batch_images.shape,batch_labels.shape)

print('標簽值：',np.argmax(mnist.train.labels[1000]),end=' ') #np.argmax()得到實際值

print('獨熱編碼表示：',mnist.train.labels[1000])

plot_image(mnist.train.images[1000]) #顯示數據集中第1000張圖片

輸出訓練集的數量有55000個，并打印特征值的shape為(55000,784)，其中784代表每張圖片由28*28個像素點組成，由于是黑白圖片，每個像素點只有黑白單通道，即通過784個數可以描述一張圖片的特征值。可以將圖片在Jupyter中輸出，將784個特征值reshape為28×28的二維數組，傳給plt.imshow()函數，之后再通過show()輸出。

MNIST提供next_batch()方法用于批量讀取數據集，例如上面批量讀取10個對應的images與labels數據并分別返回。該方法會按順序一直往后讀取，直到結束后會自動打亂數據，重新繼續讀取。

在打開mnist數據集時，第二個參數設置one_hot，表示采用獨熱編碼方式打開。獨熱編碼是一種稀疏向量，其中一個元素為1，其他元素均為0，常用于表示有限個可能的組合情況。例如數字6的獨熱編碼為第7個分量為1，其他為0的數組。可以通過np.argmax()函數返回數組最大值的下標，即獨熱編碼表示的實際數字。通過獨熱編碼可以將離散特征的某個取值對應歐氏空間的某個點，有利于機器學習中特征之間的距離計算

數據集的劃分，一種劃分為訓練集用于模型的訓練，測試集用于結果的測試，要求集合數量足夠大，而且具有代表性。但是在多次執行后，會導致模型向測試集數據進行擬合，從而導致測試集數據失去了測試的效果。因此將數據集進一步劃分為訓練集、驗證集、測試集，將訓練后的模型用驗證集驗證，當多次迭代結束之后再拿測試集去測試。MNIST數據集中的訓練集為mnist.train，驗證集為mnist.validation，測試集為mnist.test

2、邏輯回歸

與線性回歸相對比，房價預測是根據多個輸入參數x與對應權重w相乘再加上b得到線性的輸出房價。而還有許多問題的輸出是非線性的、控制在[0,1]之間的，比如判斷郵件是否為垃圾郵件，手寫數字為0~9等，邏輯回歸就是用于處理此類問題。例如電子郵件分類器輸出0.8，表示該郵件為垃圾郵件的概率是0.8.

邏輯回歸通過Sigmoid函數保證輸出的值在[0,1]之間，該函數可以將全體實數映射到[0,1]，從而將線性的輸出轉換為[0,1]的數。其定義與圖像如下：

在邏輯回歸中如果采用均方差的損失函數，帶入sigmoid會得到一個非凸函數，這類函數會有多個極小值，采用梯度下降法便無法求得最優解。因此在邏輯回歸中采用對數損失函數

，其中y是特征值x的標簽，y'是預測值。

在手寫數字識別中，通過單層神經元產生連續的輸出值y，將y再輸入到softmax層處理，經過函數計算將結果映射為0~9每個數字對應的概率，概率越大表示該圖片越像某個數字，所有數字的概率之和為1

交叉熵損失函數：交叉熵用于刻畫兩個概率分布之間的距離

，其中p代表正確答案，q代表預測值，交叉熵越小距離越近，從而模型的預測越準確。例如正確答案為(1,0,0)，甲模型預測為(0.5,0.2,0.3)，其交叉熵=-1*log0.5≈0.3，乙模型(0.7,0.1,0.2)，其交叉熵=-1*log0.7≈0.15，所以乙模型預測更準確

模型的訓練

首先定義二維浮點數占位符x、y，以及二維參數變量W、b并隨機賦初值。之后定義前向計算為向量x與W對應叉乘再加b，并將得到的線性結果經過softmax處理得到獨熱編碼預測值。

之后定義準確率accuracy，其值為預測值pred與真實值y相等個數來衡量

接下來初始化變量、設置超參數，并定義損失函數、優化器，之后開始訓練。每輪訓練中分批次讀取數據進行訓練，每輪訓練結束后輸出損失與準確率。

import numpy as np

import tensorflow as tf

import tensorflow.examples.tutorials.mnist.input_data as input_data

mnist=input_data.read_data_sets('MNIST_data/',one_hot=True)

import matplotlib.pyplot as plt

#定義占位符、變量、前向計算

x=tf.placeholder(tf.float32,[None,784],name='x')

y=tf.placeholder(tf.float32,[None,10],name='y')

W=tf.Variable(tf.random_normal([784,10]),name='W')

b=tf.Variable(tf.zeros([10]),name='b')

forward=tf.matmul(x,W)+b

pred=tf.nn.softmax(forward) #通過softmax將線性結果分類處理

#計算預測值與真實值的匹配個數

correct_prediction=tf.equal(tf.argmax(pred,1),tf.argmax(y,1))

#將上一步得到的布爾值轉換為浮點數，并求平均值，得到準確率

accuracy=tf.reduce_mean(tf.cast(correct_prediction,tf.float32))

ss=tf.Session()

init=tf.global_variables_initializer()

ss.run(init)

#超參數設置

train_epochs=50

batch_size=100 #每個批次的樣本數

batch_num=int(mnist.train.num_examples/batch_size) #一輪需要訓練多少批

learning_rate=0.01

#定義交叉熵損失函數、梯度下降優化器

loss_function=tf.reduce_mean(-tf.reduce_sum(y*tf.log(pred),reduction_indices=1))

optimizer=tf.train.GradientDescentOptimizer(learning_rate).minimize(loss_function)

for epoch in range(train_epochs):

for batch in range(batch_num): #分批次讀取數據進行訓練

xs,ys=mnist.train.next_batch(batch_size)

ss.run(optimizer,feed_dict={x:xs,y:ys})

#每輪訓練結束后通過帶入驗證集的數據，檢測模型的損失與準去率

loss,acc=ss.run([loss_function,accuracy],\

feed_dict={x:mnist.validation.images,y:mnist.validation.labels})

print('第%2d輪訓練：損失為：%9f，準確率：%.4f'%(epoch+1,loss,acc))

從每輪訓練結果可以看出損失在逐漸下降，準確率在逐步上升。

結果預測

使用訓練好的模型對測試集中的數據進行預測，即將mnist.test.images數據帶入去求pred的值。

為了使結果更便于顯示，可以借助plot函數庫將圖片數據顯示出來，并配以文字label與predic的值。首先通過plt.gcf()得到一副圖像資源并設置其大小。再通過plt.subplot(5,5,index+1)函數將其劃分為5×5個子圖，遍歷第index+1個子圖，分別將圖像資源繪制到子圖，通過set_title()設置每個子圖的title顯示內容。子圖繪制結束后顯示整個圖片，并調用函數傳入圖片、標簽、預測值等參數。

prediction=ss.run(tf.argmax(pred,1),feed_dict={x:mnist.test.images})

def show_result(images,labels,prediction,index,num=10): #繪制圖形顯示預測結果

pic=plt.gcf() #獲取當前圖像

pic.set_size_inches(10,12) #設置圖片大小

for i in range(0,num):

sub_pic=plt.subplot(5,5,i+1) #獲取第i個子圖

#將第index個images信息顯示到子圖上

sub_pic.imshow(np.reshape(images[index],(28,28)),cmap='binary')

title="label:"+str(np.argmax(labels[index])) #設置子圖的title內容

if len(prediction)>0:

title+=",predict:"+str(prediction[index])

sub_pic.set_title(title,fontsize=10)

sub_pic.set_xticks([]) #設置x、y坐標軸不顯示

sub_pic.set_yticks([])

index+=1

plt.show()

show_result(mnist.test.images,mnist.test.labels,prediction,10)

運行結果如下，可以看到預測的結果大多準確

更多關于Python相關內容感興趣的讀者可查看本站專題：《Python數據結構與算法教程》、《Python加密解密算法與技巧總結》、《Python編碼操作技巧總結》、《Python函數使用技巧總結》、《Python字符串操作技巧匯總》及《Python入門與進階經典教程》

希望本文所述對大家Python程序設計有所幫助。

本文來自互聯網用戶投稿，該文觀點僅代表作者本人，不代表本站立場。本站僅提供信息存儲空間服務，不擁有所有權，不承擔相關法律責任。
如若轉載，請注明出處：http://www.pswp.cn/news/533195.shtml
繁體地址，請注明出處：http://hk.pswp.cn/news/533195.shtml
英文地址，請注明出處：http://en.pswp.cn/news/533195.shtml

如若內容造成侵權/違法違規/事實不符，請聯系多彩編程網進行投訴反饋email:809451989@qq.com，一經查實，立即刪除！