【TensorFlow】——實現minist數據集分類的前向傳播(常規神經網絡非卷積神經網絡)

目錄

一、常規神經網絡模型

二、TensorFlow實現前向傳播步驟

1、讀取數據集

2、batch劃分

3、根據神經網絡每一層的神經元個數來初始化參數w,b

4、進行每一層輸入輸出的計算

5、對每一層的輸出進行非線性relu函數變換

6、計算一個batch訓練后的誤差loss

7、計算每一次loss對參數的梯度

8、根據梯度進行參數的迭代

三、常見錯誤糾錯

1、tf.Variable()忘記使用——將需要求導的參數進行該操作,系統會自動記錄導數的變化

2、迭代后的參數會自動變成tensor,而不是variable進而報錯

3、梯度爆炸的解決——將初始化參數時的方差改小

4、幾個循環


一、常規神經網絡模型

二、TensorFlow實現前向傳播步驟

這里以UCI中的手寫數字集作為數據訓練集,假設神經網絡層數有4層

輸入層:1

隱層:2

輸出層:1

按照batch的方式進行訓練,一個batch含有128組數據

一個batch在神經網絡中訓練的shape變換如下:

x【128,28,28】>>>reshape>>>輸入:【128,784】>>>隱層1:【128,256】>>>隱層2:【128,128】>>>輸出:out【128,10】

y【128,】>>>one_hot>>>【128,10】

一個batch的loss:【128,10】

loss = (y-out)^2

1、讀取數據集

?

?

2、batch劃分

因為minis數據集數據量龐大,如果一個一個樣本進行訓練會非常耗時,因此將一定數量的樣本組合成一個batch,每次對一個batch進行訓練,這樣會提高訓練效率,又不會影響訓練出來神經網絡的準確性

3、根據神經網絡每一層的神經元個數來初始化參數w,b

每一層的w的個數為:上一層神經元數*下一層神經元數

每一層的b的個數為:當前層的神經元個數

4、進行每一層輸入輸出的計算

5、對每一層的輸出進行非線性relu函數變換

6、計算一個batch訓練后的誤差loss

7、計算每一次loss對參數的梯度

利用TensorFlow求解loss對各個參數進行求導時,必須將輸入輸出的求解以及loss的求解放在上圖紅色框的內部

8、根據梯度進行參數的迭代

三、常見錯誤糾錯

1、tf.Variable()忘記使用——將需要求導的參數進行該操作,系統會自動記錄導數的變化

2、迭代后的參數會自動變成tensor,而不是variable進而報錯

這樣的話我們就需要利用一個函數,使得迭代變量參數的值發生改變但是對象不會發生改變

?

3、梯度爆炸的解決——將初始化參數時的方差改小

梯度爆炸就是指梯度突然非常大,導致后面進行后向傳播時,loss不斷地增大,得不到最優參數解

?

?

?

4、幾個循環

本文來自互聯網用戶投稿,該文觀點僅代表作者本人,不代表本站立場。本站僅提供信息存儲空間服務,不擁有所有權,不承擔相關法律責任。
如若轉載,請注明出處:http://www.pswp.cn/news/256315.shtml
繁體地址,請注明出處:http://hk.pswp.cn/news/256315.shtml
英文地址,請注明出處:http://en.pswp.cn/news/256315.shtml

如若內容造成侵權/違法違規/事實不符,請聯系多彩編程網進行投訴反饋email:809451989@qq.com,一經查實,立即刪除!

相關文章

大道至簡第二章

懶人造就了方法 開頭說的,有一個人叫李冰也要移山,可是他卻要用和愚公截然不同的方法,那就是用“燒”的方法來碎石,那么這樣的好處就是省力。那么他又是怎樣想到的辦法的呢,就是生活中仔細觀察他老婆做飯時水溢出是石頭…

C# 回調函數詳解

回調和回調函數是什么 軟件模塊之間存在著接口,而回調是一種雙向調用模式,被調用方在接口被調用時也會調用對方的接口。 對于一般的結構化語言,可以通過回調函數來實現回調。回調函數是一個函數或過程,是一個由調用方自己實現&am…

神經網絡(11)--具體實現:unrolling parameters

我們需要將parameters從矩陣unrolling到向量,這樣我們就可以使用adanced optimization routines. unroll into vectors costFunction與fminunc里面的theta都是n1維的向量,costFunction的返回值gradient也是n1維的向量。 但是當我們使用神經網絡時&#x…

[轉]ASP.Net篇之Session與Cookie

本文轉自:http://www.cnblogs.com/japanbbq/archive/2011/08/31/2160494.html Session: Session是“會話”的意思,然而,因為http協議是無狀態的,那么每次客戶端請求服務器端,服務器端都會以“嶄新”的頁面展示給客戶端…

C# 接口詳解

概念 接口描述的是可屬于任何類或結構的一組相關行為,所以實現接口的類或結構必須實現接口定義中指定的接口成員。 定義:使用interface 關鍵字,由方法、屬性、事件、索引器或這四種成員類型的任意組合構成。另可使用new、public、protected、…

js學習之地圖生成

首先,上地圖圖片 接著,js,我們可以把圖片看成一塊塊32*32像素的 var i; var j;window.onload function () {gamemap(15, 10, 10, "map.jpg"); }var mapimg new Image(); var map [[18, 18, 18, 18, 18, 18, 18, 18, 18, 18, 18,…

linux性能分析常用的命令

1,uptime 查看系統負責2,more 分頁查看文件,enter顯示下一行,空格顯示下一頁,F顯示下一屏,B顯示上一屏內容。3,top命令查看系統情況,按shif H可以查看當前線程的負載。4&#xff0…

C#中Console.ReadKey()與ConsoleKey的一些用法

1.控制臺程序不讓窗口閃過 對于控制臺程序,Console.ReadKey()可以使窗口停留一下,直到點擊鍵盤任一鍵為止。 2.通過按鍵進行選擇 key Console.ReadKey(true).Key;if (key ConsoleKey.S){ Console.Write("Input the message:…

【TensorFlow】——Windows10、pycharm、Python3.6.4中安裝CPU和GPU兩種版本的TensorFlow

tensorflow分為兩種,一種是cpu版本,一種是gpu版本 CPU版本可以直接通過pip進行安裝: 這里是在國內鏡像源中進行的下載,下載的版本是2.2.0版本 pip --default-timeout1000 install tensorflow-cpu2.2.0 -i http://pypi.douban.c…

vsftpd.conf 詳解與實例配置

#################匿名權限控制############### anonymous_enableYES   #是否啟用匿名用戶 no_anon_passwordYES   #匿名用戶login時不詢問口令 下面這四個主要語句控制這文件和文件夾的上傳、下載、創建、刪除和重命名。 anon_upload_enable(yes/no)…

下拉框選擇

1&#xff0c;簡單下拉框 <!DOCTYPE html> <html> <head lang"en"><meta charset"UTF-8" ><meta name"viewport" content"widthdevice-width, initial-scale1, user-scalableno, minimal-ui, maximum-scale1&qu…

基于C#的TCP/IP協議應用(一)

一、背景與概念 1.標準以太網 以太網是美國Xerox&#xff08;施樂&#xff09;公司的Palo Alto研究中心于1975年研制成功的&#xff0c;其核心技術起源于ALOHA網。目前以太網是指符合IEEE 802.3標準的局域網(LAN)產品組&#xff0c;其中IEEE 802.3是一組電氣與電子工程師協會…

WORD文檔的超鏈接無法打開——“由于本機的限制該操作已被取消”的解決方法

之前我電腦還很正常&#xff0c;最近裝了一個打印機后&#xff0c;放在word文檔的文字超鏈接就打不開了&#xff0c;提示說“由于本機的限制該操作已被取消”&#xff0c;請各位高手指導下該怎樣解決這個問題&#xff1f; WORD文檔的超鏈接無法打開的原因是文件在插入超鏈接之…

廣義表的實現

廣義表是一種非線性表的數據結構&#xff0c;是線性表的一種推廣。他放松了對原子的控制&#xff0c;容許原子有自身的結構。其實現如下&#xff1a; #include<iostream>using namespace std;#include<assert.h>enum Type //原子類型有三種:頭結點&#xff0c…

C#中List列表與Datagridview的用法

初始化 創建空列表 List<int> List new List<int>();2.使用var類型的前提是預先知道變量的類型&#xff0c;會根據變量賦值來判定屬于什么類型&#xff0c;但此種賦值方法只能給局部變量賦值。 var list1 new List<string>();具體見&#xff1a; C#列表L…

Byte和byte[]數組

Byte和byte[]數組&#xff0c;“表示一個 8 位無符號整數, 一般為8位二進制數”。 Byte是計算機最基礎的存儲單位和最基礎的通訊單位。 而所有的類型都是支持由byte[]類型轉換而來。 為什么說Byte是最基礎類型那&#xff0c; 其實這里的關鍵所在是&#xff0c;計算機最基礎的算…

【圖像處理】——opencv常用函數

目錄 讀取圖像 注意: 1、imread和plt.show以及pil.image,show的區別: 2、imread中的rgb的順序 顯示圖像

網絡協議:TCP/IP、SOCKET、HTTP

網絡七層 由下往上分別為物理層、數據鏈路層、網絡層、傳輸層、會話層、表示層和應用層。其中物理層、數據鏈路層和網絡層通常被稱作媒體層&#xff0c;是網絡工程師所研究的對象&#xff1b;傳輸層、會話層、表示層和應用層則被稱作主機層&#xff0c;是用戶所面向和關心的內…

halcon自標定

概念 該算法可以在不使用標定板的情況下計算相機內參&#xff0c;從而進行畸變校正&#xff0c;適用于畸變較大的情況。算法很簡單&#xff1a; 1.求出圖像邊緣應進行分割。 2.基于篩選線段的自標定radial_distortion_self_calibration。 3.得到標定區域。 4.根據指定的徑向畸…