【TensorFlow】——實現minist數據集分類的前向傳播（常規神經網絡非卷積神經網絡）

news/2025/9/18 10:24:02/文章來源:https://blog.csdn.net/qq_45769063/article/details/106869332

目錄

一、常規神經網絡模型

二、TensorFlow實現前向傳播步驟

1、讀取數據集

2、batch劃分

3、根據神經網絡每一層的神經元個數來初始化參數w,b

4、進行每一層輸入輸出的計算

5、對每一層的輸出進行非線性relu函數變換

6、計算一個batch訓練后的誤差loss

7、計算每一次loss對參數的梯度

8、根據梯度進行參數的迭代

三、常見錯誤糾錯

1、tf.Variable()忘記使用——將需要求導的參數進行該操作，系統會自動記錄導數的變化

2、迭代后的參數會自動變成tensor，而不是variable進而報錯

3、梯度爆炸的解決——將初始化參數時的方差改小

4、幾個循環

一、常規神經網絡模型

二、TensorFlow實現前向傳播步驟

這里以UCI中的手寫數字集作為數據訓練集，假設神經網絡層數有4層

輸入層：1

隱層：2

輸出層：1

按照batch的方式進行訓練，一個batch含有128組數據

一個batch在神經網絡中訓練的shape變換如下：

x【128,28,28】>>>reshape>>>輸入：【128,784】>>>隱層1：【128,256】>>>隱層2：【128,128】>>>輸出：out【128,10】

y【128，】>>>one_hot>>>【128,10】

一個batch的loss:【128,10】

loss = (y-out)^2

1、讀取數據集

?

?

2、batch劃分

因為minis數據集數據量龐大，如果一個一個樣本進行訓練會非常耗時，因此將一定數量的樣本組合成一個batch，每次對一個batch進行訓練，這樣會提高訓練效率，又不會影響訓練出來神經網絡的準確性

3、根據神經網絡每一層的神經元個數來初始化參數w,b

每一層的w的個數為：上一層神經元數*下一層神經元數

每一層的b的個數為：當前層的神經元個數

4、進行每一層輸入輸出的計算

5、對每一層的輸出進行非線性relu函數變換

6、計算一個batch訓練后的誤差loss

7、計算每一次loss對參數的梯度

利用TensorFlow求解loss對各個參數進行求導時，必須將輸入輸出的求解以及loss的求解放在上圖紅色框的內部

8、根據梯度進行參數的迭代

三、常見錯誤糾錯

1、tf.Variable()忘記使用——將需要求導的參數進行該操作，系統會自動記錄導數的變化

2、迭代后的參數會自動變成tensor，而不是variable進而報錯

這樣的話我們就需要利用一個函數，使得迭代變量參數的值發生改變但是對象不會發生改變

?

3、梯度爆炸的解決——將初始化參數時的方差改小

梯度爆炸就是指梯度突然非常大，導致后面進行后向傳播時，loss不斷地增大，得不到最優參數解

?

?

?

4、幾個循環

本文來自互聯網用戶投稿，該文觀點僅代表作者本人，不代表本站立場。本站僅提供信息存儲空間服務，不擁有所有權，不承擔相關法律責任。
如若轉載，請注明出處：http://www.pswp.cn/news/256315.shtml
繁體地址，請注明出處：http://hk.pswp.cn/news/256315.shtml
英文地址，請注明出處：http://en.pswp.cn/news/256315.shtml

如若內容造成侵權/違法違規/事實不符，請聯系多彩編程網進行投訴反饋email:809451989@qq.com，一經查實，立即刪除！

相關文章

大道至簡第二章

大道至簡第二章

懶人造就了方法開頭說的，有一個人叫李冰也要移山，可是他卻要用和愚公截然不同的方法，那就是用“燒”的方法來碎石，那么這樣的好處就是省力。那么他又是怎樣想到的辦法的呢，就是生活中仔細觀察他老婆做飯時水溢出是石頭…

閱讀更多...

C# 回調函數詳解

C# 回調函數詳解

回調和回調函數是什么軟件模塊之間存在著接口，而回調是一種雙向調用模式，被調用方在接口被調用時也會調用對方的接口。對于一般的結構化語言，可以通過回調函數來實現回調。回調函數是一個函數或過程，是一個由調用方自己實現&am…

閱讀更多...

神經網絡(11)--具體實現:unrolling parameters

神經網絡(11)--具體實現:unrolling parameters

我們需要將parameters從矩陣unrolling到向量，這樣我們就可以使用adanced optimization routines. unroll into vectors costFunction與fminunc里面的theta都是n1維的向量，costFunction的返回值gradient也是n1維的向量。但是當我們使用神經網絡時&#x…

閱讀更多...

[轉]ASP.Net篇之Session與Cookie

[轉]ASP.Net篇之Session與Cookie

本文轉自：http://www.cnblogs.com/japanbbq/archive/2011/08/31/2160494.html Session: Session是“會話”的意思，然而，因為http協議是無狀態的，那么每次客戶端請求服務器端，服務器端都會以“嶄新”的頁面展示給客戶端…

閱讀更多...

【TensorFlow】——合并與分割（stack、concat、split）

【TensorFlow】——合并與分割（stack、concat、split）

閱讀更多...

C# 接口詳解

C# 接口詳解

概念接口描述的是可屬于任何類或結構的一組相關行為，所以實現接口的類或結構必須實現接口定義中指定的接口成員。定義：使用interface 關鍵字，由方法、屬性、事件、索引器或這四種成員類型的任意組合構成。另可使用new、public、protected、…

閱讀更多...

js學習之地圖生成

js學習之地圖生成

首先，上地圖圖片接著，js，我們可以把圖片看成一塊塊32*32像素的 var i; var j;window.onload function () {gamemap(15, 10, 10, "map.jpg"); }var mapimg new Image(); var map [[18, 18, 18, 18, 18, 18, 18, 18, 18, 18, 18,…

閱讀更多...

linux性能分析常用的命令

linux性能分析常用的命令

1，uptime 查看系統負責2，more 分頁查看文件，enter顯示下一行，空格顯示下一頁，F顯示下一屏，B顯示上一屏內容。3，top命令查看系統情況，按shif H可以查看當前線程的負載。4&#xff0…

閱讀更多...

C#中Console.ReadKey()與ConsoleKey的一些用法

C#中Console.ReadKey()與ConsoleKey的一些用法

1.控制臺程序不讓窗口閃過對于控制臺程序，Console.ReadKey()可以使窗口停留一下，直到點擊鍵盤任一鍵為止。 2.通過按鍵進行選擇 key Console.ReadKey(true).Key;if (key ConsoleKey.S){ Console.Write("Input the message:…

閱讀更多...

【TensorFlow】——Windows10、pycharm、Python3.6.4中安裝CPU和GPU兩種版本的TensorFlow

【TensorFlow】——Windows10、pycharm、Python3.6.4中安裝CPU和GPU兩種版本的TensorFlow

tensorflow分為兩種，一種是cpu版本，一種是gpu版本 CPU版本可以直接通過pip進行安裝： 這里是在國內鏡像源中進行的下載，下載的版本是2.2.0版本 pip --default-timeout1000 install tensorflow-cpu2.2.0 -i http://pypi.douban.c…

閱讀更多...

vsftpd.conf 詳解與實例配置

vsftpd.conf 詳解與實例配置

#################匿名權限控制############### anonymous_enableYES　　 #是否啟用匿名用戶 no_anon_passwordYES 　　#匿名用戶login時不詢問口令下面這四個主要語句控制這文件和文件夾的上傳、下載、創建、刪除和重命名。 anon_upload_enable（yes/no)…

閱讀更多...

下拉框選擇

下拉框選擇

1，簡單下拉框 <!DOCTYPE html> <html> <head lang"en"><meta charset"UTF-8" ><meta name"viewport" content"widthdevice-width, initial-scale1, user-scalableno, minimal-ui, maximum-scale1&qu…

閱讀更多...

基于C#的TCP/IP協議應用（一）

基于C#的TCP/IP協議應用（一）

一、背景與概念 1.標準以太網以太網是美國Xerox（施樂）公司的Palo Alto研究中心于1975年研制成功的，其核心技術起源于ALOHA網。目前以太網是指符合IEEE 802.3標準的局域網(LAN)產品組，其中IEEE 802.3是一組電氣與電子工程師協會…

閱讀更多...

WORD文檔的超鏈接無法打開——“由于本機的限制該操作已被取消”的解決方法

WORD文檔的超鏈接無法打開——“由于本機的限制該操作已被取消”的解決方法

之前我電腦還很正常，最近裝了一個打印機后，放在word文檔的文字超鏈接就打不開了，提示說“由于本機的限制該操作已被取消”，請各位高手指導下該怎樣解決這個問題？ WORD文檔的超鏈接無法打開的原因是文件在插入超鏈接之…

閱讀更多...

廣義表的實現

廣義表的實現

廣義表是一種非線性表的數據結構，是線性表的一種推廣。他放松了對原子的控制，容許原子有自身的結構。其實現如下： #include<iostream>using namespace std;#include<assert.h>enum Type //原子類型有三種:頭結點&#xff0c…

閱讀更多...

C#中List列表與Datagridview的用法

C#中List列表與Datagridview的用法

初始化創建空列表 List<int> List new List<int>();2.使用var類型的前提是預先知道變量的類型，會根據變量賦值來判定屬于什么類型，但此種賦值方法只能給局部變量賦值。 var list1 new List<string>();具體見： C#列表L…

閱讀更多...

Byte和byte[]數組

Byte和byte[]數組

Byte和byte[]數組，“表示一個 8 位無符號整數, 一般為8位二進制數”。 Byte是計算機最基礎的存儲單位和最基礎的通訊單位。而所有的類型都是支持由byte[]類型轉換而來。為什么說Byte是最基礎類型那， 其實這里的關鍵所在是，計算機最基礎的算…

閱讀更多...

【圖像處理】——opencv常用函數

【圖像處理】——opencv常用函數

目錄讀取圖像注意： 1、imread和plt.show以及pil.image,show的區別： 2、imread中的rgb的順序顯示圖像

閱讀更多...

網絡協議：TCP/IP、SOCKET、HTTP

網絡協議：TCP/IP、SOCKET、HTTP

網絡七層由下往上分別為物理層、數據鏈路層、網絡層、傳輸層、會話層、表示層和應用層。其中物理層、數據鏈路層和網絡層通常被稱作媒體層，是網絡工程師所研究的對象；傳輸層、會話層、表示層和應用層則被稱作主機層，是用戶所面向和關心的內…

閱讀更多...

halcon自標定

halcon自標定

概念該算法可以在不使用標定板的情況下計算相機內參，從而進行畸變校正，適用于畸變較大的情況。算法很簡單： 1.求出圖像邊緣應進行分割。 2.基于篩選線段的自標定radial_distortion_self_calibration。 3.得到標定區域。 4.根據指定的徑向畸…

閱讀更多...

最新文章