神經網絡(11)--具體實現:unrolling parameters

神經網絡(11)--具體實現:unrolling parameters

news/2025/9/18 10:45:38/文章來源:https://blog.csdn.net/weixin_30493401/article/details/97582251

我們需要將parameters從矩陣unrolling到向量，這樣我們就可以使用adanced optimization routines.

unroll into vectors

costFunction與fminunc里面的theta都是n+1維的向量，costFunction的返回值gradient也是n+1維的向量。

但是當我們使用神經網絡時，我們的Θ和gradient都是一個矩陣，而不是一個向量.在這兒我們的目標是將這些矩陣展開為向量，這樣就可以使用上面的這兩個函數了。

如何unroll成向量的例子

如上圖所示，我們可以將矩陣轉換為向量（thetaVec and DVec are big long vector），也可以將向量利用reshape變為矩陣。

具體的unrolling如何工作的

?

?在costFunction中，我們會從thetaVec中得到Θ⁽¹⁾,Θ⁽²⁾,Θ⁽³⁾,，這樣方便我們計算后面所需要的D⁽¹⁾,D⁽²⁾,D⁽³⁾,和J(Θ);

然后再將這些D⁽¹⁾,D⁽²⁾,D⁽³⁾unroll to 得到gradientVec進行返回。

?

總結(什么時候使用矩陣，什么時候使用向量)

使用矩陣的情況: 當做forward propagation?和 back propagation時，我們需要使用矩陣來計算,這里就需要用reshape來構建矩陣。

使用向量的情況: 當使用fminunc這些advanced算法的時候，這些函數的參數是向量，這時我們需要將矩陣轉化為向量來計算。

?

轉載于:https://www.cnblogs.com/yan2015/p/5023847.html

本文來自互聯網用戶投稿，該文觀點僅代表作者本人，不代表本站立場。本站僅提供信息存儲空間服務，不擁有所有權，不承擔相關法律責任。
如若轉載，請注明出處：http://www.pswp.cn/news/256312.shtml
繁體地址，請注明出處：http://hk.pswp.cn/news/256312.shtml
英文地址，請注明出處：http://en.pswp.cn/news/256312.shtml

如若內容造成侵權/違法違規/事實不符，請聯系多彩編程網進行投訴反饋email:809451989@qq.com，一經查實，立即刪除！

相關文章

[轉]ASP.Net篇之Session與Cookie

[轉]ASP.Net篇之Session與Cookie

本文轉自：http://www.cnblogs.com/japanbbq/archive/2011/08/31/2160494.html Session: Session是“會話”的意思，然而，因為http協議是無狀態的，那么每次客戶端請求服務器端，服務器端都會以“嶄新”的頁面展示給客戶端…

閱讀更多...

【TensorFlow】——合并與分割（stack、concat、split）

【TensorFlow】——合并與分割（stack、concat、split）

閱讀更多...

C# 接口詳解

C# 接口詳解

概念接口描述的是可屬于任何類或結構的一組相關行為，所以實現接口的類或結構必須實現接口定義中指定的接口成員。定義：使用interface 關鍵字，由方法、屬性、事件、索引器或這四種成員類型的任意組合構成。另可使用new、public、protected、…

閱讀更多...

js學習之地圖生成

js學習之地圖生成

首先，上地圖圖片接著，js，我們可以把圖片看成一塊塊32*32像素的 var i; var j;window.onload function () {gamemap(15, 10, 10, "map.jpg"); }var mapimg new Image(); var map [[18, 18, 18, 18, 18, 18, 18, 18, 18, 18, 18,…

閱讀更多...

linux性能分析常用的命令

linux性能分析常用的命令

1，uptime 查看系統負責2，more 分頁查看文件，enter顯示下一行，空格顯示下一頁，F顯示下一屏，B顯示上一屏內容。3，top命令查看系統情況，按shif H可以查看當前線程的負載。4&#xff0…

閱讀更多...

C#中Console.ReadKey()與ConsoleKey的一些用法

C#中Console.ReadKey()與ConsoleKey的一些用法

1.控制臺程序不讓窗口閃過對于控制臺程序，Console.ReadKey()可以使窗口停留一下，直到點擊鍵盤任一鍵為止。 2.通過按鍵進行選擇 key Console.ReadKey(true).Key;if (key ConsoleKey.S){ Console.Write("Input the message:…

閱讀更多...

【TensorFlow】——Windows10、pycharm、Python3.6.4中安裝CPU和GPU兩種版本的TensorFlow

【TensorFlow】——Windows10、pycharm、Python3.6.4中安裝CPU和GPU兩種版本的TensorFlow

tensorflow分為兩種，一種是cpu版本，一種是gpu版本 CPU版本可以直接通過pip進行安裝： 這里是在國內鏡像源中進行的下載，下載的版本是2.2.0版本 pip --default-timeout1000 install tensorflow-cpu2.2.0 -i http://pypi.douban.c…

閱讀更多...

vsftpd.conf 詳解與實例配置

vsftpd.conf 詳解與實例配置

#################匿名權限控制############### anonymous_enableYES　　 #是否啟用匿名用戶 no_anon_passwordYES 　　#匿名用戶login時不詢問口令下面這四個主要語句控制這文件和文件夾的上傳、下載、創建、刪除和重命名。 anon_upload_enable（yes/no)…

閱讀更多...

下拉框選擇

下拉框選擇

1，簡單下拉框 <!DOCTYPE html> <html> <head lang"en"><meta charset"UTF-8" ><meta name"viewport" content"widthdevice-width, initial-scale1, user-scalableno, minimal-ui, maximum-scale1&qu…

閱讀更多...

基于C#的TCP/IP協議應用（一）

基于C#的TCP/IP協議應用（一）

一、背景與概念 1.標準以太網以太網是美國Xerox（施樂）公司的Palo Alto研究中心于1975年研制成功的，其核心技術起源于ALOHA網。目前以太網是指符合IEEE 802.3標準的局域網(LAN)產品組，其中IEEE 802.3是一組電氣與電子工程師協會…

閱讀更多...

WORD文檔的超鏈接無法打開——“由于本機的限制該操作已被取消”的解決方法

WORD文檔的超鏈接無法打開——“由于本機的限制該操作已被取消”的解決方法

之前我電腦還很正常，最近裝了一個打印機后，放在word文檔的文字超鏈接就打不開了，提示說“由于本機的限制該操作已被取消”，請各位高手指導下該怎樣解決這個問題？ WORD文檔的超鏈接無法打開的原因是文件在插入超鏈接之…

閱讀更多...

廣義表的實現

廣義表的實現

廣義表是一種非線性表的數據結構，是線性表的一種推廣。他放松了對原子的控制，容許原子有自身的結構。其實現如下： #include<iostream>using namespace std;#include<assert.h>enum Type //原子類型有三種:頭結點&#xff0c…

閱讀更多...

C#中List列表與Datagridview的用法

C#中List列表與Datagridview的用法

初始化創建空列表 List<int> List new List<int>();2.使用var類型的前提是預先知道變量的類型，會根據變量賦值來判定屬于什么類型，但此種賦值方法只能給局部變量賦值。 var list1 new List<string>();具體見： C#列表L…

閱讀更多...

Byte和byte[]數組

Byte和byte[]數組

Byte和byte[]數組，“表示一個 8 位無符號整數, 一般為8位二進制數”。 Byte是計算機最基礎的存儲單位和最基礎的通訊單位。而所有的類型都是支持由byte[]類型轉換而來。為什么說Byte是最基礎類型那， 其實這里的關鍵所在是，計算機最基礎的算…

閱讀更多...

【圖像處理】——opencv常用函數

【圖像處理】——opencv常用函數

目錄讀取圖像注意： 1、imread和plt.show以及pil.image,show的區別： 2、imread中的rgb的順序顯示圖像

閱讀更多...

網絡協議：TCP/IP、SOCKET、HTTP

網絡協議：TCP/IP、SOCKET、HTTP

網絡七層由下往上分別為物理層、數據鏈路層、網絡層、傳輸層、會話層、表示層和應用層。其中物理層、數據鏈路層和網絡層通常被稱作媒體層，是網絡工程師所研究的對象；傳輸層、會話層、表示層和應用層則被稱作主機層，是用戶所面向和關心的內…

閱讀更多...

halcon自標定

halcon自標定

概念該算法可以在不使用標定板的情況下計算相機內參，從而進行畸變校正，適用于畸變較大的情況。算法很簡單： 1.求出圖像邊緣應進行分割。 2.基于篩選線段的自標定radial_distortion_self_calibration。 3.得到標定區域。 4.根據指定的徑向畸…

閱讀更多...

jdk動態代理

jdk動態代理

簡單的說，代理模式是在目標對象和訪問對象之間增加了一層代理對象，所有的訪問對象通過代理對象來實現對目標對象的調用。代理對象和目標對象實現同一個接口，由代理對象來調用目標對象，對于外部來說，代理對象就可以替代…

閱讀更多...

【圖像處理】——圖像的灰度化處理（Python實現三種方法——最大值法、平均值法、加權均值法、gamma校正）

【圖像處理】——圖像的灰度化處理（Python實現三種方法——最大值法、平均值法、加權均值法、gamma校正）

目錄一、什么是圖像的灰度化？二、灰度化的幾種方法（最大值法、平均值法、加權均值法、gamma校正）

閱讀更多...

配置https

配置https

引子： 最近在一篇文章中了解到EFF(電子前哨基金會)為了推廣https協議，成立了一個letsencrypt項目，可以發放免費的證書，此證書可以被大多數主流瀏覽器所信任，這個邪惡的念頭一爆發，就讓我走上了一條坎坷的不…

閱讀更多...

最新文章