為什么torch.nn.Linear的表達形式為y=xA^T+b而不是常見的y=Ax+b?

為什么torch.nn.Linear的表達形式為y=xA^T+b而不是常見的y=Ax+b?

news/2025/7/6 13:06:50/文章來源:https://wangcaiyong.blog.csdn.net/article/details/117769066

今天看代碼，對比了常見的公式表達與代碼的表達，發覺torch.nn.Linear的數學表達與我想象的有點不同，于是思索了一番。

眾多周知，torch.nn.Linear作為全連接層，將下一層的每個結點與上一層的每一節點相連，用來將前邊提取的特征綜合起來。具體如下：

則顯然可以得到： $Y=AX+b$ ,其中

$Y=\begin{pmatrix} y1\\ y2\\ \cdot\\ ym\\ \end{pmatrix}$ , $X=\begin{bmatrix} x1\\ x2\\ \cdot\\ xn \end{bmatrix}$ , $A=\begin{pmatrix} w11 & w12 & ... &w1n \\ w21&w22 &... & w2n\\ ..& .. & .. &.. \\ wm1 & wm2 & ...& wmn \end{pmatrix}$ , $b=\begin{pmatrix} b1\\ b2\\ \cdot\\ bm \end{pmatrix}$

上面的公式進行轉置后，得到， $Y^T=X^TA^T+b^T$

也就是將輸入和輸出向量都變成了行向量了。

在pytorch中，

實際上這里的x就是行向量，y也是行向量，A的行數與y（輸出）相關，列數與x（輸入）相關, b是一個行向量，與輸出維度有關。

這里可以看到，m作為一個全連接層，輸入為20維，輸出為30維，則可見A的規模為30x20(輸出規模x輸入規模)，

input作為一個輸入矩陣，規模為128x20,這里可見一般在一個tensor中，feature都是行優先，

這樣的話，使用m作用到input上，規模為128x20x(20x30)---->128x30.? 即為示例中結果。

注意下圖A和b的維度。

以上的分析照應了torch.nn.functional.linear的表達。

?

?

本文來自互聯網用戶投稿，該文觀點僅代表作者本人，不代表本站立場。本站僅提供信息存儲空間服務，不擁有所有權，不承擔相關法律責任。
如若轉載，請注明出處：http://www.pswp.cn/news/258482.shtml
繁體地址，請注明出處：http://hk.pswp.cn/news/258482.shtml
英文地址，請注明出處：http://en.pswp.cn/news/258482.shtml

如若內容造成侵權/違法違規/事實不符，請聯系多彩編程網進行投訴反饋email:809451989@qq.com，一經查實，立即刪除！

相關文章

Leetcode47: Palindrome Linked List

Leetcode47: Palindrome Linked List

Given a singly linked list, determine if it is a palindrome. 推斷一個鏈表是不是回文的，一個比較簡單的辦法是把鏈表每一個結點的值存在vector里。然后首尾比較。時間復雜度O(n)。空間復雜度O(n)。 /*** Definition for singly-linked list.* struct ListNode {…

閱讀更多...

內存顆粒位寬和容量_SDRAM的邏輯Bank與芯片容量表示方法

內存顆粒位寬和容量_SDRAM的邏輯Bank與芯片容量表示方法

1、邏輯Bank與芯片位寬講完SDRAM的外在形式，就該深入了解SDRAM的內部結構了。這里主要的概念就是邏輯Bank。簡單地說，SDRAM的內部是一個存儲陣列。因為如果是管道式存儲(就如排隊買票)，就很難做到隨機訪問了。陣列就如同表格一樣，…

閱讀更多...

[Unity菜鳥] Time

[Unity菜鳥] Time

1. Time.deltaTime 增量時間以秒計算，完成最后一幀的時間(秒)(只讀) 幀數所用的時間不是你能控制的。每一幀都不一樣，游戲一般都是每秒60幀，也就是updata方法調用60次（假如你按60幀來算而真實情況是不到60幀那么物體就不會運動…

閱讀更多...

【轉】七個例子幫你更好地理解 CPU 緩存

【轉】七個例子幫你更好地理解 CPU 緩存

我的大多數讀者都知道緩存是一種快速、小型、存儲最近已訪問的內存的地方。這個描述相當準確，但是深入處理器緩存如何工作的“枯燥”細節，會對嘗試理解程序性能有很大幫助。在這篇博文中，我將通過示例代碼來說明緩存是如何工作的，…

閱讀更多...

Pytorch——對應點相乘和矩陣相乘

Pytorch——對應點相乘和矩陣相乘

1. 點乘，對應元素相乘，不求和 import torcha torch.Tensor([[1,2], [3,4], [5,6]]) b1 a.mul(a)// b2a*a b1 Out[79]: tensor([[ 1., 4.],[ 9., 16.],[25., 36.]]) b2 Out[80]: tensor([[ 1., 4.],[ 9., 16.],[25., 36.]]) 以上兩種方法都可以表…

閱讀更多...

mysql初始化錯誤【一】Can't find error-message file '/usr/local/mysql/errmsg.sys'

mysql初始化錯誤【一】Can't find error-message file '/usr/local/mysql/errmsg.sys'

環境：CentOS 7.2MySQL 5.7.18從mysql官方網站下載rpm包到服務器本地，依次安裝下面的RPM包：mysql-community-common-5.7.18-1.el7.x86_64.rpmmysql-community-server-5.7.18-1.el7.x86_64.rpmmysql-community-client-5.7.18-1.el7.x86_64.rpmm…

閱讀更多...

雙極型adc與stm32_關于STM32 雙ADC同步規則轉換兩路數據的問題？

雙極型adc與stm32_關于STM32 雙ADC同步規則轉換兩路數據的問題？

因系統要求需升級ADC的采樣方式(以前方式：掃描方式，TIMER2觸發ADC軟啟動，2通道規則序列，DMA傳完中斷)，為了進一步實現兩路信號的同步性能，采樣STM32 雙ADC同步規則轉換。(timer2觸發ADC軟啟動，2…

閱讀更多...

面試金典--11.5

面試金典--11.5

題目描述：給定排序后的字符串數組，中間有一些空串，要求找到給定字符串的位置思路： （1）遍歷，最慢的 （2）二分查找，當mid處為空串，就找到最近的非空…

閱讀更多...

win10 平臺VS2019最簡安裝實現C++/C開發

win10 平臺VS2019最簡安裝實現C++/C開發

這兩天一直在安裝vs2015,總是卡在visual studio 2015 出現安裝包丟失或損壞的現象，盡管按照網上很多方法嘗試解決，但是一直不行。算了。還是使用最新版的VS 2019安裝，沒想到很順利。下面總結一下在win10平臺上最簡安裝VS2019，實…

閱讀更多...

Hook的兩個小插曲

Hook的兩個小插曲

看完了前面三篇文章后，這里我們來一個小插曲~~~~ 第一個小插曲。是前面文章一個CM精靈的分析。我們這里使用hook代碼來搞定。第二個小插曲，是如今一些游戲，都有了支付上限，比如每天僅僅能花20塊錢來購買。好了。以下我們分開敘述…

閱讀更多...

### C++總結-[類成員函數]

### C++總結-[類成員函數]

C類中的常見函數。 #author: gr #date: 2015-07-23 #email: forgeruigmail.com 一、constructor, copy constructor, copy assignment, destructor 1. copy constructor必須傳引用，傳值編譯器會報錯 2. operator 返回值為引用，為了…

閱讀更多...

微信小程序和vue雙向綁定哪里不一樣_個人理解Vue和React區別

微信小程序和vue雙向綁定哪里不一樣_個人理解Vue和React區別

本文轉載自掘金，作者：binbinsilk，監聽數據變化的實現原理不同Vue 通過 getter/setter 以及一些函數的劫持，能精確知道數據變化，不需要特別的優化就能達到很好的性能React 默認是通過比較引用的方式進行的，如…

閱讀更多...

JS 省，市，區

JS 省，市，區

1 // 純JS省市區三級聯動2 // 2011-11-30 by http://www.cnblogs.com/zjfree3 var addressInit function (_cmbProvince, _cmbCity, _cmbArea, defaultProvince, defaultCity, defaultArea) {4 var cmbProvince document.getElementById(_cmbProvince);5 var cmbCity…

閱讀更多...

使用極鏈/AutoDL云服務器復盤caffe安裝

使用極鏈/AutoDL云服務器復盤caffe安裝

繼上一次倒騰caffe安裝以后，因為博士畢業等原因，舊的服務器已經不能再使用，最近因論文等原因，不得不繼續來安裝一下我的caffe。這次運氣比較好，經歷了一晚上和一早上的痛苦之后，最終安裝成功了，…

閱讀更多...

ibatis中使用List作為傳入參數的使用方法及 CDATA使用

ibatis中使用List作為傳入參數的使用方法及 CDATA使用

ibatis中list做回參很簡單，resultClass設為list中元素類型，dao層調用: (List)getSqlMapClientTemplate().queryForList("sqlName", paraName); 并經類型轉換即可，做入參還需要稍微調整下，本文主要講list做入參碰到的幾…

閱讀更多...

Samba服務

Samba服務

####################samba####################1.samba作用提供cifs協議實現共享文件2.安裝yum install samba samba-common samba-client -ysystemctl start smb nmbsystemctl enable smb nmb3.添加smb用戶smb用戶必須是本機用戶[rootlocalhost ~]# smbpasswd -a student New…

閱讀更多...

wpf 窗口的返回值_WPF Tips: Window.ShowDialog() 返回 true

wpf 窗口的返回值_WPF Tips: Window.ShowDialog() 返回 true

Window.ShowDialog() 返回值為bool?。希望在窗口點擊OK時返回True。解決方法：ShowDialog()的注釋為：// Returns:// A System.Nullable value of type System.Boolean that specifies whether// the activity was accepted (true) or canceled (false). …

閱讀更多...

CodeForces 543D 樹形DP Road Improvement

CodeForces 543D 樹形DP Road Improvement

題意： 有一顆樹，每條邊是好邊或者是壞邊，對于一個節點為x，如果任意一個點到x的路徑上的壞邊不超過1條，那么這樣的方案是合法的，求所有合法的方案數。對于n個所有可能的x，輸出n個答案。分析&am…

閱讀更多...

理解Javascritp中的引用

理解Javascritp中的引用

Author: bugall Wechat: bugallF Email: 769088641qq.com Github: https://github.com/bugall一： 函數中的引用傳遞我們看下下面的代碼的正確輸出是什么 function changeStuff(a, b, c) {a a * 10;b.item "changed";c {item: "changed"}; …

閱讀更多...

通過擴展改善ASP.NET MVC的驗證機制[實現篇]

通過擴展改善ASP.NET MVC的驗證機制[實現篇]

通過擴展改善ASP.NET MVC的驗證機制[實現篇] 原文:通過擴展改善ASP.NET MVC的驗證機制[實現篇]在《使用篇》中我們談到擴展的驗證編程方式，并且演示了本解決方案的三大特性：消息提供機制的分離、多語言的支持和多驗證規則的支持，我們現在來看…

閱讀更多...

最新文章