RNN GRU LSTM 模型理解

RNN GRU LSTM 模型理解

bicheng/2025/7/7 0:00:22/文章來源:https://blog.csdn.net/qq_41764621/article/details/148168302

一、RNN

1.? 在RNN中， $a^{<0>} = x^{<0>} = [0,0,0,0, ... 0]$

2. RNN是一個序列模型，與非序列模型不同，序列中的元素互相影響： $a^{<t>}$ ?是由? $a^{<t-1>}$ ? 計算得來的。

在前向傳播中： $a^{<t-1>}$ ?用于計算?? $y^{<t-1>}$ ? 和? $a^{<t>}$

$a^{<t>}$ ?用于計算?? $y^{<t>}$ ? 和? $a^{<t+1>}$

因此，當進行反向鏈式法則求導時候，

$a^{<t>}$ ?的梯度由兩部分組成：

一部分是由? $y^{<t>}$ ?對 $a^{<t>}$ 求導計算得來；

一部分是由? $a^{<t+1>}$ ?對? $a^{<t>}$ 求導計算得來。

這就對應了代碼的：?

gradients = rnn_cell_backward(da[:,:,t] + da_prevt, caches[t])

二、GRU

1. GRU是為了解決RNN 梯度消失引入的改良模型，

2. GRU 通過門控 Gamma_r Gamma_u 兩個變量，實現了對于過往記憶的篩選：這種機制使得GRU能夠靈活地決定何時“忘記”過去的信息以及何時“記住”新的信息，從而有效地捕捉序列數據中的長期依賴關系。

具體理解如下：

三、LSTM

本文來自互聯網用戶投稿，該文觀點僅代表作者本人，不代表本站立場。本站僅提供信息存儲空間服務，不擁有所有權，不承擔相關法律責任。
如若轉載，請注明出處：http://www.pswp.cn/bicheng/82571.shtml
繁體地址，請注明出處：http://hk.pswp.cn/bicheng/82571.shtml
英文地址，請注明出處：http://en.pswp.cn/bicheng/82571.shtml

如若內容造成侵權/違法違規/事實不符，請聯系多彩編程網進行投訴反饋email:809451989@qq.com，一經查實，立即刪除！

相關文章

多路徑傳輸(比如 MPTCP)控制實時突發

多路徑傳輸(比如 MPTCP)控制實時突發

實時突發很難控制，因為 “實時” 和 “突發” 相互斥。實時要求避免排隊，而突發必然要排隊，最終的解決方案都指向找一個公說公有理，婆說婆有理的中間點，這并沒解決問題，只是權衡了問題。這種局部解決問題的…

閱讀更多...

函數式編程思想詳解

函數式編程思想詳解

函數式編程思想詳解 1. 核心概念不可變數據 (Immutable Data) 數據一旦創建，不可修改。任何操作均生成新數據，而非修改原數據。優點：避免副作用，提升并發安全，簡化調試。 Java實現：使用final字段、不可變…

閱讀更多...

iOS 主要版本發布歷史

iOS 主要版本發布歷史

截至 2025 年 5 月，iOS 的最新正式版本是 iOS 18，于 2024 年 9 月 16 日正式發布。此前的 iOS 17 于 2023 年 9 月 18 日發布，并在 2024 年被 iOS 18 取代。(維基百科) 📱 iOS 主要版本發布歷史以下是 iOS 各主要版本的發布日…

閱讀更多...

矩陣詳解：線性代數在AI大模型中的核心支柱

矩陣詳解：線性代數在AI大模型中的核心支柱

🧑 博主簡介：CSDN博客專家、CSDN平臺優質創作者，高級開發工程師，數學專業，10年以上C/C, C#, Java等多種編程語言開發經驗，擁有高級工程師證書；擅長C/C、C#等開發語言，熟悉Java常用開…

閱讀更多...

基于51單片機和8X8點陣屏、獨立按鍵的飛行躲閃類小游戲

基于51單片機和8X8點陣屏、獨立按鍵的飛行躲閃類小游戲

目錄系列文章目錄前言一、效果展示二、原理分析三、各模塊代碼1、8X8點陣屏2、獨立按鍵3、定時器04、定時器1 四、主函數總結系列文章目錄前言用的是普中A2開發板。【單片機】STC89C52RC 【頻率】12T11.0592MHz 【外設】8X8點陣屏、獨立按鍵效果查看/操作演示&#xff…

閱讀更多...

區塊鏈可投會議CCF C--APSEC 2025 截止7.13 附錄用率

區塊鏈可投會議CCF C--APSEC 2025 截止7.13 附錄用率

Conference：32nd Asia-Pacific Software Engineering Conference (APSEC 2025) CCF level：CCF C Categories：軟件工程/系統軟件/程序設計語言 Year：2025 Conference time：December 2-5, 2025 in Macao SAR, China …

閱讀更多...

$pdf圖片導出（Visio\Origin\PPT）$

pdf圖片導出（Visio\Origin\PPT）

一、Visio 導入pdf格式圖片 1. 設計->大小，適應繪圖。 2. 文件->導出，導出為pdf格式。上面兩部即可得到只包含圖的部分的pdf格式。如果出現的有默認白邊，可以通過以下方式設置： 1. 文件->選項->自定義功能區->…

閱讀更多...

vector的實現

vector的實現

介紹 1. 本質與存儲結構動態數組實現：vector 本質是動態分配的數組，采用連續內存空間存儲元素，支持下標訪問（如 vec[i]），訪問效率與普通數組一致（時間復雜度 O (1)）。動態擴容機制&…

閱讀更多...

【Linux筆記】防火墻firewall與相關實驗（iptables、firewall-cmd、firewalld）

【Linux筆記】防火墻firewall與相關實驗（iptables、firewall-cmd、firewalld）

一、概念 1、防火墻firewall Linux 防火墻用于控制進出系統的網絡流量，保護系統免受未授權訪問。常見的防火墻工具包括 iptables、nftables、UFW 和 firewalld。防火墻類型包過濾防火墻：基于網絡層（IP、端口、協議）過濾流量&a…

閱讀更多...

el-date-picker 前端時間范圍選擇器

el-date-picker 前端時間范圍選擇器

控制臺參數： 前端代碼：用數組去接受，同時用 value-format"YYYY-MM-DD" 格式化值為：年月日格式 <transition name"fade"><div class"search" v-show"showSe…

閱讀更多...

在 macOS 上安裝 jenv 管理 JDK 版本

在 macOS 上安裝 jenv 管理 JDK 版本

在 macOS 上安裝 jenv 并管理 JDK 版本在開發 Java 應用程序時，你可能需要在不同的項目中使用不同版本的 JDK。手動切換 JDK 版本可能會很繁瑣，但幸運的是，有一個工具可以簡化這個過程：jenv。jenv 是一個流行的 Java 版本管理工…

閱讀更多...

2025年全國青少年信息素養大賽復賽C++集訓（16）：吃糖果2（題目及解析）

2025年全國青少年信息素養大賽復賽C++集訓（16）：吃糖果2（題目及解析）

2025年全國青少年信息素養大賽復賽C集訓（16）：吃糖果2（題目及解析） 題目描述現有n(50 > n > 0)個糖果,每天只能吃2個或者3個，請計算共有多少種不同的吃法吃完糖果。時間限制：1000 內存…

閱讀更多...

ARM筆記-嵌入式系統基礎

ARM筆記-嵌入式系統基礎

第一章嵌入式系統基礎 1.1嵌入式系統簡介 1.1.1嵌入式系統定義嵌入式系統定義： 嵌入式系統是以應用為中心，以計算機技術為基礎，軟硬件可剪裁，對功能、可靠性、成本、體積、功耗等有嚴格要求的專用計算機系統 ------Any devic…

閱讀更多...

大語言模型(LLM)入門項目推薦

大語言模型(LLM)入門項目推薦

推薦大語言模型(LLM)的入門項目 TiaoYu-1。 https://github.com/tiaoyu1122/TiaoYu-1 項目優點： 幾乎每一行代碼(一些重復的代碼除外)都添加了注釋，詳細介紹了代碼的作用，方便閱讀與理解。基本上覆蓋了常見 LLM 模型的全部訓練流程&#x…

閱讀更多...

Linux里more 和 less的區別

Linux里more 和 less的區別

在 Linux/Unix 系統中，more 和 less 都是用于分頁查看文本文件的命令，但 less 是 more 的增強版，功能更強大。以下是它們的核心區別和用法對比： 1. 基礎功能對比特性moreless（更強大）向前翻頁? 僅支持向…

閱讀更多...

基于PDF流式渲染的Word文檔在線預覽技術

基于PDF流式渲染的Word文檔在線預覽技術

一、背景介紹在系統開發中，實現在線文檔預覽與編輯功能是許多項目的核心需求，但在實際的開發過程中，我們經常會面臨以下難點： 1）格式兼容性問題：瀏覽器原生不支持解析Word二進制格式，直接渲染會…

閱讀更多...

ai學習--python部分-1.變量名及命名空間的存儲

ai學習--python部分-1.變量名及命名空間的存儲

初學代碼時總有一個問題困擾我：a 10 # a指向地址0x1234（存儲10） 變量a的值10存儲在0x1234，那么變量a需要存儲嗎？a又存儲在什么地址呢目錄 1. ??命名空間的本質?? 2. ??命名空間的內存占用?? 3. ??…

閱讀更多...

Leetcode 3563. Lexicographically Smallest String After Adjacent Removals

Leetcode 3563. Lexicographically Smallest String After Adjacent Removals

Leetcode 3563. Lexicographically Smallest String After Adjacent Removals 1. 解題思路2. 代碼實現題目鏈接：3563. Lexicographically Smallest String After Adjacent Removals 1. 解題思路這次的最后一題同樣沒有自力搞定，簡直了…… 這道題還…

閱讀更多...

微信小程序之Promise-Promise初始用

微信小程序之Promise-Promise初始用

我們來嘗試使用Promise。 1、需求，做個抽獎的按鈕， 抽獎規則： 30%的幾率中獎，中獎會提示恭喜恭喜，獎品為10萬 RMB 勞斯萊斯優惠券，沒中獎會提示再接再厲。 2、先搭界面： <view class&qu…

閱讀更多...

spring-boot-starter-data-redis應用詳解

spring-boot-starter-data-redis應用詳解

一、依賴引入與基礎配置添加依賴在 pom.xml 中引入 Spring Data Redis 的 Starter 依賴，默認使用 Lettuce 客戶端： <dependency><groupId>org.springframework.boot</groupId><artifactId>spring-boot-starter-data-redis<…

閱讀更多...

最新文章