9.3深度循環神經網絡

目前為止討論了具有一個隱藏循環神經網絡其中變量觀測具體函數形式交互方式相當隨意只要交互類型建模具有足夠靈活性不是一個單問題然而對一個單層來說可能具有相當挑戰性之前線性模型我們通過添加更多解決這個問題循環神經網絡我們首先需要確定如何添加更多以及哪里添加額外非線性

事實上我們可以多層循環神經網絡堆疊在一起通過幾個簡單組合產生一種靈活機制特別數據可能不同層堆疊有關例如我們可能希望保持有關金融市場狀況宏觀數據可用微觀數據記錄較為短期時間動態

9-8展示了一個具有L隱藏深度循環神經網絡每個狀態都連續傳遞當前下一個時間步下一層當前時間

9.3.1 函數依賴關系

我們可以將深度架構中函數依賴關系形勢這個架構9-8展示L隱藏構成后續的討論主要集中經典循環神經網絡模型但是這些討論也適應其他序列模型

假設時間步t又一個小批量輸入數據Xt屬于Rnxd同時l隱藏輸出變量Ot屬于Rnxq, 設置Ht = Xtl隱藏層狀態使用激活函數Sigmal

Ht = Sigma (Ht Wxh + Ht-1Whh + Bh)

權重Wxh屬于RhxhWhh屬于Rhh偏置Bh屬于Rlxh 都是l隱藏模型參數

Ot = HtWhq + Bq

其中權重Whq屬于Rhxq偏置Bq屬于Rlxq都是輸出模型參數

與多層感知機一樣隱藏L隱藏單元h都是參數也就是說他們可以我們調整用門控循環單元或者長短期記憶網絡狀態代替9.8狀態進行計算可以很容易得到深度門控循環神經網絡或者深度長短期記憶神經網絡

9.3.2 簡潔實現

實現多層循環神經網絡所需許多邏輯細節高級API都是現成為簡單起見我們僅僅示范使用此類內置函數實現方式長短期記憶網絡模型為例其實現代碼之前9.2使用代碼非常相似實際上唯一區別是我們指定數量而不是使用單一這個默認值之前一樣我們加載數據集開始

import torch

from torch import nn

from d2l import torch as d2l

batch_size, num_steps = 32,35

train_iter, vocab = d2l.load_data_time_machine(batch_size, num_steps)

這樣參數類型架構決策也與9.2中的決策非常相似因為我們不同詞元所以輸入輸出都選擇相同數量vocab_size單元數量仍然256, 唯一區別我們現在通過num_layers 設定隱藏

vocab_size, num_hiddens, num_layers = len(vocab), 256, 2

num_inputs = vocab_size

device = d2l.try_gpu()

lstm = nn.LSTM(num_inputs, num_hiddens, num_layers)

model = d2l.RNNModel(lstm_layer, len(vocab))

model=model.to(device)

9.3.3 訓練預測

使用長短期記憶網絡模型實例化兩個層因此訓練速度大大降低了

num_epochs, lr = 500, 2

d2l.train_ch8(model, train_iter, vocab, lr, num_epochs, device)

小結

在深度循環神經網絡狀態信息傳遞當前下一個時間步下一層當前時間步

有許多不同風格深度循環神經網絡長短期記憶網絡門控循環單元常規循環神經網絡這些模型深度學習框架高級API都有涵蓋

總體而言深度循環神經網絡需要大量調參來確保合適收斂模型初始化也需要謹慎

本文來自互聯網用戶投稿,該文觀點僅代表作者本人,不代表本站立場。本站僅提供信息存儲空間服務,不擁有所有權,不承擔相關法律責任。
如若轉載,請注明出處:http://www.pswp.cn/news/921698.shtml
繁體地址,請注明出處:http://hk.pswp.cn/news/921698.shtml
英文地址,請注明出處:http://en.pswp.cn/news/921698.shtml

如若內容造成侵權/違法違規/事實不符,請聯系多彩編程網進行投訴反饋email:809451989@qq.com,一經查實,立即刪除!

相關文章

CSS in JS 的演進:Styled Components, Emotion 等的深度對比與技術選型指引

CSS in JS 的演進:Styled Components, Emotion 等的深度對比與技術選型指引在現代前端開發中,組件化思維已成為主流,而如何科學、高效地管理組件的樣式,也隨之成為了一個重要議題。CSS in JS(JS中的CSS)應運…

【正則表達式】 正則表達式的分組和引用

?? 個人主頁:(時光煮雨) ?? 高質量專欄:vulnhub靶機滲透測試 ?? 希望得到您的訂閱和支持~ ?? 創作高質量博文(平均質量分95+),分享更多關于網絡安全、Python領域的優質內容!(希望得到您的關注~) ??目錄?? 前言 ??一、基本語法 ??二、分組類型 ??2.1.…

Grafana 導入儀表盤失敗:從日志排查到解決 max\_allowed\_packet 問題

問題背景 近期在為項目搭建一套基于 Prometheus 和 Grafana 的可觀測性體系。在完成基礎部署后,我準備導入一個功能相對復雜的官方儀表盤模板,以便快速監控各項指標。然而,當上傳儀表盤的 JSON 文件并點擊保存時,Grafana 界面卻反…

java對接物聯網設備(一)——使用okhttp網絡工具框架對接標準API接口

當前無論是在互聯網領域,還是物聯網項目下,亦或者各類應用類軟件,基于http標準接口的對接是目前市面上最常見也是最簡單的數據交互方式之一,甚至可以說是最流行的,因為它不依賴的各種插件或者服務。 開發者或者提供服…

版本管理系統與平臺(權威資料核對、深入解析、行業選型與國產平臺補充)

本文是一篇基于公開權威資料(官方文檔、產品頁、廠商技術文章與技術社區討論)重新檢索、核對后撰寫的詳盡博文。內容覆蓋:版本控制基礎、主流 VCS 工具深度比較、常見托管/協作平臺(含中國本土平臺:Gitee / GitCode / …

計算機畢設選題:基于Python+Django的B站數據分析系統的設計與實現【源碼+文檔+調試】

精彩專欄推薦訂閱:在 下方專欄👇🏻👇🏻👇🏻👇🏻 💖🔥作者主頁:計算機畢設木哥🔥 💖 文章目錄 一、項目介紹二…

Easy ES技術詳解

從Java代碼示例到高級特性 框架介紹 Easy-Es 是一款以 “簡化 Elasticsearch 操作的 ORM 框架” 為核心定位的開源工具,旨在通過低代碼設計降低 Elasticsearch 的使用門檻。作為國內 Top1 Elasticsearch 搜索引擎框架,其最顯著的優勢在于大幅縮減代碼量…

【51單片機】【protues仿真】基于51單片機停車場的車位管理系統

目錄 一、主要功能 二、使用步驟 三、硬件資源 四、軟件設計 五、實驗現象 一、主要功能 1、LCD1602液晶顯示 2、統計并顯示停車場現有車輛數和已停放過車輛數 3、按鍵設置總車位數以及剩余車位數 4、統計并顯示累計駛入和累計駛出車輛數 5、用16個LED燈模擬停車位 6、車…

【Python】S1 基礎篇 P4 if 語句指南

目錄簡單示例條件測試檢查是否相等與不等檢查多個條件檢查特定的值是否在/不在列表中布爾表達式if語句簡單的if語句if-else語句if-elif-else語句使用if語句處理列表檢查特殊元素確定列表非空使用多個列表總結if 語句是Python編程中最基本也是最重要的控制結構之一。它允許程序根…

【實戰中提升自己】內網安全部署之STP的安全技術部署

1 1拓撲 「模擬器、工具合集」復制整段內容 鏈接:https://docs.qq.com/sheet/DV0xxTmFDRFVoY1dQ?tab7ulgil1 STP的安全技術部署 說明:為什么需要注意STP的安全呢,在二層中其實存在很多不安全的因素,物理上…

GEM5學習(5): ARM 架構功耗仿真

運行腳本基于gem5提供的腳本,啟動功耗仿真。實際工作中應該不會用gem5進行功耗的仿真吧,Cadence和Synopsys好像都有配套的的功耗建模工具。事先要配置好 IMG_ROOT的環境變量./build/ARM/gem5.opt configs/example/arm/fs_power.py \--caches \--bootl…

【Python基礎】 19 Rust 與 Python if 語句對比筆記

一、基本語法對比 Rust if 語句 // 基本形式 let number 7;if number < 5 {println!("condition was true"); } else {println!("condition was false"); }// 多條件 else if if number % 4 0 {println!("number is divisible by 4"); } el…

Vue項目_項目配置腳本代碼詳細講解

Vue項目代碼詳細講解 1. jsconfig.json - JavaScript配置文件 {"compilerOptions": { // 編譯器選項配置"target": "es5", // 編譯目標&#xff1a;將代碼編譯為ES5版本&#xff0c;確保更好的瀏覽器兼容性"module": "esnext…

第一節:Vben Admin 最新 v5.0 (vben5) + Python Flask 快速入門

Vben Admin vben5 系列文章目錄 &#x1f4bb; 基礎篇 ? 第一節&#xff1a;Vben Admin 最新 v5.0 (vben5) Python Flask 快速入門 ? 第二節&#xff1a;Vben Admin 最新 v5.0 (vben5) Python Flask 快速入門 - Python Flask 后端開發詳解(附源碼) ? 第三節&#xff1a;V…

Guava中常用的工具類

1. 集合工具類&#xff08;com.google.common.collect&#xff09;Guava 對 Java 集合框架進行了豐富擴展&#xff0c;解決了標準集合的諸多痛點。&#xff08;1&#xff09;Lists / Sets / Maps:用于簡化集合創建和操作&#xff1a;// 創建不可變集合&#xff08;線程安全&…

redission實現讀寫鎖的原理

Redisson 實現分布式讀寫鎖的核心原理是 ?基于 Redis 的 Lua 腳本原子操作? ?Pub/Sub 通知機制&#xff0c;在保證強一致性的同時實現高效的讀并發&#xff08;讀不阻塞讀&#xff0c;寫阻塞讀&#xff09;。以下是其核心設計&#xff1a;?一、核心數據結構?Redisson 使用…

【 ??SQL注入漏洞靶場】第二關文件讀寫

SQLi-Labs?它是一個開源的、專門為學習 ??Web安全?? 和 ??SQL注入技術?? 而設計的靶場項目。開發者故意在代碼中留下了各種不同類型的SQL注入漏洞&#xff0c;讓安全研究人員、學生和愛好者可以在一個合法、安全的環境中進行實戰練習&#xff0c;從而掌握發現和利用SQ…

設計藝術~緩存結構設計

背景 面對高QPS場景的業務&#xff0c;不得不考慮對一些數據做緩存設計&#xff0c;常見的緩存設計有這些&#xff1a;DB Proxy緩存、分布式緩存、Localcache緩存。 在考慮加緩存的背景下不考慮數據的一致性&#xff0c;都是瞎扯&#xff0c;所以我們再定義一下數據的一致性場景…

后端開發技術棧

后端開發技術棧核心技術內容平臺 (Content Platform)電商 (E-Commerce)金融科技 (FinTech) / 支付物聯網 (IoT - Internet of Things)游戲后端 (Game Backend)社交平臺搜索平臺企業級應用開發音視頻處理后端地圖與地理位置服務DevOps大數據開發大模型應用開發智能合約開發核心技…

【ICCV2025】計算機視覺|即插即用|ESC:顛覆Transformer!超強平替,ESC模塊性能炸裂!

論文地址&#xff1a;https://arxiv.org/pdf/2503.06671 代碼地址&#xff1a;https://github.com/dslisleedh/ESC 關注UP CV縫合怪&#xff0c;分享最計算機視覺新即插即用模塊&#xff0c;并提供配套的論文資料與代碼。 https://space.bilibili.com/473764881 摘要 本研究…