RNN總結

RNN總結

news/2025/8/4 22:35:33/文章來源:https://blog.csdn.net/weixin_30493401/article/details/98114018

RNN既可以表述為循環神經網絡（recurrent neural network），也可以表述為遞歸神經網絡（recursive neural network），前者一般用于處理以時間序列為輸入的問題（比如把一個句子看成詞組成的序列），每次向循環神經網絡輸入一個詞，知道整個句子輸入結束。后者一般用于處理圖結構或樹結構問題（比如為了處理歧義問題，我們構造語法樹為輸入，而不是循環輸入每一個詞）。

下圖是循環神經網絡的展開

圖1

下面是一個句子對上圖的應用

圖2

可以這樣理解：將所有用到的英文詞向量化之后，the表示為（0.4,0.3），對應圖1中的x輸入，經過神經元計算之后輸出為（1,3.5），神經元內部的計算方式為:

函數f通常是諸如tanh或者ReLU的非線性函數,U，x，St-1都為向量且U、V、W都是待訓練參數。輸出O可以選擇softmax函數，其表達式如下

這里的變量i對應圖1中的變量t，可見

也就是說循環神經網絡所有輸出之和為1，輸出O的計算公式為

其中V和St都是向量。也就是說神經元先計算隱狀態St，然后計算輸出Ot

?

下面以樹結構為例來說明遞歸神經網絡的輸入與計算

1.將句子分詞之后，給每個詞一個向量，這里詞的向量化可以采用one-hot或者其他一些向量化工具，比如Google的gensim

2.將詞按照樹形結構輸入，以圖3為例

圖3

2.1 首先計算“兩個”和“外語學院”的父節點的向量，計算方法是：假設“兩個”的詞向量表示為c1，“外語學院”的詞向量表示為c2，那么父節點對應的向量P為

其中W和b是訓練好的參數，tanh是雙曲正切函數，表達式為

2.2 依次迭代計算各個父節點對應的向量，最終得到根節點對應向量。

因為是以語法樹輸入的，所以對于歧義問題有較好的處理能力，比如圖3中的句子也可以用圖4的語法樹來表示：

圖4

事實上，圖3與圖4對應的根節點向量完全不同，因為詞向量的輸入順序是不一樣的。

在得到根節點向量后，我們就可以去完成一些更高級的任務，比如計算語義相似度或者情感分析等。

轉載于:https://www.cnblogs.com/xueyinzhe/p/7441639.html

本文來自互聯網用戶投稿，該文觀點僅代表作者本人，不代表本站立場。本站僅提供信息存儲空間服務，不擁有所有權，不承擔相關法律責任。
如若轉載，請注明出處：http://www.pswp.cn/news/251974.shtml
繁體地址，請注明出處：http://hk.pswp.cn/news/251974.shtml
英文地址，請注明出處：http://en.pswp.cn/news/251974.shtml

如若內容造成侵權/違法違規/事實不符，請聯系多彩編程網進行投訴反饋email:809451989@qq.com，一經查實，立即刪除！

相關文章

Problem 2. number題解

Problem 2. number題解

number：數學二分圖匹配首先，如果S<N,那么S1，S2...N這些數直接放在S1,S2...N的位置上(如果其他數x放在這些位置上面，這些數不放在對應位置，那么x一定能放在這些數放的位置，所以直接交換即可)所以可以直接…

閱讀更多...

SSD列子

SSD列子

一、介紹本博文主要介紹實現通過SSD物體檢測方式實現工件裂紋檢測。裂紋圖像如下所示： 二、關于SSD算法具體算法不再闡述，詳細請參考： https://blog.csdn.net/u013989576/article/details/73439202 https://blog.csdn.net/xiaohu2022/arti…

閱讀更多...

linux硬鏈接與軟鏈接

linux硬鏈接與軟鏈接

Linux 系統中有軟鏈接和硬鏈接兩種特殊的“文件”。軟鏈接可以看作是Windows中的快捷方式，可以讓你快速鏈接到目標檔案或目錄。硬鏈接則透過文件系統的inode來產生新檔名，而不是產生新檔案。創建方法都很簡單： 軟鏈接（符號鏈接…

閱讀更多...

int轉時間

int轉時間

int轉時間 public static string FormatDuration(int duration) { if (duration 0) return "00:00:00"; int hours duration / 3600; int minutes duration % 3600 / 60; int seconds duration % 3600 % 60; string _hours hours.ToString("00") &qu…

閱讀更多...

企業級區塊鏈現狀研究報告：小企業的投資總額是大企業的28倍

企業級區塊鏈現狀研究報告：小企業的投資總額是大企業的28倍

根據企業級區塊鏈現狀研究報告表明，當前企業采用區塊鏈技術的勢頭正在逐步增強。參與該報告的企業表示，區塊鏈投資今年共增長了 62% ，預計到 2025 年區塊鏈將成為主流技術。其中，有 28% 的企業正在積極開展區塊鏈發展計劃。現在看…

閱讀更多...

特征匹配

特征匹配

Python 使用Opencv實現圖像特征檢測與匹配 2018-06-13 11:36:58 Xy-Huang 閱讀數 19203更多分類專欄： Python 人工智能版權聲明：本文為博主原創文章，遵循 CC 4.0 BY-SA 版權協議，轉載請附上原文出處鏈接和本聲明。本文鏈接…

閱讀更多...

bzoj 1015 并查集

bzoj 1015 并查集

代碼： //這題可以反著想，把要去掉的點倒著處理變成往圖中一個一個的加點，然后用并查集處理聯通快就好了。 #include<iostream> #include<cstdio> #include<cstring> #include<vector> using namespace std; const in…

閱讀更多...

頁面中切換echarts主題

頁面中切換echarts主題

要做的效果是：點擊下拉框切換echarts主題下面是效果圖： 項目環境： vue ts es6 echarts(4.2.1) 步驟安裝依賴， npm install echarts -S / yarn add echarts -S引入主題參考鏈接選擇下拉框中的主題時，拿到圖表主題…

閱讀更多...

畫極線

畫極線

OpenCV學習日記5 2017-05-27 10:44:35 1000sprites 閱讀數 2339更多分類專欄： 計算機視覺版權聲明：本文為博主原創文章，遵循 CC 4.0 BY-SA 版權協議，轉載請附上原文出處鏈接和本聲明。本文鏈接：https://blog.cs…

閱讀更多...

Win10開啟Administrator超級管理員賬戶

Win10開啟Administrator超級管理員賬戶

方法1 1、在系統的開始菜單上，我們單擊鼠標右鍵，然后選擇計算機管理打開進入 2、打開的計算機管理窗口，點擊本地用戶和組中的用戶打開，然后點擊右側的Administrator賬戶，雙擊鼠標打開進入 3、打開的屬性窗口中&#xf…

閱讀更多...

Mysql異常問題排查與處理——mysql的DNS反向解析和客戶端網卡重啟

Mysql異常問題排查與處理——mysql的DNS反向解析和客戶端網卡重啟

中午剛想趴一會，不料鍋從天降！！！Mysql連不上了。。。。。。。現象如下： 現象1：登錄mysql所在服務器，連接MySQL 成功； 現象2：通過客戶端遠程連接MySQL，返回失…

閱讀更多...

最近很火的MySQL：拋開復雜的架構設計，MySQL優化思想基本都在這

最近很火的MySQL：拋開復雜的架構設計，MySQL優化思想基本都在這

優化一覽圖優化筆者將優化分為了兩大類：軟優化和硬優化。軟優化一般是操作數據庫即可；而硬優化則是操作服務器硬件及參數設置。 1、軟優化 1）查詢語句優化首先我們可以用EXPLAIN或DESCRIBE(簡寫:DESC)命令分析一條查詢語句的執行信息。例…

閱讀更多...

【讀書筆記】《深入淺出Webpack》

【讀書筆記】《深入淺出Webpack》

Webpack版本分析版本為3.6.0 4.0為最近升級的版本，與之前版本變化較大，編譯輸出的文件與3.0版本會不一致，目前項目中使用的版本3.0版本，所以基于3.0版本進行分析學習。 Webpack構建流程初始化：啟動構建，讀…

閱讀更多...

《JAVA與模式》之橋梁模式

《JAVA與模式》之橋梁模式

在閻宏博士的《JAVA與模式》一書中開頭是這樣描述橋梁（Bridge）模式的： 橋梁模式是對象的結構模式。又稱為柄體(Handle and Body)模式或接口(Interface)模式。橋梁模式的用意是“將抽象化(Abstraction)與實現化(Implementation)脫耦&#xff0…

閱讀更多...

LABLEME UPDATE DAMOD

LABLEME UPDATE DAMOD

Labelme的改進——海量圖片的自動標注深度學習一般需要對大量的圖片進行標注，但是手動標注耗時耗力，所以模仿labelme軟件的功能，使用程序對大批量的圖片進行自動標注，大大減少手動操作。下面介紹如何實現對大批量的圖片進行標…

閱讀更多...

Java基礎教程：面向對象編程[2]

Java基礎教程：面向對象編程[2]

Java基礎教程：面向對象編程[2] 內容大綱訪問修飾符四種訪問修飾符 Java中，可以使用訪問控制符來保護對類、變量、方法和構造方法的訪問。Java 支持 4 種不同的訪問權限。 default (即缺省，什么也不寫）: 在同一包內可見&#xff…

閱讀更多...

【javascript】異步編年史，從“純回調”到Promise

【javascript】異步編年史，從“純回調”到Promise

異步和分塊——程序的分塊執行一開始學習javascript的時候， 我對異步的概念一臉懵逼， 因為當時百度了很多文章，但很多各種文章不負責任的把籠統的描述混雜在一起，讓我對這個 JS中的重要概念難以理解， “異步是非阻塞的…

閱讀更多...

Shell編程之if語法練習（LNMP）全過程

Shell編程之if語法練習（LNMP）全過程

大家好，我是延凱，本人原來在CSDN寫作已經快一年了都是相關Linux運維這方面的技術知識，現在搬到博客園也是我一直想的，本博客主要寫Python，docker，shell等偏向開發云計算等知識點，謝謝各位&…

閱讀更多...

基于UNet和camvid數據集的道路分割

基于UNet和camvid數據集的道路分割

基于UNet和camvid數據集的道路分割h(1.3.0)： 背景語義分割是深度學習中的一個非常重要的研究方向，并且UNet是語義分割中一個非常經典的模型。在本次博客中，我嘗試用UNet對camvid dataset數據集進行道路分割，大致期望的效果如下&…

閱讀更多...

二分法查找和普通查找

二分法查找和普通查找

一、普通查找對于數組和一個需要查找的元素來說，普通查找的原理很簡單，即為從數組的第一個元素到最后一個元素進行遍歷，如果第i個元素的值等于我們需要查找的值，那么返回找到的角標i，否則返回-1表示沒有查找到。這里以…

閱讀更多...

最新文章