2021版吳恩達深度學習課程Deeplearning.ai 05序列模型 12.5

學習內容

05.序列模型

1.1 為什么用序列模型

1.序列模型常見的應用
image.png

1.2 注釋 notation

1.
*T_x(i)表示訓練樣本x(i)的序列長度,T_y(i)表示target(i)的序列長度
image.png
2.訓練集表示單詞的方式
*構建字典的方式
*在訓練集中查找出現頻率最高的單詞
*網絡搜集常用字典
3.如果遇到不在字典中的單詞,需要創建一個新的標記,unknown word偽單詞,用標記
image.png

1.3 循環神經網絡模型

1.標準神經網絡并不適合用于解決序列問題
不同的例子中輸入輸出數據的長度不一,雖然可以通過0-padding的方式解決,但不是好的表達方式
并不共享已學習的數據(如harry已識別出是人名,希望不用再次識別,但標準神經網絡模型并不解決這一問題)
image.png
2.簡單循環神經網絡模型
在每一時間步t,根據輸入單詞x和上一時間步的激活值a,計算得到y
a<0>初始化為0向量是常見的選擇
每個時間步的參數共享,激活值的水平聯系由參數waa決定,輸入與隱藏層的聯系由參數wax決定,輸出由wya決定
當前循環神經網絡模型的缺點:只使用了當前序列之前的信息做出預測,如果存在如圖的teddy示例,則無法判斷
image.png
3.前向傳播
a=g1(W_aaa+W_ax
x+b_a)
y_hat=g2(W_yaa+b_y)
image.png
4.符號簡化
W_a的簡化
W_aa.shape=(100,100)``W_ax.shape=(100,10000)
W_a=[W_aa,W_ax]``W_a.shape=(100,10100)
[a,x]的簡化
a<t-1>.shape=(100,n)
x<t>.shape=(10000,n)
[a<t-1>,x<t>].shape=(10100,n)
*W_a*[a<t-1>,x<t>]=W_aa*a<t-1>+W_ax*x<t>image.png
5.RNN前向傳播示意圖
image.png

1.4 通過時間的反向傳播

1.計算圖
*單個元素的損失函數L(y_hat<t>,y<t>)=-y<t>*log(y_hat<t>)-(1-y<t>)*log(1-y_hat<t>)
image.png
2.cache與具體計算
image.png

1.5 不同類型的RNNs

1.RNN有許多的架構類型,用于解決T_x和T_y長度不匹配的不同問題
*many-to-many類型Tx=Ty,常見應用:命名實體識別
*many-to-many類型Tx!=Ty,常見應用:機器翻譯,網絡結構說明:網絡由2部分組成:decoder和encoder
*many-to-one類型Tx>Ty,常見應用:評分/情感分析,網絡結構說明:RNN網絡可簡化,僅需要最后時間步的輸出
*one/NULL-to-many類型Tx<Ty,常見應用:音樂生成,網絡結構說明:輸入數量為1,細節:上一層的輸出也可以喂給下一層,作為輸入
image.png

1.6 語言模型和序列生成

1.語言模型用于生成某個特定的句子出現的概率,它的輸入是文本序列y<1> y<2> y<3> y<4> ... y<T_y>(一般對于語言模型,用y表示輸入更好),語言模型會估計序列中各個單詞出現的概率
image.png
2.通過RNN建立語言模型,訓練集:語料庫
3.我們需要對訓練集的句子進行標記化:
*建立一個字典,將對應的單詞轉化為one-hot向量
需要注意的是,我們往往定義句子的末尾為<EOS>結束標記
.符號可以作為輸入,也可以不作為輸入
*對于未識別的字符,我們將他們作為一個整體,都用UNK標記,計算他們整體的概率,而不單獨對某一未標記字符計算其概率
image.png
4.通過RNN模型構造
image.png

本文來自互聯網用戶投稿,該文觀點僅代表作者本人,不代表本站立場。本站僅提供信息存儲空間服務,不擁有所有權,不承擔相關法律責任。
如若轉載,請注明出處:http://www.pswp.cn/news/212955.shtml
繁體地址,請注明出處:http://hk.pswp.cn/news/212955.shtml
英文地址,請注明出處:http://en.pswp.cn/news/212955.shtml

如若內容造成侵權/違法違規/事實不符,請聯系多彩編程網進行投訴反饋email:809451989@qq.com,一經查實,立即刪除!

相關文章

【C語言快速學習基礎篇】之一基礎類型、進制轉換、數據位寬

文章目錄 一、基礎類型(根據系統不同占用字節數會有變化)1.1、有符號整形1.2、無符號整形1.3、字符型1.4、浮點型1.5、布爾型 二、進制轉換2.1、二進制2.2、八進制2.3、十進制2.4、十六進制2.5、N進制2.6、進制轉換關系對應表 三、數據位寬3.1、位3.2、字節3.3、字3.4、雙字3.5…

程序員常用英文單詞

英語對于程序員來說多么重要應該無需過多解釋了&#xff0c;把近期在網上收集到的分享到這里供大家學習交流。 PS&#xff1a;感謝原作者的收集&#xff0c;謝謝。 A abstract 抽象的 abstract base class (ABC) 抽象基類abstract class 抽象類 abstraction 抽象、抽象物、抽象…

【數據結構高階】紅黑樹

目錄 一、紅黑樹的概念 二、紅黑樹的性質 2.1 紅黑樹與AVL樹的比較 三、紅黑樹的實現 3.1 紅黑樹節點的定義 3.2 數據的插入 3.2.1 紅黑樹的調整思路 3.2.1.1 cur為紅&#xff0c;f為紅&#xff0c;g為黑&#xff0c;u存在且為紅 3.2.1.2 cur為紅&#xff0c;f為紅&am…

【重點】【LCA】236. 二叉樹的最近公共祖先

題目 class Solution {public TreeNode lowestCommonAncestor(TreeNode root, TreeNode p, TreeNode q) {if (root null || root p || root q) {return root;}TreeNode left lowestCommonAncestor(root.left, p, q);TreeNode right lowestCommonAncestor(root.right, p, …

【重點】【DFS】124.二叉樹中的最大路徑和

題目 和求二叉樹直徑相同套路 class Solution {private int max Integer.MIN_VALUE;public int maxPathSum(TreeNode root) {if (root null) {return 0;}dfs(root);return max;}// 返回經過root的單邊分支最大和public int dfs(TreeNode root) {if (root null) {return 0;}…

IT新聞資訊系統,使用mysql作為后臺數據庫,此系統具有顯示數據庫中的所有信息和刪除兩大功能。

表的準備&#xff1a; -- MySQL Administrator dump 1.4 -- -- ------------------------------------------------------ -- Server version 5.1.40-community /*!40101 SET OLD_CHARACTER_SET_CLIENTCHARACTER_SET_CLIENT */; /*!40101 SET OLD_CHARACTER_SET_RESULTSCHAR…

LTP測試

LTP 測試 LTP套件是由 Linux Test Project 所開發的一套系統測試套件。它基于系統資源的利用率統計開發了一個測試的組合,為系統提供足夠的壓力。通過壓力測試來判斷系統的穩定性和可靠性。壓力測試是一種破壞性的測試,即系統在非正常的、超負荷的條件下的運行情況 。用來評估…

mysql庫名規范

mysql庫名的一些規范和建議&#xff1a; 庫名以小寫字母、數字、下劃線組成&#xff0c;不要以數字開頭。建議不要超過32個字符&#xff0c;但盡量用簡短的名稱。因為很多地方用到庫名&#xff0c;如果庫名太長&#xff0c;容易出錯。庫名選擇有意義的名稱&#xff0c;盡量與應…

55.手寫實現grpc連接池以及gin和grpc交互

文章目錄 一、簡介前置說明 二、敏感詞過濾服務1、定義sensitive.proto文件2、protoc生成pb.go文件3、sensitive服務端實現 三、關鍵詞匹配服務1、編寫keywords.proto文件2、生成pb.go文件3、keywords服務端實現 四、gin web 路由服務1、新建grpcpool服務作為gin web服務2、根據…

GEE影像升尺度(10m->250m)

GEE影像升尺度&#xff08;10m->250m&#xff09; 代碼 var ext /* color: #d63000 *//* shown: false *//* displayProperties: [{"type": "rectangle"}] */ee.Geometry.Polygon([[[108.74625980473367, 28.562445155322063],[108.74625980473367, …

【MySQL】之死鎖問題及其解決方案

前言 數據庫死鎖問題是我們老生常談的問題了&#xff0c;在我們實際開發過程中經常會遇到&#xff0c;為了盡量避免出現死鎖&#xff0c;我們需要了解出現死鎖的場景。同時&#xff0c;如果線上出現了死鎖之后怎么去分析、排查和解決&#xff0c;下面我就這兩點介紹一下。 一、…

ubuntu22.04 怎么開啟SSH服務

在 Ubuntu 22.04 LTS 中&#xff0c;默認情況下不會自動啟動 SSH 服務。如果你想通過 SSH 訪問你的 Ubuntu 系統&#xff0c;你需要手動安裝 SSH 服務器&#xff0c;并確保 22 端口&#xff08;SSH 的默認端口&#xff09;是開放的。以下是必要的步驟&#xff1a; 安裝 SSH 服…

Java 多線程之同步(鎖)相關類總結

文章目錄 一、概述二、volatile 可見性/有序性三、synchronized 互拆鎖/排他鎖/非觀鎖四、DCL&#xff08;Double-Checked Locking&#xff09;五、CAS&#xff08;Compare and Set&#xff09;六、ReentrantLock 可重入鎖/公平/非公平鎖七、ReentrantReadWriteLock 讀寫鎖/共享…

Day56力扣打卡

打卡記錄 數對統計&#xff08;DP狀態壓縮&#xff09; 參考文獻 #include <bits/stdc.h>using namespace std;void solve(){int n;cin >> n;map<int, int> mapp;vector<int> a(n);for (auto& x : a){cin >> x;mapp[x] ;}vector<array&…

使用WebyogSQLyog使用數據庫

數據庫 實現數據持久化到本地&#xff1a; 使用完整的管理系統統一管理&#xff0c; 數據庫&#xff08;DateBase&#xff09;&#xff1a; 為了方便數據存儲和管理&#xff08;增刪改查&#xff09;&#xff0c;將數據按照特定的規則存儲起來 安裝WebyogSQLyog -- 創建數…

101基于matlab的極限學習機ELM算法進行遙感圖像分類

基于matlab的極限學習機ELM算法進行遙感圖像分類&#xff0c;對所獲取的遙感圖片進行初步分類和最終分類。數據可更換自己的&#xff0c;程序已調通&#xff0c;可直接運行。

如何使用 Explain 分析 SQL 語句?

如何使用 Explain 分析 SQL 語句&#xff1f; MySQL中EXPLAIN命令是我們分析和優化SQL語句的利器。 如何使用EXPLAIN來分析SQL語句&#xff0c;接下來有15個例子&#xff0c;一起學習唄 1. EXPLAIN的基本使用 EXPLAIN可以用于分析MySQL如何執行一個SQL查詢&#xff0c;包括如…

ElasticSearch之cat repositories API

命令樣例如下&#xff1a; curl -X GET "https://localhost:9200/_cat/repositories?vtrue&pretty" --cacert $ES_HOME/config/certs/http_ca.crt -u "elastic:ohCxPHQBEs5*lo7F9"執行結果輸出如下&#xff1a; id type repo1 fs repo2 s3查…

python+gdal地理坐標轉投影坐標

1 前言 地理坐標系&#xff0c;是使用三維球面來定義地球表面位置&#xff0c;以實現通過經緯度對地球表面點位引用的坐標系。 地理坐標系經過地圖投影操作后就變成了投影坐標系。而地圖投影是按照一定的數學法則將地球橢球面上點的經維度坐標轉換到平面上的直角坐標。 2 流程…