自然語言處理NLP（3）

上文：
自然語言處理NLP（1）
自然語言處理NLP（2）

在這里插入圖片描述

如何生成下一個新單詞？

概率性的選擇：根據概率分布進行選擇，這樣概率高的單詞容易被選到，概率低的單詞難以被選到。然后再把選中的詞當作輸入，再次選擇下一個新的單詞
seq2seq模型：Encoder-Decoder模型編碼器-解碼器模型

編碼器對輸入數據進行編碼，解碼器對被編碼的數據進行解碼

編碼：就是將任意長度的文本轉換為一個固定長度的向量

seq2seq由兩個LSTM層構成：編碼器的LSTM和解碼器的LSTM。LSTM層的隱藏狀態是編碼器和解碼器的橋梁，在正向傳播時，編碼器的編碼信息通過LSTM層的隱藏狀態傳遞給解碼器；反向傳播時，解碼器的梯度通過這個橋梁傳遞給編碼器
seq2seq改進
1. 反轉輸入數據 Reverse
  
  反轉輸入數據的順序，反轉數據后梯度的傳播可以更加平滑
2. 偷窺 Peeky
  
  將集中了重要信息的編碼器的輸出h分配給解碼器的其他層
seq2seq的應用
1. 聊天機器人 chatgpt
2. 算法學習
3. 自動圖像描述
  
  編碼器從LSTM換成CNN

Attention從數據中學習兩個時序數據之間的對應關系，計算向量之間的相似度，輸出這個相似度的加權和向量

結構

Attention層放入LSTM和Affine層之間

hs：LSTM中各個時刻的隱藏狀態向量被整合為hs
雙向RNN

讓LSTM從兩個方向進行處理：雙向LSTM

各個單詞對應的隱藏狀態向量可以從左右兩個方向聚集信息，這些向量就編碼了更均衡的信息
Attention層的不同使用
1. Attention層放入LSTM和Affine層之間（垂直方向）
2. Attention層放入上一時刻的LSTM層、Affine層和當前時刻的LSTM層之間（時間方向）
seq2seq的深層化 & skip connection

為了讓帶Attention的seq2seq具有更強的表現力，加深LSTM層

在加深層時使用到的一個技巧是殘差連接（skip connection / residual connection / shortcut）：是一種跨層連接的簡單技巧
Attention應用
1. GNMT 谷歌神經機器翻譯系統
2. Transformer
  
  Attention is all you need
  
  Transformer不用RNN，而用Attention進行處理：self-Attention
3. NTM Neural Turing Machine 神經圖靈機
  
  計算機的內存操作可以通過神經網絡復現：
  
  在rnn的外部配置一個存儲信息的存儲裝置，使用Attention向這個存儲裝置讀寫必要的信息

GRU：Gated Recurrent Unit 門控循環單元

在這里插入圖片描述

本文來自互聯網用戶投稿，該文觀點僅代表作者本人，不代表本站立場。本站僅提供信息存儲空間服務，不擁有所有權，不承擔相關法律責任。
如若轉載，請注明出處：http://www.pswp.cn/pingmian/91669.shtml
繁體地址，請注明出處：http://hk.pswp.cn/pingmian/91669.shtml
英文地址，請注明出處：http://en.pswp.cn/pingmian/91669.shtml

如若內容造成侵權/違法違規/事實不符，請聯系多彩編程網進行投訴反饋email:809451989@qq.com，一經查實，立即刪除！