目錄
Transformer應用
Transformer是什么
Transformer應用:循環神經網絡
語言翻譯:注重語句前后順序
RNN看中單個特征;
CNN:看中特征之間時序性
模型關注不同位置的能力
Transformer是什么
Transformer是一個利用注意力機制來提高模型訓練速度的模型。關于注意力機制可以參看這篇文章,trasnformer可以說是完全基于自注意力機制的一個深度學習模型,因為它適用于并行化計算,和它本身模型的復雜程度導致它在精度和性能上都要高于之前流行的RNN循環神經網絡。
那什么是transformer呢?
你可以簡單理解為它是一