本文是ChatGPT系列的開篇之作,為什么吧Transformer放到這里呢,因為不管是chatgpt-1, chatgpt-2, chatgpt-3都是以Transformer作為底層基礎來實現,相當于chatgpt系列的老祖先了。如果想要深入的了解清楚chatgpt的來龍去脈,不講Transformer顯然是說過去的。并且Transformer相較于之前的一些模型,可以說是開山之作了,筆者覺得以此作為chatgpt系列的開頭,剛剛好。故此,這些第一篇就為大家帶來了Transformer的介紹。
- 論文精講
- 代碼介紹+回顧論文
- 實踐