GPT( Generative Pre-trained Transformer )模型:基于Transformer

GPT是由openAI開發的一款基于Transformer架構的預訓練語言模型,擁有強大的生成能力和多任務處理能力,推動了自然語言處理(NLP)的快速發展。

一 GPT發展歷程

1.1 GPT-1(2018年)

是首個基于Transformer架構的模型,使用掩碼自注意力機制,但是僅僅關注了參數左側數據,沒有關注右側數據,是之前文章學習過的單項Transformer,用這個也是為了模擬人類的自左向右生成語言的方式,并確保模型在訓練和生成時的邏輯一致性。

參數量僅有1.17億,與后面的幾代比還是相差非常多的。采用了預訓練+微調范式的方法,預訓練大量的無標簽文本,學習其內容,如語法,語義,將其分類壓縮(語言建模任務),再針對下游任務在特定的小規模標注數據上微調,使模型適應具體任務。

預訓練像“通識教育”,下游任務像“專業培訓”。

概念說明
預訓練任務模型初始訓練的任務(如語言建模、掩碼預測),用于學習通用特征。
下游任務具體應用任務(如情感分析、翻譯),需要在預訓練基礎上額外調整。
微調將預訓練模型適配到下游任務的過程,通常需要少量標注數據。

1.2 GPT-2(2019)

參數量擴大到15億,預訓練的數據更多。新增零樣本學習,無需微調即可完成多任務(如翻譯、摘要),但效果有限,并且會生成看上去挺真但實際上是假的的文本。

零樣本學習(Zero-shot Learning)是一種機器學習方法,其核心是讓模型使用已有的預訓練的通用知識積累對輸入指令的語義理解,泛化到新任務中,從而完成新任務。

1.3 GPT-3(2020)

參數量驟增到1750億,其核心特點是使用了少樣本學習(Few-shot),僅需少量示例即可適應新任務(如寫代碼、創作故事)。但是生成內容可能包含偏見,且存在邏輯錯誤。

1.4 Codex(2021)

基于GPT-3進行了微調,支持生成代碼,是GitHub Copilot的基礎。

GitHub Copilot 是由 GitHub 和 OpenAI 聯合開發的 AI 代碼輔助工具,旨在幫助開發者更高效地編寫代碼。

1.5?ChatGPT(2022)

采用RLHF(人類反饋強化學習)優化對話能力,減少有害輸出。

RLHF(Reinforcement Learning from Human Feedback,人類反饋強化學習)是一種結合強化學習(Reinforcement Learning)人類反饋的技術,用于優化AI模型的行為,使其更符合人類的價值觀和需求。

其關鍵步驟為:

(1)預訓練模型(Supervised Fine-Tuning, SFT)

(2)訓練獎勵模型(Reward Model, RM)

數據收集:針對同一輸入(如用戶提問),讓預訓練模型生成多個候選回答。

人類標注:由標注員對這些回答進行排序或打分(例如基于回答的準確性、善意程度)。

獎勵模型構建:學習人類偏好,預測任意回答的“質量得分”(如用排序轉化為分數)。

(3)強化學習優化策略(如PPO算法)

將預訓練模型作為初始策略,獎勵模型作為環境反饋,通過交互迭代優化模型生成的內容,最大化獎勵得分。

示例:模型生成回答 → 獎勵模型打分 → 算法調整參數使高得分回答的概率增加。

1.6?GPT-4(2023)

支持多模態輸入(文本+圖像),推理能力進一步提升。

二 GPT核心架構

2.1?Transformer解碼器堆疊

GPT僅使用Transformer的解碼器層,每層包含掩碼自注意力機制和前饋網絡。掩碼確保生成時每個詞僅依賴左側上下文。

2.2?自回歸生成

逐詞生成文本,每次預測下一個詞的概率分布

三 訓練方法

(1) 預訓練(無監督)

任務:語言建模(預測下一個詞)。

數據源:海量文本(如書籍、網頁)。

(2) 微調(有監督)

傳統方法(如GPT-1):針對特定任務(如情感分析)用標注數據調整參數。

基于提示(如GPT-3+):通過設計輸入提示(Prompt)直接引導模型生成答案,無需參數更新。

RLHF(如ChatGPT):通過人類反饋訓練獎勵模型,再用強化學習優化生成策略。

四?關鍵挑戰與局限

生成內容的可靠性:可能產生錯誤或捏造信息(“幻覺”問題)。

偏見與倫理風險:訓練數據中的偏見可能導致歧視性輸出。

計算成本高昂:GPT-3訓練耗資數百萬美元,限制研究可及性。

可解釋性差:模型內部機制復雜,難以追蹤決策過程。

GPT系列通過迭代創新,逐步突破語言模型的邊界,展現出強大的通用性和適應性。盡管面臨挑戰,其在各行業的應用前景使其成為AI領域的重要里程碑。未來的發展將聚焦于提升效率、安全性及多模態融合。

本文來自互聯網用戶投稿,該文觀點僅代表作者本人,不代表本站立場。本站僅提供信息存儲空間服務,不擁有所有權,不承擔相關法律責任。
如若轉載,請注明出處:http://www.pswp.cn/bicheng/81509.shtml
繁體地址,請注明出處:http://hk.pswp.cn/bicheng/81509.shtml
英文地址,請注明出處:http://en.pswp.cn/bicheng/81509.shtml

如若內容造成侵權/違法違規/事實不符,請聯系多彩編程網進行投訴反饋email:809451989@qq.com,一經查實,立即刪除!

相關文章

網絡檢測工具InternetTest v8.9.1.2504 單文件版,支持一鍵查詢IP/DNS、WIFI密碼信息

—————【下 載 地 址】——————— 【?本章下載一】:https://drive.uc.cn/s/295e068b79314 【?本章下載二】:https://pan.xunlei.com/s/VOQDXguH0DYPxrql5y2zlkhTA1?pwdg2nx# 【百款黑科技】:https://ucnygalh6wle.feishu.cn/wiki/…

CSS- 4.1 浮動(Float)

本系列可作為前端學習系列的筆記,代碼的運行環境是在HBuilder中,小編會將代碼復制下來,大家復制下來就可以練習了,方便大家學習。 HTML系列文章 已經收錄在前端專欄,有需要的寶寶們可以點擊前端專欄查看! 點…

配置WebStorm鍵盤快捷鍵

目錄 配置快捷鍵添加鍵盤快捷鍵添加鼠標快捷鍵添加縮寫重置為默認快捷鍵 禁用雙快捷鍵用戶快捷鍵的保存位置與操作系統沖突 配置快捷鍵 WebStorm包含預定義的快捷鍵,同時允許自定義快捷鍵。要查看快捷鍵配置,請打開“設置”對話框,然后選擇K…

Java 21 + Spring Boot 3.5:AI驅動的高性能框架實戰

簡介 在微服務架構日益普及的今天,如何構建一個既高性能又具備AI驅動能力的后端系統成為開發者關注的焦點。本篇文章將深入探討Java 21與Spring Boot 3.5的結合,展示如何通過Vector API和JIT優化實現單線程性能提升30%,并利用飛算JavaAI生成智能重試機制和超時控制代碼,解…

Matrix-Game:鍵鼠實時控制、實時生成的游戲生成模型(論文代碼詳細解讀)

1.簡介 本文介紹了一種名為Matrix-Game的交互式世界基礎模型,專門用于可控的游戲世界生成。 Matrix-Game通過一個兩階段的訓練流程來實現:首先進行大規模無標簽預訓練以理解環境,然后進行動作標記訓練以生成交互式視頻。為此,研…

AI生成信息準確性,Ask-Refine提問策略,Agent最少的工具箱是什么樣的?

關于AI生成信息準確性的探討 在社群聊天記錄中,用戶提出在使用多種AI工具搜索培生出版企業上市信息時,遇到80%信息錯誤的問題,質疑AI為何無法勝任簡單的網絡信息爬取任務,并表達了對AI實用性的期望。 我抽空對此做出解答&#xff…

Linux系統中部署java服務(docker)

1、不使用docker ? 1. 檢查并安裝 Java 環境 檢查 Java 是否已安裝: java -version? 2. 上傳 Java 項目 JAR 文件 可以創建一個server文件夾,然后上傳目錄 查看當前目錄 然后創建目錄上傳jar包 ? 3. 啟動 Java 服務 java -jar hywl-server.jar…

遨游科普:三防平板是什么?有什么功能?

清晨的露珠還掛在帳篷邊緣,背包里的三防平板卻已開機導航;工地的塵土飛揚中,工程師正通過它查看施工圖紙;暴雨傾盆的救援現場,應急隊員用它實時回傳災情數據……這些看似科幻的場景,正因三防平板的普及成為…

Flask Docker Demo 項目指南

首先,創建一個新的項目目錄并創建必要的文件: mkdir flask-docker-demo cd flask-docker-demo創建一個簡單的Flask應用 (app.py): from flask import Flaskapp Flask(__name__)app.route(/) def hello_world():return Hello, Docker World…

GO語言語法---if語句

文章目錄 1. 基本語法1.1 單分支1.2 雙分支1.3 多分支 2. Go特有的if語句特性2.1 條件前可以包含初始化語句2.2 條件表達式不需要括號2.3 必須使用大括號2.4 判斷語句所在行數控制 Go語言的if語句用于條件判斷,與其他C風格語言類似,但有一些獨特的語法特…

自動化 NuGet 包打包與上傳:完整批處理腳本詳解(含 SVN 支持)

在大型項目中,我們常常需要定期打包多個 .csproj 項目為 NuGet 包,并上傳到私有 NuGet 服務。這篇文章分享一份實戰腳本,支持以下自動化流程: 自動讀取、更新 .csproj 文件中的 Version、PackageOutputPath 等節點; 自…

刷leetcodehot100返航版--雙指針5/16

for (int i 0, j 0; i < n; i ) { while (j < i && check(i, j)) j ; // 具體問題的邏輯 } 常見問題分類&#xff1a; (1) 對于一個序列&#xff0c;用兩個指針維護一段區間 (2) 對于兩個序列&#xff0c;維護某種次序&#xff0c;比如歸并排序中…

手撕四種常用設計模式(工廠,策略,代理,單例)

工廠模式 一、工廠模式的總體好處 解耦&#xff1a;客戶端與具體實現類解耦&#xff0c;符合“開閉原則”。統一創建&#xff1a;對象創建交由工廠處理&#xff0c;便于集中控制。增強可維護性&#xff1a;新增對象種類時不需要大改動調用代碼。便于擴展&#xff1a;易于管理…

阿里通義萬相 Wan2.1-VACE:開啟視頻創作新境界

2025 年 5 月 14 日&#xff0c;阿里巴巴為視頻創作領域帶來了重磅驚喜 —— 開源通義萬相 Wan2.1-VACE。這一模型堪稱視頻生成與編輯領域的集大成者&#xff0c;憑借其全面且強大的功能&#xff0c;為廣大創作者、開發者以及企業用戶開辟了全新的視頻創作天地。它打破了以往視…

自定義類、元組、字典和結構體對比——AutoCAD C# 開發中建立不同對象之間的聯系

以下是對它們的詳細分析和對比&#xff1a; 1. 自定義類&#xff08;Class&#xff09; 優勢 封裝性強&#xff1a;可以定義字段、屬性、方法和事件&#xff0c;實現復雜的行為和邏輯。繼承與多態&#xff1a;支持繼承體系&#xff0c;可通過接口或抽象類實現多態。引用類型…

MVC架構模式

mvc架構是一種常見的開發模式,以下是三個核心部分 Model&#xff08;模型&#xff09;&#xff1a;負責應用程序的數據和業務邏輯。它與數據庫交互&#xff0c;處理數據的存儲、檢索和更新&#xff0c;是應用程序的核心業務所在。View&#xff08;視圖&#xff09;&#xff1a…

Python實例題:Python百行制作登陸系統

目錄 Python實例題 題目 python-login-systemPython 百行登錄系統腳本 代碼解釋 用戶數據庫&#xff1a; 注冊功能&#xff1a; 登錄功能&#xff1a; 主程序&#xff1a; 運行思路 注意事項 Python實例題 題目 Python百行制作登陸系統 python-login-systemPython…

uniapp使用全局組件,

在 Uniapp 中&#xff0c;如果你的組件是應用層組件&#xff08;例如全局懸浮按鈕、全局通知欄等&#xff09;&#xff0c;并且希望它自動出現在所有頁面而無需在每個頁面模板中手動添加組件標簽&#xff0c;可以通過以下兩種方案實現&#xff1a; 方案一&#xff1a;通過 app.…

(8)python開發經驗

文章目錄 1 下載python2 pip安裝依賴無法訪問3 系統支持4 下載python文檔5 設置虛擬環境6 編譯安裝python 更多精彩內容&#x1f449;內容導航 &#x1f448;&#x1f449;Qt開發 &#x1f448;&#x1f449;python開發 &#x1f448; 1 下載python 下載地址盡量不要下載最新版…

【原創】基于視覺大模型gemma-3-4b實現短視頻自動識別內容并生成解說文案

&#x1f4e6; 一、整體功能定位 這是一個用于從原始視頻自動生成短視頻解說內容的自動化工具&#xff0c;包含&#xff1a; 視頻抽幀&#xff08;可基于畫面變化提取關鍵幀&#xff09; 多模態圖像識別&#xff08;每幀圖片理解&#xff09; 文案生成&#xff08;大模型生成…