003大模型基礎知識

大模型分類:
技術架構: Encoder Only Bert
Decoder Only 著名的大模型都是
Encoder - Decoder T5
是否開源: 開源陣營: Llama DeepSeek Qwen
閉源陣營: ChatGpt Gemini Claude

語言模型發展階段: 基于規則統計 n-gram:上下文比較短,數據稀疏,泛化能力差
神經網絡語言模型:泛化能力差(解決) 數據稀疏(解決) RNN,LSTM
Transformer: Bert,GPT
LLM:參數以 10 億計
評估指標: BLEU 精準率,需要有參考答案
ROUGE 召回率 需要有參考答案
PPL
大模型演進路線: Encoder-only 雙向注意力機制,完形填空,閱讀理解,Pre-train+下游任務fine-tuning
Decoder-only gpt:
gpt2:
gpt3:
Encoder-Decoder : T5


在這里插入圖片描述
在這里插入圖片描述
在這里插入圖片描述
在這里插入圖片描述
RLHF解決的是什么問題? 對齊問題,訓練一個獎勵模型

在這里插入圖片描述
位置編碼:
在這里插入圖片描述

總結:

強化學習:
ChatGPT SFT :人類價值觀對齊,
RLHF: 訓練獎勵模型, 人的參與是為了準備訓練獎勵模型的語料
強化學習:Agent,Environment,state,Policy,Reward
PPO:

不同大模型的差異:
位置編碼: 傳統Transformer,相對位置編碼,旋轉位置編碼(用的最多),ALiBi
注意力機制:
LN:層歸一化:
前饋神經網絡:MOE

本文來自互聯網用戶投稿,該文觀點僅代表作者本人,不代表本站立場。本站僅提供信息存儲空間服務,不擁有所有權,不承擔相關法律責任。
如若轉載,請注明出處:http://www.pswp.cn/web/89012.shtml
繁體地址,請注明出處:http://hk.pswp.cn/web/89012.shtml
英文地址,請注明出處:http://en.pswp.cn/web/89012.shtml

如若內容造成侵權/違法違規/事實不符,請聯系多彩編程網進行投訴反饋email:809451989@qq.com,一經查實,立即刪除!

相關文章

JVM監控及診斷工具-GUI篇

19.1. 工具概述 使用上一章命令行工具或組合能幫您獲取目標Java應用性能相關的基礎信息,但它們存在下列局限: 1.無法獲取方法級別的分析數據,如方法間的調用關系、各方法的調用次數和調用時間等(這對定位應用性能瓶頸…

適用于Windows系統截圖工具

1.Faststone Capture 官網網址:https://faststone-capture.com/ 網上很多注冊碼:https://www.cnblogs.com/LiuYanYGZ/p/16839503.html 2.Snipaste 官網網址:https://apps.microsoft.com/detail/9p1wxpkb68kx?launchtrue&modefull&…

區塊鏈的三種共識機制——PoW、PoS和DPoS原理

區塊鏈的核心是去中心化網絡的信任機制,而共識機制是實現這一目標的關鍵。共識機制可分為兩個階段:(1)提出共識內容(2)對內容達成共識(遵循最長鏈原則)。三種主流的共識機制主要有工…

React 和 Vue的自定義Hooks是如何實現的,如何創建自定義鉤子

目的:將公共邏輯提取出來,類似于 mixin,解決了mixin的設計缺陷。 React 和 Vue 自定義 Hooks 實現對比 React 自定義 Hooks React 的自定義 Hooks 是 JavaScript 函數,它們以 use 開頭,可以調用其他 Hooks。 基本規則 …

構建高效事件驅動架構:AWS S3與SQS集成實踐指南

引言 在現代云架構中,事件驅動的設計模式越來越受到開發者的青睞。AWS S3與SQS的集成為我們提供了一個強大的事件處理機制,能夠在文件上傳、刪除或修改時自動觸發后續的業務邏輯。本文將詳細介紹如何配置S3事件通知到SQS隊列,并分享實際項目中的最佳實踐。 架構概述 S3事…

C++ -- STL-- List

////// 歡迎來到 aramae 的博客,愿 Bug 遠離,好運常伴! ////// 博主的Gitee地址:阿拉美 (aramae) - Gitee.com 時代不會辜負長期主義者,愿每一個努力的人都能達到理想的彼岸。1. list的介紹及使用 2. list的深度剖…

rt-thread 線程間同步方法詳解

rt-thread 線程間同步方法詳解一、什么是線程間同步線程同步的必要性線程同步的挑戰二、同步方式1、信號量信號量工作機制信號量的管理方式信號量的創建與刪除信號量的獲取與釋放信號量的典型應用場景信號量的注意事項2、互斥量互斥量工作機制互斥量的特性互斥量的操作接口互斥…

Spring Boot + Vue2 實現騰訊云 COS 文件上傳:從零搭建分片上傳系統

目錄 一、項目目標 二、騰訊云 COS 基本配置 1. 創建存儲桶 2. 獲取 API 密鑰 3. 設置跨域規則(CORS) 三、后端(Spring Boot)實現 1. 依賴配置 2. 配置騰訊云 COS(application.yml) 3. 初始化 COS…

使用 Java 獲取 PDF 頁面信息(頁數、尺寸、旋轉角度、方向、標簽與邊框)

目錄 引言 一、安裝和引入PDF處理庫 二、獲取 PDF 頁數 三、獲取頁面尺寸(寬高) 四、獲取頁面旋轉角度 五、判斷頁面方向(橫向 / 縱向) 六、獲取頁面標簽 七、獲取頁面邊框信息 八、總結 引言 了解 PDF 頁面屬性是我們在…

基于 AI 的大前端安全態勢感知與應急響應體系建設

大前端應用(Web、APP、小程序)作為用戶交互的入口,面臨日益復雜的安全威脅:從傳統的 XSS 攻擊、CSRF 偽造,到新型的供應鏈投毒、AI 驅動的自動化爬蟲,再到針對業務邏輯的欺詐攻擊(如薅羊毛、賬號…

Java 與 MySQL 性能優化:MySQL全文檢索查詢優化實踐

文章目錄一、引言二、InnoDB引擎下的全文檢索功能詳解2.1 全文索引的基本概念與原理2.2 全文索引的創建與管理2.3 全文檢索的三種查詢模式2.4 中文全文檢索的挑戰與解決方案三、CMS 場景下的全文檢索性能瓶頸分析3.1 索引構建與維護開銷3.2 查詢性能瓶頸3.3 鎖機制與并發性能問…

應用軟件格式滲透 利用word去滲透(MS10-087)

用到的靶機為:WinXP漏洞原理:一、漏洞觸發機制與核心組件 漏洞根源:RTF文件解析邏輯缺陷 觸發組件:Microsoft Word的RTF(Rich Text Format)解析引擎,具體涉及 mso.dll 模塊中的 路徑規范化函數&…

解密AWS VPC路由表:顯式關聯與隱式關聯,誰決定了網絡出口?

大家好,今天我們來聊一個在 AWS 云計算世界里既基礎又關鍵的話題:VPC 路由表。 很多剛接觸 AWS 的朋友,在配置網絡時可能會遇到這樣的困惑:為什么我的 EC2 實例無法訪問互聯網?為什么某些子網的網絡策略和其他子網不一…

LeetCode題解---<203.移除鏈表元素>

文章目錄題目代碼及注釋關鍵點題目 給你一個鏈表的頭節點 head 和一個整數 val ,請你刪除鏈表中所有滿足 Node.val val 的節點,并返回 新的頭節點 。 示例 1: 輸入:head [1,2,6,3,4,5,6], val 6 輸出:[1,2,3,4,…

【JavaScript高級】構造函數、原型鏈與數據處理

目錄構造函數和原型構造函數實例成員和靜態成員構造函數的問題構造函數原型 prototype對象原型 \_\_proto\_\_constructor 構造函數構造函數、實例、原型對象三者之間的關系原型鏈JavaScript 的成員查找機制(規則)原型對象的this指向擴展內置對象繼承cal…

項目進度與預算脫節,如何進行同步管理

項目進度與預算脫節會導致資源浪費、成本超支和項目延期。進行同步管理的方法包括:建立統一的項目進度預算管理體系、實施實時監控與反饋機制、采用項目管理工具輔助同步管理。尤其是實施實時監控與反饋機制,通過持續監測進度與預算的匹配情況&#xff0…

TCP半關閉

理解TCP半關閉:像水管一樣的網絡連接控制 從全關閉到半關閉:為什么需要這種機制? 想象你和朋友正在通電話討論一個重要項目: 全關閉:就像突然掛斷電話,雙方都無法再說話半關閉:你說"我說完…

衡石科技技術手冊--儀表盤過濾控件詳解

過濾控件說明 過濾控件 的定義 過濾控件用于在儀表盤中過濾圖表數據,分為儀表盤內過濾控件和全局過濾控件。 過濾控件結構說明 字段類型描述uidSTRING過濾控件唯一識別 idappIdLONG過濾控件所屬的應用 iddataAppIdLONG字段來源是數據包時的數據包 iddashboar…

ASP.NET Core中數據綁定原理實現詳解

在ASP.NET Core 中,數據綁定是將 HTTP 請求中的數據(如表單、查詢字符串、請求體等)映射到控制器動作方法參數或模型對象的過程。以下將從原理、核心組件、執行流程及關鍵機制等方面詳細解析其實現邏輯。 一、數據綁定的核心原理與組件 1. 數…

牛客:HJ24 合唱隊[華為機考][最長遞增子集][動態規劃]

學習要點 求最長遞增字列求最長遞減子列 題目鏈接 合唱隊_牛客題霸_牛客網 題目描述 解法&#xff1a;動歸求最長遞增子列 #include <iostream> #include <vector> using namespace std;int main() {int n;while (cin >> n) {// 輸入的數組int tmp;vect…