大語言模型-1.2-大模型技術基礎

簡介

本博客內容是《大語言模型》一書的讀書筆記,該書是中國人民大學高瓴人工智能學院趙鑫教授團隊出品,覆蓋大語言模型訓練與使用的全流程,從預訓練到微調與對齊,從使用技術到評測應用,幫助學員全面掌握大語言模型的核心技術。并且,課程內容基于大量的代碼實戰與講解,通過實際項目與案例,學員能將理論知識應用于真實場景,提升解決實際問題的能力。
在這里插入圖片描述

本文主要記錄datawhale的活動學習筆記,可點擊活動連接

1.2 大模型技術基礎

大語言模型

在這里插入圖片描述
預訓練階段會得到base model,本質上就是一個互聯網文本模擬器,這個階段需要上萬臺服務器訓練幾個月的時間,這個生成的模型可以認為是互聯網的有損壓縮。這個互聯網文本模擬器很有意思,但我們想要的不是整個互聯網,而是我們提問,模型回答。
我們實際需要的是一個助手模型,在后訓練階段就可以訓練一個助手模型。在后訓練過程中,是一個監督微調SFT(supervised finetuning),整體的訓練過程,與預訓練過程一致。差別就在于數據集。這些對話數據集是人工標注問題和答案,當然現在很多也都是模型生成的。
這個助手模型中,如果不采用某些手段,模型會產生幻覺。
RL是強化學習,這個過程包括兩個階段,第一個階段是訓練一個獎勵模型,用于代替人類對可以驗證和不可以驗證的領域問題進行排序,然后基于獎勵模型實現RL。
在這里插入圖片描述

構建一個大語言模型

大語言模型預訓練(Pre-training)

使用與下游任務無關的大規模數據進行模型參數的初始訓練
? 基于Transformer解碼器架構,進行下一個詞預測
? 數據數量、數據質量都非常關鍵在這里插入圖片描述

大語言模型后訓練(Post-Training)

指令微調(Instruction Tuning)
? 使用輸入與輸出配對的指令數據對于模型進行微調
? 提升模型通過問答形式進行任務求解的能力
在這里插入圖片描述

人類對齊(Human Alignment)
? 將大語言模型與人類的期望、需求以及價值觀對齊
? 基于人類反饋的強化學習對齊方法(RLHF)
在這里插入圖片描述

大模型的研發已經成為一項系統工程

擴展定律(Scaling Law)

? 通過擴展參數規模、數據規模和計算算力,大語言模型的能力會出現顯著提升
? 擴展定律在本次大模型浪潮中起到了重要作用

在這里插入圖片描述
大語言模型采用了與小型預訓練語言模型相似的神經網絡結構(基于注意力機制的 Transformer 架構)和預訓練方法(如語言建模)。但是通過擴展參數規模、數據規模和計算算力,大語言模型的能力顯著超越了小型語言模型的能力。
有趣的是,這種通過擴展所帶來的性能提升通常顯著高于通過改進架構、算法等方面所帶來的改進。因此,建立定量的建模方法,即擴展法則(Scaling Law),

KM擴展定律

? OpenAI 團隊建立了神經語言模型性能與參數規模(𝑁)、數據規模(𝐷)和計算算力(𝐶)之間的冪律關系
在這里插入圖片描述

Chinchilla擴展定律

? DeepMind 團隊于 2022 年提出了另一種形式的擴展定律,旨在指導大語言模型充分利用給定的算力資源優化訓練

Hoffmann 等人 [22](DeepMind 團隊)于 2022 年提出了一種可選的擴展法則,旨在指導大語言模型充分利用給定的算力資源進行優化訓練。通過針對更大范圍的模型規模(70M 到 16B 參數)和數據規模(5B 到 500B 詞元)進行實驗,研究
在這里插入圖片描述
其中 𝐸 = 1.69, 𝐴 = 406.4, 𝐵 = 410.7,𝛼 = 0.34 和 𝛽 = 0.28。進一步,利用約束條件
𝐶 ≈ 6𝑁𝐷 對于損失函數 𝐿(𝑁, 𝐷) 進行推導,能夠獲得算力資源固定情況下模型規
模與數據規模的最優分配方案(如下所示):
在這里插入圖片描述

深入討論擴展定理

? 模型的語言建模損失可以進行下述分解
? 擴展定律可能存在邊際效益遞減
? 隨著模型參數、數據數量的擴展,模型性能增益將逐漸減小
? 目前開放數據已經接近枯竭,難以支持擴展定律的持續推進

涌現能力

什么是涌現能力
? 原始論文定義:“在小型模型中不存在、但在大模型中出現的能力”
? 模型擴展到一定規模時,特定任務性能突然出現顯著躍升趨勢,遠超隨機水平
在這里插入圖片描述
上下文學習(In-context Learning, ICL).
指令遵循(Instruction Following).
逐步推理(Step-by-step Reasoning)

上下文學習(In-context Learning)

? 在提示中為語言模型提供自然語言指令和任務示例,無需顯式梯度更新就能為測試樣本生成
預期輸出
在這里插入圖片描述

指令遵循(Instruction Following)

? 大語言模型能夠按照自然語言指令來執行對應的任務
在這里插入圖片描述

逐步推理(Step-by-step Reasoning)

? 在提示中引入任務相關的中間推理步驟來加強復雜任務的求解,從而獲得更可靠的答案
在這里插入圖片描述

涌現能力與擴展定律的關系

? 涌現能力和擴展定律是兩種描述規模效應的度量方法

大模型核心技術

? 規模擴展:擴展定律奠定了早期大模型的技術路線,產生了巨大的性能提升
? 數據工程:數據數量、數據質量以及配制方法極其關鍵
? 高效預訓練:需要建立可預測、可擴展的大規模訓練架構
? 能力激發:預訓練后可以通過微調、對齊、提示工程等技術進行能力激活
? 人類對齊:需要設計對齊技術減少模型使用風險,并進一步提升模型性能
? 工具使用:使用外部工具加強模型的弱點,拓展其能力范圍

本文來自互聯網用戶投稿,該文觀點僅代表作者本人,不代表本站立場。本站僅提供信息存儲空間服務,不擁有所有權,不承擔相關法律責任。
如若轉載,請注明出處:http://www.pswp.cn/bicheng/73156.shtml
繁體地址,請注明出處:http://hk.pswp.cn/bicheng/73156.shtml
英文地址,請注明出處:http://en.pswp.cn/bicheng/73156.shtml

如若內容造成侵權/違法違規/事實不符,請聯系多彩編程網進行投訴反饋email:809451989@qq.com,一經查實,立即刪除!

相關文章

uni-app打包成H5使用相對路徑

網上找了一圈,沒用,各種試,終于給試出來了,主要是網絡上的沒有第二步,只有第一步,導致打包之后請求的路徑沒有帶上域名 運行的基礎路徑設置為./ config.js文件里面的baseUrl路徑改成空字符,千萬…

Android UI性能優化

Android UI性能優化 一、UI性能優化基礎 1.1 UI渲染原理 Android系統的UI渲染是通過一個被稱為"UI線程"或"主線程"的單線程模型來完成的。系統會以16ms(約60fps)的固定時間間隔發送VSYNC信號,觸發UI的渲染流程。如果一幀的處理時間超過16ms,就會出現丟…

【16】單片機編程核心技巧:移位運算的應用

【16】單片機編程核心技巧:移位運算的應用 七律 移位 左遷乘二寄存移,右徙除二暫寄時。 二進玄機藏位里,一移妙法化玄機。 合璧分疆拼字節,置位清零控毫厘。 速效堪超乘除算,單片機中展神威。 摘要 移位運算是單片…

【Linux內核系列】:文件系統

🔥 本文專欄:Linux 🌸作者主頁:努力努力再努力wz ★★★ 本文前置知識: 文件系統初識 那么在我們此前關于文件的學習中,我們學習的都是進程與打開的文件之間的關系,以及打開的文件如何進行管理…

git commit messege 模板設置 (規范化管理git)

配置方法 git config --global core.editor vim (設置 Git 的默認編輯器為 Vim)在用戶根目錄下(~),創建一個.git_commit_msg文件,然后把下面的內容拷貝到文件中并保存。 [version][模塊][類型]{解決xxx問題…

Python和Docker實現AWS ECR/ECS上全自動容器化部署網站前端

以類似ChatGPT的網站前端界面的HTML頁面、CSS樣式表和JavaScript腳本為例,用Python代碼將整個前端代碼文件的目錄,其中包括所有創建的前端代碼文件用Docker打包成鏡像文件,提前檢查Docker軟件是否已經安裝,并如果容器服務不存在&a…

無人機全景應用解析與技術演進趨勢

無人機全景應用解析與技術演進趨勢 ——從立體安防到萬物互聯的空中革命 一、現有應用場景全景解析 (一)公共安全領域 1. 立體安防體系 空中哨兵:搭載 77 GHz 77\text{GHz} 77GHz毫米波雷達(探測距離 5 km 5\text{km} 5km&…

ChatGPT4.5詳細介紹和API調用詳細教程

OpenAI在2月27日發布GPT-4.5的研究預覽版——這是迄今為止OpenAI最強大、最出色的聊天模型。GPT-4.5在擴大預訓練和微調規模方面邁出了重要的一步。通過擴大無監督學習的規模,GPT-4.5提升了識別內容中的模式、建立內容關聯和生成對于內容的見解的能力,但…

AI 中對內存的龐大需求

剛接觸AI時,只知道AI對顯存的要求很高,但慢慢發現,AI對內存的要求也越來越高了。 最近嘗試玩下 wan 2.1 ,進行圖生視頻,使用comfyui官方工作流,720p(720*1280)53幀,結果…

如何選擇適合您智能家居解決方案的通信協議?

如何選擇適合您智能家居解決方案的通信協議? 在開發智能家居產品時,選擇合適的通信協議對于設備的高效運行及其在智能家居系統中的互操作性至關重要。市面上協議眾多,了解它們的特性并在做決定前考慮各種因素是非常必要的。以下是一些幫助您…

L3-1 奪寶大賽

輸入樣例 1: 5 7 1 1 1 1 1 0 1 1 1 1 1 1 0 0 1 1 0 2 1 1 1 1 1 0 0 1 1 1 1 1 1 1 1 1 1 7 1 5 7 1 1 1 5 5 3 1 3 5 1 4輸出樣例 1: 7 6樣例 1 說明: 七支隊伍到達大本營的時間順次為:7、不可能、5、3、3、5、6&#xff0c…

C# AOT生成的hellowwordEXE運行占用多少內存1-5MB?

C# 使用 AOT(Ahead - Of - Time,提前編譯)生成的 "Hello, World!" 可執行文件在運行時占用的內存會受到多種因素的影響,以下是詳細分析: 影響內存占用的因素 操作系統:不同的操作系統&#xff0…

nextJs在DOM視圖中渲染未轉為狀態值的localStorage導致報錯

報錯但不限于如下&#xff1a; error: hydration failed because the initial ui does not match what was rendered on the server. Did not expect server HTML to contain a <span> in <div>. hook.js:608 warning: expected server html to contain a match…

macOS 安裝 Homebrew、nvm 及安裝切換 node 版本

一、安裝Homebrew 提示&#xff1a;在安裝 nvm 時&#xff0c;如果使用 brew 方式安裝&#xff0c;就要先安裝 Homebrew 1、打開終端&#xff0c;輸入以下指令&#xff08;官網可獲取最新命令&#xff09;&#xff1a; 國外鏡像 /bin/bash -c "$(curl -fsSL https://ra…

海思高安主控芯片兼容編譯fastboot流程

華為海思主控芯片有高安和非高安之分&#xff0c;主要是安全性上區別&#xff0c;啟動程序不同&#xff0c;一般無法共用。但實際生產中可能出現混料或者同一款產品不同批次一個是高安的一個是非高安的&#xff0c;這時就需要軟件上做兼容&#xff0c;實際是高安固件是可以做到…

大模型在甲狀腺腫瘤預測及治療方案制定中的應用研究

目錄 一、引言 1.1 研究背景與意義 1.2 研究目的與創新點 1.3 研究方法與數據來源 二、甲狀腺腫瘤概述 2.1 甲狀腺腫瘤分類及特征 2.2 甲狀腺腫瘤的發病率與危害 2.3 現有診斷與治療手段概述 三、大模型技術原理與應用現狀 3.1 大模型的基本原理與架構 3.2 大模型在…

Java學習——day20

文章目錄 1. 異常處理與優化1.1 在文件操作中使用 try-catch1.2 try-with-resources 語法1.3 使用 finally 塊關閉資源1.4 代碼健壯性與優化 2. 實踐任務2.1 改進思路2.2 示例改進要點2.3 檢查點 3. 總結3.1 改進后的完整代碼&#xff1a; 4. 今日生詞 今日學習目標&#xff1a…

ajax組件是什么

在 Vue 項目中與后端接口通信&#xff0c;通常有以下幾種常用的方式和組件&#xff1a; ### 1. **使用 Axios 進行 HTTP 請求** Axios 是一個基于 Promise 的 HTTP 客戶端&#xff0c;適用于瀏覽器和 Node.js 環境。它支持請求和響應攔截、自動轉換 JSON 數據、取消請求等功能…

C# WPF 基礎知識學習(二)

四、數據綁定 &#xff08;一&#xff09;數據綁定基礎 綁定源和目標&#xff1a;數據綁定建立了 UI 元素&#xff08;綁定目標&#xff09;屬性與數據源&#xff08;綁定源&#xff09;之間的聯系。例如&#xff0c;將一個TextBox的Text屬性綁定到一個對象的某個屬性上。綁定…

Trae AI IDEA安裝與使用

文章目錄 背景第一步、下載安裝第二步、登錄與使用優勢異常處理 背景 最近比較熱的 Trae 開發工具&#xff0c;在本地下載使用&#xff0c;記錄下來。 第一步、下載安裝 下載地址&#xff1a;【Trae中文版下載地址】&#xff0c;下載的安裝文件名為&#xff1a;【Trae CN-Se…