大語言模型(LLM)入門 - (1) 相關概念

文章來自:大語言模型(LLM)小白入門自學項目-TiaoYu-1

GitHub - tiaoyu1122/TiaoYu-1: For People! For Freedom!For People! For Freedom! Contribute to tiaoyu1122/TiaoYu-1 development by creating an account on GitHub.https://github.com/tiaoyu1122/TiaoYu-1

項目優點:

  1. 行行代碼都有“中文注釋”,方便閱讀與理解。
  2. 覆蓋了?全部訓練流程,包括:預訓練、有監督微調(SFT)、人類反饋強化學習(ELHF)、LoRA微調、推理模型訓練(Reasoning)、知識蒸餾(KD)等。
  3. 配套有原理文檔

閱讀順序推薦:

相關概念(文檔)?->?模型構建(文檔)?->?(粗讀)模型超參數(代碼)?->?(可選)預訓練數據下載(代碼)?->?(可選)預訓練數據處理(代碼)?->?分詞器(文檔)?->?分詞器(代碼)?->?(可選)分詞器模型(json文件)?->?LLM模型整體結構(代碼)?->?模型超參數(代碼)->?嵌入層(文檔)?->?正則化(文檔)?->?位置編碼(文檔)?->?位置編碼(代碼)?->?歸一化(文檔)?->?歸一化(代碼)?->?線性層(文檔)->?激活函數(文檔)?->?解碼器(文檔)?->?解碼器(代碼)?多頭掩碼自注意力機制(文檔)?->?多頭掩碼自注意力機制(代碼)?->Flash Attention(文檔)?->?MOE前饋神經網絡(文檔)?->?MOE前饋神經網絡(代碼)?->?輸出結果類(代碼)?->?預訓練數據加載(代碼)?->?交叉熵損失函數(文檔)?->?信息量、熵、交叉熵、KL散度等(文檔)?->?優化器(文檔)?->?(復習)模型構建(文檔)?->?預訓練(代碼)?->?SFT(代碼)?->?人類反饋強化學習(文檔)?->?人類反饋強化學習(代碼)?->?LoRA微調(代碼)?->?知識蒸餾(代碼)?->?推理模型訓練(代碼)?(可選)分類模型評價指標(文檔)?->?(可選)梯度消失與梯度爆炸(文檔)?->?(可選)非極大抑制算法(文檔)->?(可選)GPT和BERT(文檔)?->?(可選)Q-Former(文檔)


本文來自互聯網用戶投稿,該文觀點僅代表作者本人,不代表本站立場。本站僅提供信息存儲空間服務,不擁有所有權,不承擔相關法律責任。
如若轉載,請注明出處:http://www.pswp.cn/web/82106.shtml
繁體地址,請注明出處:http://hk.pswp.cn/web/82106.shtml
英文地址,請注明出處:http://en.pswp.cn/web/82106.shtml

如若內容造成侵權/違法違規/事實不符,請聯系多彩編程網進行投訴反饋email:809451989@qq.com,一經查實,立即刪除!

相關文章

LearnOpenGL-筆記-其十一

Normal Mapping 又到了介紹法線貼圖的地方,我感覺我已經寫了很多遍了... 法線貼圖用最簡單的話來介紹的話,就是通過修改貼圖對應物體表面的法線來修改光照效果,從而在不修改物體實際幾何形狀的前提下實現不同于物體幾何形狀的視覺效果。 因…

Spring Boot 讀取.env文件獲取配置

Spring Boot 讀取.env文件獲取配置 在Resouce 目錄下創建.env文件 # DEEP SEEK TOKEN DEEP_SEEK_TOKENyour_deep_seek_key # 阿里云百煉 TOKEN ALI_BAILIAN_TOKENyour_ali_bailian_keyyml引入.env文件 spring:config:import: optional:classpath:.env[.properties]使用.env文…

【C++高級主題】命令空間(三):未命名的命名空間

目錄 一、未命名的命名空間的基本概念 1.1 定義與特點 1.2 基本語法 1.3 訪問方式 1.4 未命名的命名空間的作用 二、未命名的命名空間與靜態聲明的比較 2.1 靜態聲明的作用 2.2 未命名的命名空間的優勢 2.3 示例代碼比較 2.4. 未命名的命名空間的作用域和鏈接屬性 三…

【Unity】AudioSource超過MaxDistance還是能聽見

unity版本:2022.3.51f1c1 將SpatialBlend拉到1即可 或者這里改到0 Hearing audio outside max distance - #11 by wderstine - Questions & Answers - Unity Discussions

多個vue2工程共享node_modules

手頭有多個vue2項目,它們每個都需要一個node_modules,拷貝起來超級麻煩。于是想到能否共享一個node_modules呢?? 方法其實挺多,我選擇了一個較簡單的:符號連接法(win11平臺) 創建方法很簡單:比…

C語言-10.字符串

10.1字符串 10.1-1字符串 字符數組 char word[] = {‘H’,‘e’,‘l’,‘l’,‘o’,‘!’}; word[0]Hword[1]eword[2]lword[3]lword[4]oword[5]!這不是C語言的字符串,因為不能用字符串的方式做計算 字符串 char word[] = {‘H’,‘e’,‘l’,‘l’,‘o’,‘!’}; word[0]Hwo…

Python訓練營打卡Day41(2025.5.31)

知識回顧 數據增強卷積神經網絡定義的寫法batch歸一化:調整一個批次的分布,常用與圖像數據特征圖:只有卷積操作輸出的才叫特征圖調度器:直接修改基礎學習率 卷積操作常見流程如下: 1. 輸入 → 卷積層 → Batch歸一化層…

樂觀鎖:高效并發無鎖方案

4.樂觀鎖 這一章主要介紹樂觀鎖。前面的管程部分講了悲觀鎖,現在做一些總結: 悲觀鎖(Pessimistic Lock):悲觀鎖認為數據在多線程或多進程環境下總是容易發生沖突/沖突的概率高,所以在數據操作前&#xff…

山海鯨輕 3D 渲染技術深度解析:預渲染如何突破多終端性能瓶頸

在前期課程中,我們已系統講解了山海鯨兩大核心渲染模式——云渲染與端渲染的技術特性及配置方法。為滿足復雜場景下的差異化需求,山海鯨創新推出輕3D渲染功能,本文將深度解析該技術的實現原理與操作實踐。 一、輕3D功能研發背景 針對多終端協…

【合集】Linux——31個普通信號

Linux普通信號總表(1-31)?? ?編號??信號名??觸發原因??默認動作?1SIGHUP終端連接斷開(如SSH會話終止)或守護進程重載配置(如nginx -s reload)終止進程2SIGINT用戶輸入CtrlC中斷前臺進程終止進程…

小程序使用npm包的方法

有用的鏈接 npm init -y 這個命令很重要, 會初始化 package.json 再重新打開微信小程序開發工具 選擇工具中npm構建 在程序中引用時在main.js中直接使用包名的方式引用即可 如安裝的是generator包,npm構建后就會生成 const myPackage require(***-generato…

騰訊云推出云開發AI Toolkit,國內首個面向智能編程的后端服務

5月28日,騰訊云開發 CloudBase 宣布推出 AI Toolkit(CloudBase AI Toolkit),這是國內首個面向智能編程的后端服務,適配 Cursor 等主流 AI 編程工具。 云開發 AI Toolkit旨在解決 AI 輔助編程的“最后一公里”問題&…

系統是win11+兩個ubuntu,ubuntu20.04和ubuntu22.04,想刪除ubuntu20.04且不用保留數據

在 Ubuntu 22.04 的終端里運行這些命令: 重啟電腦,選擇啟動 Ubuntu 22.04;打開終端;從 lsblk 開始操作。 如果你不確定當前啟動的是哪個系統,可以在終端輸入: lsb_release -a它會輸出: Distributor ID: …

大模型應用開發第三講:大模型是Agent的“大腦”,提供通用推理能力(如GPT-4、Claude 3)

大模型應用開發第三講:大模型是Agent的“大腦”,提供通用推理能力(如GPT-4、Claude 3) 資料取自《大模型應用開發:動手做AI Agent 》。 查看總目錄:學習大綱 關于DeepSeek本地部署指南可以看下我之前寫的…

第十四篇:MySQL 運維中的故障場景還原與排查實戰技巧

本篇通過典型故障場景的還原與分析,幫助你掌握高效、系統的 MySQL 故障排查與應急處理方法,構建穩定可靠的數據庫運維體系。 一、故障排查的基本思路 快速定位問題入口: 錯誤日志、連接報錯、監控告警; 確認影響范圍&#xff1a…

MySQL 分頁查詢優化

目錄 前言1. LIMIT offset, count 的性能陷阱:為什么它慢?😩2. 優化策略一:基于排序字段的“跳躍式”查詢 (Seek Method) 🚀3. 優化策略二:利用子查詢優化 OFFSET 掃描 (ID Subquery)4. 基礎優化&#xff1…

使用curlconverter網站快速生成requests請求包

在python寫requests請求的時候,抓包后需要復制粘貼包的內容,然后手動修改和寫代碼。 最近發現一個好的網站 https://curlconverter.com/python/ 可以復制curl(bash)數據后,直接生成數據包,非常便捷。 舉例說明: 選…

python打卡day41

簡單CNN 知識回顧 數據增強 卷積神經網絡定義的寫法 batch歸一化:調整一個批次的分布,常用與圖像數據 特征圖:只有卷積操作輸出的才叫特征圖 調度器:直接修改基礎學習率 卷積操作常見流程如下: 1. 輸入 → 卷積層 →…

系統思考:化繁為簡的藝術

系統思考,其實是一門化繁為簡的藝術。當我們能夠把復雜的問題拆解成清晰的核心以及更加簡單,從而提升團隊的思考品質和行動品質,發揮最大的合力。 每個公司都想在某方面成為最優秀的,但是實際上具有穿透性的洞察力和擺脫虛榮心的清…

2025.05.28【Parallel】Parallel繪圖:擬時序分析專用圖

Improve general appearance Add title, use a theme, change color palette, control variable orders and more Highlight a group Highlight a group of interest to help people understand your story 文章目錄 Improve general appearanceHighlight a group探索Paralle…