大語言模型(LLM)專業術語匯總

1. 訓練與部署

1.1 預訓練

  • 專業:在海量無標注文本(如Common Crawl、Wikipedia)上通過自監督學習訓練基礎語言模型,學習通用語言表征(如GPT-3訓練數據達45TB)。
  • 通俗:AI的“通識教育階段”,通過閱讀互聯網百科全書掌握基本語言規則。

1.2 微調(SFT)

  • 專業:使用任務特定標注數據(如問答對、指令集)調整預訓練模型參數,適配下游任務格式(如ChatGPT對話優化)。
  • 通俗:針對具體崗位(如客服、翻譯)進行的“職業技能培訓”。

1.3 獎勵模型訓練

  • 專業:通過人類標注員對模型輸出排序(如A/B測試),訓練一個可量化輸出質量的獎勵函數(Reward Model)。
  • 通俗:教練給AI的答案“打分”,教會它分辨好壞回答。

1.4 強化學習微調(RLHF)

  • 專業:結合獎勵模型與PPO算法,優化策略模型生成符合人類偏好的輸出(如Anthropic Claude的安全對齊)。
  • 通俗:AI通過“考試評分+自我改進”循環,學會答得更得體。

2. 模型架構

2.1 Transformer

  • 專業:基于自注意力機制的神經網絡,支持并行處理長序列(如輸入4096 Token),是LLM的通用基礎架構(如GPT、BERT)。
  • 通俗:AI理解語言的“中央處理器”,能同時關聯全文信息。

2.2 MoE(稀疏專家模型)

  • 專業:動態路由機制激活部分專家網絡(如Mixtral-8x7B每輸入僅用2個專家),提升模型容量且控制計算成本。
  • 通俗:“專家委員會”模式,不同問題自動分配專業AI解答。

2.3 編碼器-解碼器

  • 專業:編碼器壓縮輸入語義,解碼器生成目標序列(如T5統一文本到文本框架)。
  • 通俗:AI先“聽懂問題”(編碼),再“組織答案”(解碼)。

3. 模型類型

3.1 量化模型(INT4/INT8)

  • 專業:將FP32權重壓縮為4/8位整數,顯存占用減少75%(如LLM.int4()),精度損失<1%。
  • 通俗:模型“極限瘦身”,手機也能運行百億參數AI。

3.2 非量化模型(FP32/FP16)

  • 專業:保留全精度浮點數權重,訓練穩定性高但推理成本高(如科研場景常用FP16)。
  • 通俗:AI的“原裝大腦”,精度最高但耗電量大。
3.2.1 FP32(單精度浮點數)
專業定義
  • 全稱:32-bit Floating Point(32位浮點數)
  • 二進制結構
1 位符號位 | 8 位指數位 | 23 位尾數位
───────────┬────────────┬────────────正負號    指數范圍     小數精度
  • 數值范圍:±3.4×103?
  • 精度:約7位有效十進制數字
通俗類比

相當于數學中的“精確計算器”,適合需要高精度的場景(如財務核算),但占用存儲空間較大。

LLM中的應用
  • 訓練階段主流格式
    • 梯度計算需要高精度防止數值溢出
    • 示例:訓練GPT-3時全程使用FP32
  • 顯存占用
70億參數模型 ≈ 70億 × 4字節 = 28 GB

3.2.2 FP16(半精度浮點數)
專業定義
  • 全稱:16-bit Floating Point(16位浮點數)
  • 二進制結構
1 位符號位 | 5 位指數位 | 10 位尾數位
───────────┬────────────┬────────────正負號    指數范圍     小數精度
  • 數值范圍:±6.5×10?
  • 精度:約3-4位有效十進制數字
通俗類比

相當于“便攜計算器”,計算速度快、省電,但復雜運算可能舍入誤差。

LLM中的應用
  1. 推理加速
    • 顯存占用減半(FP32的50%)
70億參數模型:28GB → 14GB
- 示例:ChatGPT實時響應使用FP16推理
  1. 混合精度訓練
    • 結合FP16+FP32(梯度用FP32防溢出)
    • 速度提升2-3倍(NVIDIA Tensor Core支持)

3.3 蒸餾模型

  • 專業:小模型(學生)模仿大模型(教師)的輸出分布,體積縮小60%保留95%性能(如DistilBERT)。
  • 通俗:“高手帶徒弟”,小模型繼承大模型的經驗智慧。

3.4 推理優化模型

  • 專業:通過層融合、內核優化提升推理速度(如vLLM引擎的PagedAttention技術)。
  • 通俗:給AI思維“裝上渦輪增壓”,回答快3倍。

4. 參數與規模

4.1 小型(<1B)

  • 代表模型:Microsoft Phi-2(27億參數)
  • 特點:可在手機端部署(如Android App),響應延遲<100ms。

4.2 中型(1B~10B)

  • 代表模型:Meta Llama2-7B、ChatGLM3-6B
  • 特點:單卡消費級GPU(RTX 4090)可運行,適合企業私有化部署。

4.3 大型(10B~100B)

  • 代表模型:GPT-4(約1.8T MoE)、Claude 3(公開版40B)
  • 特點:需8卡A100集群,具備復雜邏輯推理與多任務泛化能力。

4.4 超大規模(>100B)

  • 代表模型:Google Gemini Ultra、Anthropic Claude 3.5
  • 特點:千億級參數,需專用AI芯片(如TPU v5)集群訓練,支持跨模態理解。

5. 生成策略

5.1 解碼策略

  • 貪心搜索:每一步選最高概率詞,輸出確定但易重復(如ATM密碼生成)。
  • 束搜索(Beam Search):保留Top-k路徑,平衡質量與多樣性(如醫療報告生成)。

5.2 Top-k采樣

  • 專業:從概率最高的k個候選詞中隨機采樣(k=50為常見值),避免低質量輸出。
  • 通俗:AI從“高分答案庫”隨機抽選,兼顧準確與創意。

5.3 溫度控制

  • 專業:調整Softmax概率分布陡度:P_i = exp(z_i/T)/Σexp(z_j/T),低溫(T=0.1)保守,高溫(T=1.0)創意迸發。
  • 通俗:控制AI“腦洞溫度”,低溫寫合同,高溫寫詩歌。

5.4 頻率懲罰

  • 專業:基于重復次數的對數概率衰減:P(token) = P_original / (1 + λ * count),抑制循環輸出(λ=0.5~2.0)。
  • 通俗:防AI“復讀機模式”,避免同一詞反復出現。

6. 評估與優化

6.1 困惑度

  • 專業:衡量模型預測樣本不確定性的指標,越低越好(GPT-4的困惑度≈10.2)。
  • 通俗:AI答題的“迷惑程度”,數值越低說明越自信準確。

6.2 LoRA / PEFT

  • 專業:注入可訓練低秩矩陣(ΔW=BA),僅微調0.1%參數(QLoRA支持4-bit微調)。
  • 通俗:給AI“打技能補丁”,升級專業能力不重建大腦。

6.3 RAG

  • 專業:結合FAISS向量檢索與LLM生成,通過外部知識庫注入提升事實準確性(如企業知識庫問答)。
  • 通俗:AI答題前先“翻參考書”,拒絕信口開河。

7. 硬件與算力

7.1 算力

  • 專業表述:算力(Computing Power)是計算機設備或計算系統處理信息的能力,涵蓋硬件計算性能(如CPU/GPU的運算速度)與軟件算法的協同效率。狹義上以每秒浮點運算次數(FLOPS) 為核心指標,用于量化理論峰值性能。
  • 通俗類比數字世界的“體力值”:算力決定智能設備處理任務的速度上限,如同體力越強的人工作效率越高。手機刷臉支付需0.1秒完成上億次計算,即高算力的體現
  • 示例:一臺超算的算力為1 EFLOPS = 每秒100億億次浮點運算。

7.2 通用服務器

  • 配置示例:雙路Intel Xeon + 8×NVIDIA A100(80GB),支持70B模型推理。

7.3 高性能計算

  • 技術方案
    • 張量并行(Tensor Parallelism):單層計算拆分多GPU(如Megatron-LM)。
    • 流水線并行(Pipeline Parallelism):模型層拆分不同設備(如DeepSpeed)。

7.4 分布式部署

  • 邊緣計算:INT4量化模型 + Jetson Orin模塊,工業設備本地故障診斷。
  • 云邊協同:中心云訓練(H100集群) → 邊緣端部署(INT4蒸餾模型)。

資料來源于網絡

本文來自互聯網用戶投稿,該文觀點僅代表作者本人,不代表本站立場。本站僅提供信息存儲空間服務,不擁有所有權,不承擔相關法律責任。
如若轉載,請注明出處:http://www.pswp.cn/news/912726.shtml
繁體地址,請注明出處:http://hk.pswp.cn/news/912726.shtml
英文地址,請注明出處:http://en.pswp.cn/news/912726.shtml

如若內容造成侵權/違法違規/事實不符,請聯系多彩編程網進行投訴反饋email:809451989@qq.com,一經查實,立即刪除!

相關文章

【Java Swing 圖形界面編程】JList 列表組件 ① ( JList 組件簡介 | 核心作用 | 關鍵特性 | 基礎用法示例 )

文章目錄 一、JList 組件簡介1、JList 概念簡介2、JList 核心作用3、JList 關鍵特性 二、JList 組件基礎用法示例1、使用 String 數組構建列表項2、使用 Vector 集合構建列表項3、使用 DefaultListModel 構建列表項 一、JList 組件簡介 1、JList 概念簡介 基本概念 : JList 組件…

【小技巧】Python+PyCharm IDE 配置解釋器出錯,環境配置不完整或不兼容。(小智AI、MCP、聚合數據、實時新聞查詢、NBA賽事查詢)

報錯信息如下&#xff1a; [unsupported] Python 3.1 (mcp-calculator-main) (3) C:\Users(xsshu\AppData\Local\Programs\Python\Python313\python.exe [unsupported] Python 3.1 C:\Users\xsshu\AppData\Local\Programs\Python\Python311\python.exe 這條輸出顯示了兩個 Pyth…

Ragflow 前后端登錄邏輯

前端登錄邏輯 路由配置&#xff1a; /login 路由指向 /pages/login 組件。登錄表單使用 Ant Design 的 Form, Input, 和 Button 組件。 登錄表單處理&#xff1a; 使用 useLogin鉤子來處理登錄請求。密碼通過 RSA 加密后再發送到服務器。成功登錄后導航至 /knowledge 頁面。 …

基于圖神經網絡的ALS候選藥物預測模型設計與實現

基于圖神經網絡的ALS候選藥物預測模型設計與實現 一、任務背景與意義 肌萎縮側索硬化癥(ALS)是一種致命的神經退行性疾病,目前尚無有效治愈方法。傳統藥物發現流程耗時長、成本高,而人工智能技術為加速藥物發現提供了新途徑。本文設計并實現了一個基于圖神經網絡(GNN)的…

運維打鐵: 數據加密與備份恢復策略制定

文章目錄 思維導圖一、數據加密1. 加密算法選擇AES 加密示例&#xff08;Python&#xff09;RSA 加密示例&#xff08;Python&#xff09; 2. 密鑰管理3. 加密范圍 二、數據備份1. 備份類型全量備份增量備份差異備份 2. 備份頻率3. 備份存儲位置 三、數據恢復1. 恢復測試2. 恢復…

AIbase MCP服務庫上線:集成服務器、客戶端、案例教程等服務

在當今數字化時代&#xff0c;人工智能技術正以前所未有的速度發展&#xff0c;深刻地改變著我們的生活和工作方式。而要充分發揮AI的強大能力&#xff0c;離不開高效的工具和服務支持。今天&#xff0c;就讓我們來了解一下一個專注于MCP&#xff08;Model Context Protocol&am…

QGIS+CesiumIon

前言 QGIS 3.44中&#xff0c;新增了3D 場景新增地球視圖模式&#xff0c;通過Cesium ion插件&#xff0c;支持谷歌全球傾斜模型的加載顯示。 目錄 1 CesiumIon插件安裝 2 加載谷歌全球傾斜模型 1、CesiumIon插件安裝 點擊菜單【Plugins】->【Manage and Install Plugins】…

TEXT Introduction

我們是誰 美國計算機奧林匹克競賽通過培訓、競賽和國際比賽來促進大學前的計算機學習。 數個教練將會組織、領導、陪伴代表美國參加國際性奧林匹克競賽的學生。 你可以在 USACO 官網了解更多。 USACO 的目標 USACO 的具體目標包括&#xff1a; 訓練美國的隊伍并且在下一屆奧…

Fluent許可服務器設置教程

Fluent作為一款廣泛使用的流體動力學模擬軟件&#xff0c;其高效的許可管理系統是確保順暢運行的關鍵。為了幫助您更好地掌握Fluent許可服務器的設置方法&#xff0c;本文將為您提供一份詳細的設置教程&#xff0c;讓您輕松配置&#xff0c;高效運行Fluent軟件。 一、Fluent許可…

vue3中實現高德地圖POI搜索(附源碼)

引言 上一篇文章詳細講解了vue3中實現高德地圖地址搜索自動提示&#xff08;附源碼&#xff09;&#x1f517;&#xff0c;本文將重點介紹POI搜索功能的實現。 1. 功能介紹 POI(Point of Interest) 搜索用于查找特定位置或區域內的興趣點&#xff0c;如餐館、商場、景點等。…

機器學習在計算機視覺中的應用

引言 計算機視覺&#xff08;Computer Vision&#xff09;是人工智能的重要分支&#xff0c;旨在讓計算機像人類一樣“看懂”圖像和視頻。近年來&#xff0c;隨著深度學習&#xff08;Deep Learning&#xff09;的快速發展&#xff0c;計算機視覺在多個領域取得了突破性進展。…

新手向:從零開始Node.js超詳細安裝、配置與使用指南

什么是Node.js&#xff1f; 簡單來說&#xff1a; Node.js 是一個在服務器端運行 JavaScript 的環境。 以前JavaScript只能做網頁特效&#xff0c;現在用它就能開發網站后臺、命令行工具甚至桌面應用&#xff01; 第一步&#xff1a;安裝Node.js&#xff08;多系統詳解&#x…

VR全景平臺的概念和用途

VR全景平臺&#xff1a;沉浸式體驗篇章 在數字化飛速發展的今天&#xff0c;VR全景平臺作為新興的技術應用平臺&#xff0c;逐漸走進我們的日常生活。那么&#xff0c;什么是VR全景平臺&#xff1f;眾趣科技是否有涉足這一領域&#xff1f;眾趣科技VR全景平臺又具備哪些獨特的…

深入解析外觀模式(Facade Pattern):簡化復雜系統的優雅設計

深入解析外觀模式&#xff08;Facade Pattern&#xff09;&#xff1a;簡化復雜系統的優雅設計 &#x1f31f; 嗨&#xff0c;我是IRpickstars&#xff01; &#x1f30c; 總有一行代碼&#xff0c;能點亮萬千星辰。 &#x1f50d; 在技術的宇宙中&#xff0c;我愿做永不停歇…

2.2.1 配置Linux審計日志

文章目錄 一、試題及考試說明二、操作步驟1. 啟動 Auditd 服務并設置其開機自啟2. 創建一個規則來監控/etc/test/auditd_test 文件上的所有寫入操作&#xff0c;并給這些審計記錄加上標簽file_access3. 設置審計日志保存在/etc/test/audit/audit.log4. 設置審計日志的滾動機制&…

使用Puppeteer提取頁面內容的技巧

在現代的Web開發和爬蟲開發中&#xff0c;Puppeteer是一個非常強大的工具&#xff0c;它可以幫助我們自動化瀏覽器操作&#xff0c;提取頁面內容。本文將從初階到高階&#xff0c;詳細介紹如何使用Puppeteer提取頁面內容的各種技巧&#xff0c;特別關注多層類關系選擇器的使用。…

SQL server 獲取表中所有行的序號

在SQL Server中&#xff0c;要獲取某個表中的某一行所在的記錄總數&#xff0c;通常有幾種方法可以實現&#xff0c;具體使用哪種方法取決于你的具體需求。以下是幾種常見的方法&#xff1a; 1. 使用COUNT()函數結合子查詢 如果你想要知道某個特定行在表中的位置&#xff08;…

《CSDN 用戶視角:見證 AI 重構企業辦公,在智能協同、數據驅動下實現組織進化》

在數字化轉型的大潮洶涌而至的當下&#xff0c;人工智能&#xff08;AI&#xff09;宛如一場疾風驟雨&#xff0c;以前所未有的速度重塑著企業辦公的格局。從瑣碎流程的自動化&#xff0c;到智能決策的深度賦能&#xff0c;AI 技術正掀起一場對傳統工作模式的徹底顛覆&#xff…

PYQT實戰:天氣助手

應用采用了現代化的界面設計&#xff0c;包括圓角邊框、卡片式布局和響應式建議功能。 這個天氣應用可以作為學習PyQt5開發的實例&#xff0c;展示了GUI設計、定時更新、數據處理和用戶交互的實現方法 #!/usr/bin/env python # -*- coding: GBK -*- import sys import request…

PL-SLAM: Real-Time Monocular Visual SLAM with Points and Lines

PL-SLAM 文章目錄 PL-SLAM摘要系統介紹綜述方法綜述LINE-BASED SLAM一、基于線的SLAM二、基于線和點的BA三、全局重定位使用線條初始化地圖實驗結果說明位姿求解三角化LSD 直線檢測算法?? **一、核心原理**?? **二、實現方法**?? **三、應用場景**?? **四、優缺點與優化…