大模型關鍵字解釋

💡 一、模型結構關鍵詞

1. Transformer

Transformer 是一種專門用來“理解文字”的神經網絡結構。就像一個聰明的秘書,能同時看懂整段話的所有詞之間的關系,而不是像老式模型那樣一句一句讀。

👉 舉例:以前的模型像一個機器人一字一句看句子,而 Transformer 像是一個能一眼掃完全文并抓住重點的讀者。


2. Encoder / Decoder

  • Encoder(編碼器):負責把輸入的文字變成“理解用”的數字信息。
  • Decoder(解碼器):把理解后的信息變成一句完整的回復或新內容。

👉 舉例:輸入“我餓了”,Encoder 會理解你是餓了,Decoder 會回復“那你去吃點東西吧”。


3. Attention / Self-Attention

這是一種讓模型“關注重點詞”的機制。比如“狗追著貓跑”,模型要知道誰在追誰,就要重點關注“狗”和“追”。

👉 舉例:你讀一句話時,也會自動注意重要的詞,Attention 就是模型的“注意力”。


4. Feed Forward

一個普通的神經網絡層,用來把每個詞的理解結果進一步加工。

👉 類比:就像你理解完每個詞之后,還要在腦子里再想一下它具體的含義。


5. Residual

讓模型保留舊信息,避免忘掉之前學的內容。

👉 類比:像你在寫作業時,在旁邊保留一個草稿記錄,避免前后邏輯出錯。


6. Positional Encoding

Transformer 本身不理解詞語的順序,所以要專門加上“位置信息”。

👉 舉例:句子“我愛你”和“你愛我”意思不同,模型需要知道“我”和“你”的位置才能理解準確。


📘 二、訓練機制關鍵詞

1. Pretraining(預訓練)

模型最初要在大量文本上自學語言規律,相當于打基礎。

👉 舉例:就像你上小學之前,要先學拼音和字母。


2. Fine-tuning(微調)

在預訓練之后,模型可以針對具體任務(如答題、寫詩)進行專門訓練。

👉 類比:基礎學完后,你可以專門練習寫作文或做數學題。


3. Masked Language Modeling(MLM)

訓練方式是“填空題”式:隨機遮住句子中的某些詞,讓模型猜出是什么詞。

👉 舉例:輸入“我今天很 [MASK]”,模型要猜“開心”或“難過”。


4. Causal Language Modeling(因果語言建模)

只能看到前面詞,來預測下一個詞。

👉 舉例:你說“我今天去”,模型要猜你下一步是“上班”還是“旅游”,不能偷看后面的詞。


5. Next Sentence Prediction

訓練模型判斷“兩句話是否有關聯”。

👉 舉例:一句是“我今天生病了”,下一句是“我請了假”,模型要學會識別這兩句是連貫的。


?? 三、推理部署關鍵詞

1. KV Cache

緩存之前生成的結果,避免重復計算。

👉 類比:你和朋友聊天,不需要每次都從第一句重復講,模型也可以記住前文。


2. Quantization(量化)

把模型參數從大數字變成小數字,壓縮模型,加快運行。

👉 舉例:就像把高清圖片壓縮成小圖,但盡量不影響清晰度。


3. LoRA(低秩適配)

只調整少部分模型參數來完成微調,節省資源。

👉 類比:給現有軟件加一個插件,而不是重新寫整個程序。


4. FP16 / INT8

模型的“計算精度”。FP16 是半精度,INT8 是 8位整數。

👉 舉例:像把原本需要用“毫米”測量的東西,換成“厘米”測量,快但略有損失。


5. Batching

同時處理多個輸入,提高效率。

👉 類比:不是一個一個炒菜,而是開大鍋做十份菜。


? 四、提示詞工程關鍵詞

1. Prompt

給模型的提示或問題。

👉 舉例:你問“寫一首關于夏天的詩”,這句話就是 prompt。


2. System Prompt

系統默認的背景設定,決定模型說話風格。

👉 舉例:“你是一位耐心的老師”,模型就會用耐心的語氣回答問題。


3. Zero-shot / Few-shot

  • Zero-shot:不給模型例子,直接問。
  • Few-shot:給模型幾個示例,幫助它更好理解任務。

👉 舉例:你說“翻譯‘I love you’”,就是 Zero-shot;你先給它幾個中英文對照例子再讓它翻譯,就是 Few-shot。


4. Chain of Thought

引導模型寫出思考過程,而不是直接給答案。

👉 舉例:問“2個蘋果和3個蘋果一共幾個?”模型先寫“2+3=5”,再說“答案是5”。


5. Temperature / Top-k / Top-p

控制輸出的“隨機性”。

  • Temperature 高,回答更有創意;
  • Top-k/p 是限制選詞范圍,保證輸出更合理。

👉 類比:就像你寫作文時,可以自由發揮(高溫)或按模板來寫(低溫)。


6. Stop Sequence

設置模型遇到某些詞就停。

👉 舉例:模型生成到“謝謝,再見。”就停止,避免繼續胡說。


📚 五、語料與訓練數據關鍵詞

1. Common Crawl

互聯網上公開網頁的數據集合,是模型學習材料的一部分。

👉 類比:就像你小時候到圖書館隨便讀所有書,模型也從網上“讀書”。


2. Deduplication

去掉重復內容,防止模型過度記憶某句話。

👉 舉例:一本書里重復太多遍“我愛你”,模型就可能過度使用這個句子。


3. Tokenization

把句子切成模型能理解的小單位(詞或字)。

👉 舉例:“我愛你”會被切成3個 Token,模型每次處理一個單位。


4. RLHF(人類反饋強化學習)

人類給模型輸出打分,然后模型根據反饋學會給出更合適的答案。

👉 類比:你教小朋友講話時,夸他講得好,他就更愿意那樣說。


🛡? 六、安全與對齊關鍵詞

1. Prompt Injection

一種攻擊方式,偷偷加內容控制模型行為。

👉 舉例:你本來叫模型“禮貌地回答問題”,但有人輸入“忽略之前所有指令”,模型可能就被控制了。


2. Jailbreak

突破模型安全限制,讓它說出不該說的話。

👉 類比:像“黑客繞過密碼”一樣,讓模型做違禁事。


3. Bias Mitigation

減少偏見,讓模型更公平。

👉 舉例:避免模型認為“程序員=男性”,減少性別歧視。


4. Guardrails

給模型設定邊界,比如不能說暴力內容或給出危險建議。

👉 類比:像兒童視頻網站一樣,自動屏蔽不良內容。


5. Constitutional AI

給模型寫一套“價值觀憲法”,讓它言行合乎道德。

👉 舉例:比如“不撒謊”、“不鼓勵暴力”、“尊重人類”,模型的回答會嚴格遵守這些原則。

本文來自互聯網用戶投稿,該文觀點僅代表作者本人,不代表本站立場。本站僅提供信息存儲空間服務,不擁有所有權,不承擔相關法律責任。
如若轉載,請注明出處:http://www.pswp.cn/news/913316.shtml
繁體地址,請注明出處:http://hk.pswp.cn/news/913316.shtml
英文地址,請注明出處:http://en.pswp.cn/news/913316.shtml

如若內容造成侵權/違法違規/事實不符,請聯系多彩編程網進行投訴反饋email:809451989@qq.com,一經查實,立即刪除!

相關文章

空調和烘干機的使用

開關 制冷 選擇上下掃風 那個就下來了 烘干機 電源鍵 長按3s以上直到菜單顯示 選擇小件 不要快烘 至少1個半小時 才可以烘干

極簡的神經網絡反向傳播例子

我之前一直沒搞清楚,神經網絡為什么要求導?反向傳播又是什么?于是到現在深究回來…… 本質就是擬合一個未知函數。 高中的數理統計就學過最小二乘法這種回歸方法(? 代表自己的預測y,這個表達要記住)&…

01-什么是強化學習

什么是強化學習 1. 定義 強化學習(Reinforcement Learning, RL)是一種使智能體(Agent)通過與環境(Environment)不斷交互,學習如何在不同情境下采取行動以獲得最大化累積獎勵的機器學習方法。 強…

淘寶直播數字人:音視頻算法工程技術

本專題是我們打造智能數字人的部分實踐總結。我們將探討六大核心環節:LLM文案生產賦予數字人思考和內容生成能力,如同其“大腦”;LLM互動能力則聚焦對話邏輯與擬人化交流,是實現自然交互的關鍵;TTS(語音合成…

MySQL回表查詢深度解析:原理、影響與優化實戰

引言 作為后端開發或DBA,你是否遇到過這樣的場景: 明明給字段加了索引,查詢還是慢?EXPLAIN一看,執行計劃里type是ref,但數據量不大卻耗時很久? 這時候,你很可能遇到了MySQL中常見的…

任務管理器看不到的內存占用:RAMMap 深度分析指南

前言:任務管理器看不到的內存真相 在日常使用 Windows 系統時,我們有時會遇到一種令人費解的情況: 剛剛開機,什么軟件都沒運行,系統內存卻已經占用了 7~8 GB。 打開任務管理器一看,前幾個進程加…

從傳統倉庫到智能物流樞紐:艾立泰的自動化蛻變之旅

在物流行業智能化浪潮中,艾立泰從依賴人工的傳統倉庫轉型為智能物流樞紐,其自動化升級路徑為行業提供了典型范本。?曾幾何時,艾立泰倉庫內人工搬運、紙質單據流轉、手工盤點是常態,效率低下、差錯率高、人力成本攀升等問題制約發…

408第三季part2 - 計算機網絡 - 滑動窗口

理解 幀本質就是一堆二進制,后面會將幀的格式 流量控制就是 B:急急急急急急 A:別急 A控制B,B控制C,C控制D,但D無法控制A,這就是相鄰節點 abc在發送的過程中發送完了 怎么才能繼續發送呢 沒…

RedHat高可用集群深度解析與優化

一、RHCS核心組件深度解析1. Corosync(消息層)通信機制改進說明: Totem協議采用環形令牌傳遞機制,在10節點以下集群中使用UDP/IP組播(224.0.0.12),超過10節點建議改用UDP/UDP單播。典型配置示例…

為什么使用 XML Schema?

為什么使用 XML Schema? XML(可擴展標記語言)是一種廣泛使用的標記語言,它被設計用來存儲和傳輸數據。XML Schema 是一種用于定義 XML 文檔結構的語言,它為 XML 文檔提供了嚴格的驗證機制。以下是使用 XML Schema 的幾個主要原因: 1. 結構化數據定義 XML Schema 允許開…

ESP32藍牙學習筆記

藍牙 官網:https://www.bluetooth.com/zh-cn/learn-about-bluetooth/tech-overview/ 概述 分類:Bluetooth經典、Bluetooth低能耗(LE) GAP 通用訪問配置文件(Generic Access Profile, GAP)簡稱GAP,該Profile保證不同的Bluetooth產品可以互…

C#擴展方法全解析:給現有類型插上翅膀的魔法

C#擴展方法全解析:給現有類型插上翅膀的魔法 在 C# 的類型系統中,當我們需要為現有類型添加新功能時,傳統方式往往意味著繼承、重寫或修改源代碼 —— 但如果是string、int這樣的系統類型,或是第三方庫中的密封類,這些…

YOLOv11在邊緣計算設備上的部署與優化:從理論到實踐

邊緣計算與YOLOv11的融合背景 邊緣計算的崛起與核心價值 邊緣計算作為一種分布式計算范式,正深刻改變著人工智能應用的部署方式。其核心在于將數據處理從云端下沉到網絡邊緣,在靠近數據源的位置完成計算任務。根據國際數據公司(IDC&#xf…

Solidity——pure 不消耗gas的情況、call和sendTransaction區別

/ pure: 純純牛馬 function addPure(uint256 _number) external pure returns(uint256 new_number){ new_number _number 1; }不會消耗gas對吧。傳的不是狀態變量 你的理解基本對了,但我們來更嚴謹、深入地回答這個問題。 ? 你這段 pure 函數代碼: …

柔性電路芯片賦能腦機接口:技術融合、應用突破與前景展望

柔性電路芯片賦能腦機接口:技術融合、應用突破與前景展望 一、引言 1.1 研究背景與意義 在科技飛速發展的時代,柔性電路芯片與腦機接口的融合展現出巨大的潛力,為醫療、科研等多個領域帶來了新的機遇與變革。 從醫療領域來看,隨著人口老齡化的加劇以及神經系統疾病患者…

全面解析存儲芯片:從Flash到DDR、鐵電、內存條與SD卡

一、存儲芯片分類概述 存儲芯片是電子設備中用于數據存儲的核心組件,根據數據保存方式可分為 易失性存儲器(Volatile Memory) 和 非易失性存儲器(Non-Volatile Memory)。 類型代表芯片特點典型應用易失性存儲器DRAM、…

編譯ADI NO-OS工程

1,先在WINdows下安裝git bush 可以參考下面博客 https://blog.csdn.net/Natsuago/article/details/145647536 2.安裝make 工具 可參考一下鏈接 https://blog.csdn.net/weixin_40727233/article/details/110353240 3,參考ADI官方鏈接 https://wiki.analo…

自存bro code java course 筆記(2025 及 2020)

Java Full Course for free ? System 是 Java 中的一個 final 類,定義在 java.lang 包中。它的 構造方法是 private 的,意味著你無法通過 new System() 來創建對象。它的所有常用成員(如 System.out, System.in, System.err, currentTimeMil…

opencv基礎的圖像操作

目錄 1.安裝opencv-python 2.基礎的圖像操作 3.繪制幾何圖形 3.1.繪制直線 3.2.繪制矩形 3.3.繪制圓形 3.4.向圖像中添加文字 總結 1.安裝opencv-python pip install -i https://pypi.tuna.tsinghua.edu.cn/simple opencv-python 2.基礎的圖像操作 # 導入庫 import c…

Kali制作Linux木馬

環境描述:攻擊機:kali-Linux2025靶機:Linux-Centos8本文章主要介紹怎么通過kali制作Linux木馬控制linux,不要用于非法用途,法律是底線不要觸碰,提升自己的網絡安全技能,如有用于非法用途自行承擔…