DeepSeek大語言模型下幾個常用術語

昨天刷B站看到復旦趙斌老師說的一句話“科幻電影里在人腦中植入芯片或許在當下無法實現，但當下可以借助AI人工智能實現人類第二腦”（大概是這個意思）

💞更多內容，可關注公眾號“ 一名程序媛 ”，我們一起從 0 - 1 學編程💞

一種通過降低模型參數的表示精度來減少模型大小和計算需求的方法

safetensors - 由 Hugging Face 推出的一種新型安全模型存儲格式，特別關注模型安全性、隱私保護和快速加載，僅包含張量的文件格式，如model-00001-of-000002.safetensors
GGUF All-in-one 二進制模型文件，如DeepSeek-R1-Distill-Qwen-7B-Q3_K_L.gguf
- Q（Quantization）量化（壓縮），后面的數值表示“單個參數的平均bit數”，數值越大越智能
- K（K Quant）即多個參數組合一Block做壓縮，初衷是在同一個壓縮級別上再補償些精度回來
- S L M 等用于區分混合精度的程度，字母順序越小越精簡

💞更多內容，可關注公眾號“ 一名程序媛 ”，我們一起從 0 - 1 學編程💞

在這里插入圖片描述

本文來自互聯網用戶投稿，該文觀點僅代表作者本人，不代表本站立場。本站僅提供信息存儲空間服務，不擁有所有權，不承擔相關法律責任。
如若轉載，請注明出處：http://www.pswp.cn/news/897481.shtml
繁體地址，請注明出處：http://hk.pswp.cn/news/897481.shtml
英文地址，請注明出處：http://en.pswp.cn/news/897481.shtml

如若內容造成侵權/違法違規/事實不符，請聯系多彩編程網進行投訴反饋email:809451989@qq.com，一經查實，立即刪除！