unsloth筆記：基本介紹

更快的速度、更省的內存訓練、運行、評估大模型

1 支持的模型

All Our Models | Unsloth Documentation

llama.cpp使用的新模型格式，專為高效、本地推理設計
注：GGUF無法微調
- 只保留推理所需的內容，如量化后的權重、推理元信息
- 不包含訓練所需的梯度結構、參數層名、優化器狀態
- 不支持反向傳播
- 通常是 4-bit 靜態量化，已經丟失了訓練精度所需的權重信息
Instruct 4-bit (safetensors)
- Instruct：代表模型是指令微調（Instruction-Tuned）版本，即已經訓練過能更好理解指令/對話任務
- 4-bit：表示該模型已經被4-bit 量化（通常用于 QLoRA），顯著降低了顯存需求。
- safetensors：是一種更安全的模型文件格式（相對 .bin），支持高效加載、避免執行惡意代碼。
- 可直接用于低成本推理或繼續進行LoRA / QLoRA 微調

基本上instruct 4-bit的有的這邊都有

也可用于推理和微調，區別主要在于精度和資源消耗

未經過指令微調的模型的4-bit和16-bit量化版本

unsloth-bnb-4bit	Unsloth 的動態 4bit 量化模型，精度更高，占用略多顯存
bnb-4bit	普通 BitsAndBytes 4bit 量化模型
無后綴	原始模型（16/8bit）

max_seq_length	下文長度，Llama-3 支持到 8192，但建議先用 2048 測試
dtype?	默認None，若使用新 GPU 可設為 torch.float16 或 bfloat16
load_in_4bit	啟用 QLoRA，減少 4 倍顯存消耗 QLoRA 的準確性如今已經接近甚至超過 LoRA，建議默認使用
full_finetuning	若設為 True，則執行全參數微調（不推薦）

本文來自互聯網用戶投稿，該文觀點僅代表作者本人，不代表本站立場。本站僅提供信息存儲空間服務，不擁有所有權，不承擔相關法律責任。
如若轉載，請注明出處：http://www.pswp.cn/bicheng/95870.shtml
繁體地址，請注明出處：http://hk.pswp.cn/bicheng/95870.shtml
英文地址，請注明出處：http://en.pswp.cn/bicheng/95870.shtml

如若內容造成侵權/違法違規/事實不符，請聯系多彩編程網進行投訴反饋email:809451989@qq.com，一經查實，立即刪除！