unsloth筆記:基本介紹

更快的速度、更省的內存訓練、運行、評估大模型

1 支持的模型

All Our Models | Unsloth Documentation

1.1?Dynamic GGUF/instruct 4-bit

  • llama.cpp使用的新模型格式,專為高效、本地推理設計
  • 注:GGUF無法微調
    • 只保留推理所需的內容,如量化后的權重、推理元信息
    • 不包含訓練所需的梯度結構、參數層名、優化器狀態

    • 不支持反向傳播

    • 通常是 4-bit 靜態量化,已經丟失了訓練精度所需的權重信息

  • Instruct 4-bit (safetensors)

    • Instruct:代表模型是指令微調(Instruction-Tuned)版本,即已經訓練過能更好理解指令/對話任務

    • 4-bit:表示該模型已經被4-bit 量化(通常用于 QLoRA),顯著降低了顯存需求。

    • safetensors:是一種更安全的模型文件格式(相對 .bin),支持高效加載、避免執行惡意代碼。

    • 可直接用于低成本推理或繼續進行LoRA / QLoRA 微調

1.1.1 deepseek家族

1.1.2?llama家族

1.1.3 gemma家族

1.1.4 Qwen家族

1.1.5 mistral家族

1.1.6 Phi家族

1.1.7 其他

1.2?16-bit and 8-bit Instruct

基本上instruct 4-bit的有的這邊都有

也可用于推理和微調,區別主要在于精度和資源消耗

1.3??Base 4 + 16-bit

未經過指令微調的模型的4-bit和16-bit量化版本

1.3.1 llama家族

1.3.2 qwen家族

1.3.3 gemma 家族

1.3.4?Mistral家族

1.4 unsloth版本模型命名后綴說明

unsloth-bnb-4bitUnsloth 的動態 4bit 量化模型,精度更高,占用略多顯存
bnb-4bit普通 BitsAndBytes 4bit 量化模型
無后綴原始模型(16/8bit)

2 可調參數推薦

max_seq_length下文長度,Llama-3 支持到 8192,但建議先用 2048 測試
dtype?默認None,若使用新 GPU 可設為 torch.float16 或 bfloat16
load_in_4bit

啟用 QLoRA,減少 4 倍顯存消耗

QLoRA 的準確性如今已經接近甚至超過 LoRA,建議默認使用

full_finetuning若設為 True,則執行全參數微調(不推薦)

3 選擇instruct模型還是base模型

數據量情況推薦選擇說明
超過 1000 行Base 模型數據量充足,能充分訓練出新行為
300–1000 行高質量數據Base 或 Instruct視任務而定,兩者都可以
少于 300 行Instruct 模型小樣本建議保留已有指令能力,僅做輕微定制
  • 任務明確 + 數據少 → 用 Instruct 模型做輕微定制即可

  • 任務復雜 / 數據多 → 從 Base 模型開始訓練,得到效果更穩的定制模型

本文來自互聯網用戶投稿,該文觀點僅代表作者本人,不代表本站立場。本站僅提供信息存儲空間服務,不擁有所有權,不承擔相關法律責任。
如若轉載,請注明出處:http://www.pswp.cn/bicheng/95870.shtml
繁體地址,請注明出處:http://hk.pswp.cn/bicheng/95870.shtml
英文地址,請注明出處:http://en.pswp.cn/bicheng/95870.shtml

如若內容造成侵權/違法違規/事實不符,請聯系多彩編程網進行投訴反饋email:809451989@qq.com,一經查實,立即刪除!

相關文章

博眾測控 | 一文看懂菊水電源產品在半導體測試中的應用

01 半導體在各行業上的應用半導體作為現代工業體系的“核心神經”,其性能參數與應用場景深度綁定,不同行業因核心設備的功能需求差異,對半導體的電流、電壓承載能力及類型選擇有著明確且嚴格的要求,具體應用細節如下:1…

【STM32】貪吃蛇 [階段 8] 嵌入式游戲引擎通用框架設計

這篇博客是 承接:【項目思維】貪吃蛇(嵌入式進階方向)中 嵌入式游戲引擎雛形(終極進階), 是我們此前從 “寫一個小游戲”提升到“構建可復用游戲框架” 的飛躍階段。我們以“貪吃蛇游戲”為例,抽…

Vue圖標按鈕好用的樣式

圖標按鈕示例一 <template><div class"icon-button-group"><button class"icon-btn icon-btn--default"><i class"el-icon-moon"></i></button><button class"icon-btn icon-btn--primary"&g…

Nginx 實戰系列(一)—— Web 核心概念、HTTP/HTTPS協議 與 Nginx 安裝

文章目錄前言一、Web 概念1.1 Web 的基本概念1.1.1 Web的特點1.2 B/S 架構模型1.3 Web 請求與響應過程&#xff08;重點&#xff09;1.4 靜態資源與動態資源1.5 Web 的發展階段1.6 案例&#xff1a;搭建最小 Web 服務1.6.1 目標1.6.2 搭建步驟1.7 小結二、HTTP 與 HTTPS 協議2.…

一種用geoserver發布復雜樣式矢量服務的方法

最近因為系統需要在國產系統中部署&#xff0c;遇見了國產系統不支持ArcGIS的尷尬局面&#xff0c;好在geoserver還是可以支持的&#xff0c;遂用geoserver解決服務問題。 在發布過程中&#xff0c;遇到比較難受的點就是矢量數據的樣式配圖&#xff0c;在我用QGIS配好導出sld后…

為什么神經網絡網絡算法比機器學習模型算法更加強大?

神經網絡&#xff08;尤其是深度神經網絡&#xff09;相比傳統機器學習模型&#xff08;如線性回歸、決策樹、支持向量機等&#xff09;的“強大”主要體現在其更強的表達能力、自適應特征學習能力以及對復雜模式的建模能力。但這種“強大”并非絕對&#xff0c;而是有特定條件…

中國移動浪潮云電腦CD1000-系統全分區備份包-可瑞芯微工具刷機-可救磚

中國移動浪潮云電腦CD1000-系統全分區備份包-可瑞芯微工具刷機-可救磚 開啟ADB教程&#xff1a; 可查看&#xff1a;浪潮CD1000-移動云電腦-RK3528芯片-232G-安卓9-開啟ADB ROOT破解教程 可輕松打開了wifi adb和USB調試。 往期詳細內容-文章&#xff1a;浪潮CD1000-移動云電腦…

C++兩個字符串的結合

這段代碼實現字符串拼接功能。用戶輸入兩個字符串a和b后&#xff0c;使用append()方法將b追加到a后面&#xff0c;然后輸出拼接后的結果。代碼簡潔但存在改進空間&#xff1a;1. 缺少輸入驗證 2. 直接修改原字符串a可能不符合某些場景需求 3. 可考慮更高效的拼接方式。適合基礎…

UE4 Rider調試時添加自定義命令行參數

1、打開 Rider 右上角&#xff0c;針對你的項目&#xff08;例如叫做“Mini”&#xff09;打開 Edit 2、輸入自定義的參數&#xff0c;如下圖的例子是輸入 -dx12 -norhithread &#xff0c;然后Apply并OK。3、開始調試&#xff08;蟲子按鈕&#xff09;

混合架構大型語言模型(Jamba)

Jamba是由AI21 Labs開發的混合架構大型語言模型&#xff08;LLM&#xff09;&#xff0c;結合了Transformer的語義理解能力和Mamba結構化狀態空間模型&#xff08;SSM&#xff09;的高效性&#xff0c;旨在解決長文本處理中的計算瓶頸。 一、技術特點 1.混合架構設計 Jamba采用…

2025 年高教社杯全國大學生數學建模競賽C 題 NIPT 的時點選擇與胎兒的異常判定詳解(一)

基于胎兒Y染色體濃度的孕周與BMI建模分析摘要本文利用某競賽提供的胎兒Y染色體濃度數據&#xff0c;建立了以孕周和孕婦BMI為自變量的多項式回歸模型&#xff0c;探討了其對Y染色體濃度的影響。通過數據清洗與篩選&#xff0c;共獲得1082條有效男胎樣本。結果顯示&#xff1a;Y…

PyTorch DDP 隨機卡死復盤:最后一個 batch 掛起,NCCL 等待不返回

PyTorch DDP 隨機卡死復盤&#xff1a;最后一個 batch 掛起&#xff0c;NCCL 等待不返回&#xff0c;三步修復 Sampler & drop_last很多人在接觸深度學習的過程往往都是從自己的筆記本開始的&#xff0c;但是從接觸工作后&#xff0c;更多的是通過分布式的訓練來模型。由于…

計算機專業考研備考建議

對于全國碩士研究生招生考試&#xff08;考研&#xff09;&#xff0c;考試科目主要由兩大部分組成&#xff1a;全國統一命題的公共課 和 由招生單位自主命題的專業課。具體的考試科目取決于你報考的專業和學校。下面我為你詳細拆解&#xff1a;一、考試科目構成&#xff08;絕…

關于嵌入式學習——單片機1

基礎整體概念以應用為中心:消費電子(手機、藍牙耳機、智能音響)、醫療電子(心率脈搏、呼吸機)、無人機(大疆D)、機器人(人形四足機器人) 計算機技術:計算機五大組成:運算器(數據運算)、控制器(指令控制)、存儲器(內存外存)、輸入設備(鼠標、鍵盤、攝像頭)、輸出設備(顯示器)軟件…

LightDock.server liunx 雙跑比較

LightDock: a new multi-scale approach to protein–protein docking The LightDock server is free and open to all users and there is no login requirement server 1示例 故去除約束 next step 結果有正有負合理 2.常見警告? Structure contains HETATM entries. P…

SQL面試題及詳細答案150道(61-80) --- 多表連接查詢篇

《前后端面試題》專欄集合了前后端各個知識模塊的面試題,包括html,javascript,css,vue,react,java,Openlayers,leaflet,cesium,mapboxGL,threejs,nodejs,mangoDB,MySQL,Linux… 。 前后端面試題-專欄總目錄 文章目錄 一、本文面試題目錄 61. 什么是內連接(INNE…

【實操】Noej4圖數據庫安裝和mysql表銜接實操

目錄 一、圖數據庫介紹 二、安裝Neo4j 2.1 安裝java環境 2.2 安裝 Neo4j&#xff08;社區版&#xff09; 2.3 修改配置 2.4 驗證測試 2.5 卸載 2.6 基本用法 2.7 windows連接服務器可視化 三、neo4j和mysql對比 3.1 場景對比 3.2 Mysql和neo4j的映射對比 3.3 mys…

【mysql】SQL查詢全解析:從基礎分組到高級自連接技巧

SQL查詢全解析&#xff1a;從基礎分組到高級自連接技巧詳解玩家首次登錄查詢的多種實現方式與優化技巧在數據庫查詢中&#xff0c;同一個需求往往有多種實現方式。本文將通過"查詢每個玩家第一次登錄的日期"這一常見需求&#xff0c;深入解析SQL查詢的多種實現方法&a…

MySQL常見報錯分析及解決方案總結(9)---出現interactive_timeout/wait_timeout

關于超時報錯&#xff0c;一共有五種超時參數&#xff0c;詳見&#xff1a;MySQL常見報錯分析及解決方案總結(7)---超時參數connect_timeout、interactive_timeout/wait_timeout、lock_wait_timeout、net等-CSDN博客 以下是當前報錯的排查方法和解決方案&#xff1a; MySQL 中…

第13章 Jenkins性能優化

13.1 性能優化概述 性能問題識別 常見性能瓶頸&#xff1a; Jenkins性能問題分類&#xff1a;1. 系統資源瓶頸- CPU使用率過高- 內存不足或泄漏- 磁盤I/O瓶頸- 網絡帶寬限制2. 應用層面問題- JVM配置不當- 垃圾回收頻繁- 線程池配置問題- 數據庫連接池不足3. 架構設計問題- 單點…