LLaMA-Factory 中配置文件或命令行里各個參數的含義

常見參數分類 & 含義對照表:

🔹模型相關

參數含義
model_name_or_path基礎模型的路徑(本地或 HuggingFace Hub 上的名字,如 meta-llama/Llama-2-7b-hf)
adapter_name_or_pathLoRA/Adapter 權重路徑(如果要在已有權重上繼續訓練或推理)
cache_dir模型緩存路徑
use_fast_tokenizer是否使用 fast tokenizer(基于 tokenizers 的實現,速度快)
resize_vocab是否根據新增的 special tokens 擴充詞表

🔹 數據集相關

參數含義
dataset使用的數據集名稱(框架內置如 alpaca_gpt4,也可以自定義)
dataset_dir數據集目錄路徑
templatePrompt 模板(例如 alpaca、vicuna,會決定輸入拼接格式)
cutoff_len每條樣本的最大 token 長度(超出會被截斷)
max_samples限制訓練時使用的最大樣本數(調試時用)

🔹 訓練相關

參數含義
do_train是否進行訓練
do_eval是否進行評估
output_dir模型保存目錄
num_train_epochs訓練的總 epoch 數
max_steps如果指定,訓練到該步數后停止(優先級高于 num_train_epochs)
per_device_train_batch_size每張 GPU 的訓練 batch size
gradient_accumulation_steps梯度累計步數,用于模擬更大 batch
learning_rate學習率
lr_scheduler_type學習率調度器(linear, cosine, constant等)
warmup_steps / warmup_ratio學習率預熱步數/比例
weight_decay權重衰減系數
max_grad_norm梯度裁剪閾值
logging_steps日志打印間隔
save_steps模型保存間隔(步數)
save_total_limit只保留最近的多少個 checkpoint

🔹 PEFT / LoRA 參數

參數含義
finetuning_type微調方式:lora, full, freeze, qlora
lora_rankLoRA 低秩矩陣維度 r
lora_alphaLoRA 縮放系數 α
lora_dropoutLoRA dropout 比例
target_modules應用 LoRA 的模塊(默認 q_proj,k_proj,v_proj,o_proj)

🔹 推理/生成相關

參數含義
do_predict是否運行預測/推理
max_new_tokens生成時最大新 token 數
temperature生成時溫度(越高越隨機)
top_k采樣時 top-k
top_pnucleus sampling 概率閾值
repetition_penalty重復懲罰系數

🔹 量化相關

參數含義
quantization_bit量化比特數(4, 8等)
bnb_4bit_use_double_quant是否使用雙重量化
bnb_4bit_quant_type量化類型(如 nf4、fp4)
bnb_4bit_compute_dtype計算時數據類型(float16/bfloat16)

🔹 其他常用參數

參數含義
seed隨機數種子(保證可復現)
report_to日志上報方式(wandb, tensorboard, none)
ddp_find_unused_parameters分布式訓練時是否查找未用參數(DDP 必要選項)

本文來自互聯網用戶投稿,該文觀點僅代表作者本人,不代表本站立場。本站僅提供信息存儲空間服務,不擁有所有權,不承擔相關法律責任。
如若轉載,請注明出處:http://www.pswp.cn/bicheng/94324.shtml
繁體地址,請注明出處:http://hk.pswp.cn/bicheng/94324.shtml
英文地址,請注明出處:http://en.pswp.cn/bicheng/94324.shtml

如若內容造成侵權/違法違規/事實不符,請聯系多彩編程網進行投訴反饋email:809451989@qq.com,一經查實,立即刪除!

相關文章

JavaScript 性能優化實戰技術文章大綱

一、引言1.1 背景闡述在當今 Web 應用高度交互化、復雜化的趨勢下,JavaScript 作為核心腳本語言,其性能優劣直接決定了用戶體驗的好壞。從單頁應用(SPA)的流暢運行,到復雜數據可視化的實時交互,JavaScript …

正點原子【第四期】Linux之驅動開發學習筆記-2.1LED燈驅動實驗(直接操作寄存器)

前言: 本文是根據嗶哩嗶哩網站上“正點原子【第四期】手把手教你學Linux系列課程之 Linux驅動開發篇”視頻的學習筆記,該課程配套開發板為正點原子alpha/mini Linux開發板。在這里會記錄下正點原子 I.MX6ULL 開發板的配套視頻教程所作的實驗和學習筆記內…

【GM3568JHF】FPGA+ARM異構開發板 測試命令

本章節的命令操作均在板卡的終端執行 1 初探/sys目錄 與/proc目錄類似,/sys目錄下的文件/文件夾向用戶提供了一些關于設備、內核模塊、文件系統以及其他內核組件的信息, 如子目錄block中存放了所有的塊設備;子目錄bus中存放了系統中所有的總…

【Win】Motrix+Aria2瀏覽器下載加速

系統安裝Motrix Motrix官網下載,推薦下載NSIS Installer 安裝版 瀏覽器安裝Aria2 下載Aria2插件,然后開發者模式安裝到瀏覽器 Aria2擴展選項的配置如下: 端口號需要改成Motrix的,默認是16800

SpringBoot applicationContext.getBeansOfType獲取某一接口所有實現類,應用于策略模式

本文介紹了如何在Springboot項目中通過ApplicationContext獲取接口的實現類,并通過枚舉策略模式避免if/else,展示了如何使用getBeansOfType獲取TrafficModeService的實現,以及如何在實際場景中應用,如查詢交通方式費用 1 在實際工…

大模型問題:幻覺分類+原因+各個訓練階段產生幻覺+幻覺的檢測和評估基準

1. 什么是幻覺?大模型出現幻覺,簡而言之就是“胡說八道”。 用《A Survey on Hallucination in Large Language Models》1文中的話來講,是指模型生成的內容與現實世界事實或用戶輸入不一致的現象。 研究人員將大模型的幻覺分為事實性幻覺&…

智慧冷庫物聯網解決方案——實現降本增效與風險可控的冷庫管理新范式

一、冷庫管理痛點設備孤島化:冷庫品牌、型號分散,缺乏統一接入標準,數據互通難,依賴人工巡檢,故障響應滯后。能耗黑洞:制冷系統能耗占冷庫總運營成本的60%以上,傳統管理粗放,缺乏動態…

太空生活的八種要素

數代以來,科學家們一直在銀河系中搜尋地外行星存在生命的證據。他們試圖找到一組特定的環境條件與化學物質,在恰當的時間、恰當的地點交匯融合。 通過研究人類、植物、動物及微生物在地球上的生存與繁衍方式,科學家們已識別出生命演化所需的關…

Flutter 小技巧之有趣的 UI 骨架屏框架 skeletonizer

很久沒有更新過小技巧系列,今天簡單介紹一個非常好用的骨架屏框架 skeletonizer ,它主要是通過將你現有的布局自動簡化為簡單的骨架,并添加動畫效果來實現加載過程,而使用成本則是簡單的添加一個 Skeletonizer 作為 parent &…

基于SpringBoot的寵物用品系統【2026最新】

作者:計算機學姐 開發技術:SpringBoot、SSM、Vue、MySQL、JSP、ElementUI、Python、小程序等,“文末源碼”。 專欄推薦:前后端分離項目源碼、SpringBoot項目源碼、Vue項目源碼、SSM項目源碼、微信小程序源碼 精品專欄:…

MongoDB 分片集群修改管理員密碼

記得關注一下博主,博主每天都會更新IT技術,讓你有意想不到的小收獲哦^_^ 文章目錄*記得關注一下博主,博主每天都會更新IT技術,讓你有意想不到的小收獲哦^_^*一、注釋MongoDB分片集群認證參數(三臺主機都要操作&#xf…

C++函數重載與引用詳解

一、函數重載:同名函數的 “差異化生存”?1. 概念定義?函數重載(Function Overloading)是 C 的重要特性,指在同一作用域內,允許存在多個同名函數,但要求這些函數的參數列表必須不同。(參數個數…

2025-08-17 李沐深度學習16——目標檢測

文章目錄1 介紹1.1 實際應用1.2 邊界框1.3 數據集2 錨框2.1 什么是錨框2.2 交并比2.3 分配標簽2.4 非極大值抑制3 經典目標檢測網絡3.1 R-CNN3.1.1 R-CNN (原始版本)3.1.2 Fast R-CNN3.1.3 Faster R-CNN3.1.4 Mask R-CNN3.2 單階段檢測器:SSD 和 YOLO3.2.1 SSD (Sin…

Bluedroid vs NimBLE

🔹 對比:Bluedroid vs NimBLE 1. 協議棧體積 & 內存占用 Bluedroid:體積大,RAM 占用也大(幾十 KB 到上百 KB)。NimBLE:輕量級,內存占用大概是 Bluedroid 的一半甚至更少。 &…

(純新手教學)計算機視覺(opencv)實戰八——四種邊緣檢測詳解:Sobel、Scharr、Laplacian、Canny

邊緣檢測詳解:Sobel、Scharr、Laplacian、Canny邊緣檢測是圖像處理和計算機視覺中的重要步驟,主要用于發現圖像中亮度變化劇烈的區域,即物體的輪廓、邊界或紋理特征。OpenCV 提供了多種常用的邊緣檢測算子,本教程將通過四種方法帶…

PyTorch 環境配置

目錄一、安裝 CUDA二、安裝 PyTorch1. 創建虛擬環境2. 安裝 PyTorch三、在 PyCharm 上創建一個 PyTorch 項目參考文章: 【2025年最新PyTorch環境配置保姆級教程(附安裝包)】 【超詳細 CUDA 安裝與卸載教程(圖文教程)】…

鴻蒙中冷啟動分析:Launch分析

啟動的分類(熱身環節) 啟動動類型觸發條件系統開銷 & 速度主要優化方向冷啟動應用進程不存在(首次啟動或進程被殺后啟動)最高,需創建進程、加載資源、初始化所有組件主要優化目標,減少主線程任務&…

告別盲目排查,PolarDB+DAS Agent智能運維新突破

1.概述 周五下午6點正準備下班,數據庫CPU突然爆滿,業務告警響成一片,DBA卻要手動翻查CPU/內存/負載等多個監控指標,還要查詢是否有新增慢SQL,死鎖等問題?” 這可能是數據庫DBA最鬧心的場景了,…

Linux------《零基礎到聯網:CentOS 7 在 VMware Workstation 中的全流程安裝與 NAT 網絡配置實戰》

(一)Linux的發行版Centos安裝與配置 下載Linux發行版本Centos:centos-7-isos-x86_64安裝包下載_開源鏡像站-阿里云點擊CentOS-7-x86_64-DVD-2009.torrent ,CentOS-7-x86_64-DVD-2009.torrent是官方提供的 BT 種子文件(176.1 KB&a…

iOS App 混淆工具實戰,教育培訓類 App 的安全保護方案

隨著在線教育、企業培訓、知識付費平臺的興起,越來越多的 iOS 應用需要保護自己的課程資源和核心邏輯。然而,教育類 App 面臨的最大風險并非傳統的外掛或刷分,而是 視頻盜鏈、題庫數據泄露、源碼邏輯被二次利用。 在這種場景下,合…