LLaMA-Factory 是一個由零隙智能(SeamLessAI)開源的低代碼大模型訓練框架,它集成了業界最廣泛使用的微調方法和優化技術,并支持眾多開源模型的微調和二次訓練。
一、功能特點
- 支持多種開源模型:LLaMA-Factory支持包括Yuan2.0、LLaMA、LLaVA、Mistral、Mixtral-MoE、Qwen、Yi、Gemma、Baichuan、ChatGLM、Phi等多種開源大語言模型。
- 高效微調技術:框架集成了多種高效的微調技術,如LoRA、QLoRA等,這些技術可以在不改變預訓練模型原始權重參數的情況下,通過引入小的可訓練矩陣來實現模型的微調,從而有效緩解內存和計算資源的限制。
- 可視化訓練與推理平臺:LLaMA-Factory為開發者提供了可視化訓練、推理平臺,通過一鍵配置模型訓練,實現零代碼微調LLM。這使得非專業開發者也能輕松上手,進行模型的定制開發。
- 多種訓練模式:支持增量預訓練、有監督微調、基于人類反饋的強化學習(RLHF)、直接偏好優化(DPO)等多種訓練模式,滿足不同場景下的需求。
- 先進算法與實用技巧:集成了GaLore、BAdam、DoRA、LongLoRA、LLaMA Pro等先進算法,以及FlashAttention-2、Unsloth、RoPE scaling等實用技巧,提升訓練效率和模型性能。
- 實驗監控與評估:提供LlamaBoard、TensorBoard、Wandb、MLflow等多種實驗監控工具,幫助開發者實時監控訓練過程,評估模型性能。
二、使用流程
- 環境準備:
- 克隆LLaMA-Factory的GitHub倉庫。
- 創建虛擬環境,安裝必要的依賴庫。
- 根據需要安裝額外的依賴項,如torch、metrics、deepspeed等。
- 數據準備:
- 準備用于微調的數據集,并按照LLaMA-Factory要求的格式進行組織。
- 數據集可以包括輸入、輸出對,以及可選的用戶指令、系統提示、歷史對話等信息。
- 模型配置與訓練:
- 在LLaMA-Factory的Web UI或命令行界面中配置模型參數、訓練參數等。
- 選擇合適的微調方法和優化技術,啟動訓練過程。
- 監控訓練過程,根據需要調整參數或停止訓練。
- 模型評估與推理:
- 使用測試集對訓練好的模型進行評估,評估指標包括loss、bleu等。
- 根據評估結果選擇最優的模型進行推理或部署。
三、應用實例
LLaMA-Factory已經成功應用于多個實際場景中,如天文大模型StarWhisper、中文法律領域大模型DISC-LawLLM、中文醫療大模型Sumsimiao等。這些應用實例證明了LLaMA-Factory在定制開發領域大模型方面的強大能力和實用性。
綜上所述,LLaMA-Factory是一個功能強大、易于使用的低代碼大模型訓練框架,它為開發者提供了豐富的微調方法和優化技術,以及可視化訓練、推理平臺,助力開發者輕松實現領域大模型的定制開發。