llamafactory使用qlora訓練

llamafactory使用qlora訓練

1.環境搭建

conda create -n qlora python=3.10 -y
conda activate qlora# 克隆LLaMA-Factory倉庫
git clone https://github.com/hiyouga/LLaMA-Factory.git# 進入倉庫目錄
cd LLaMA-Factory# 切換到0.9.4版本
git checkout v0.9.4pip install -e .

2.開始訓練

2.1找到訓練的最大批次

不啟動qlora找到訓練的剛好"out of memory"的批次,然后再啟動qlora進行量化訓練。

請添加圖片描述

每次開始訓練時要更改輸出目錄。

2.使用qlora進行訓練
請添加圖片描述

3.導出環境包版本信息

3.1導出環境信息

首先激活要導出的 Conda 環境,命令如下(將your_environment_name替換為實際環境名稱):

conda activate your_environment_name

然后導出環境依賴信息,生成environment.yml文件,命令如下:

conda env export > /workspace/qlora-environment.yml 

qlora-environment.yml

name: qlora
channels:- conda-forge
dependencies:- _libgcc_mutex=0.1=conda_forge- _openmp_mutex=4.5=2_gnu- bzip2=1.0.8=h4bc722e_7- ca-certificates=2025.8.3=hbd8a1cb_0- ld_impl_linux-64=2.44=h1423503_1- libexpat=2.7.1=hecca717_0- libffi=3.4.6=h2dba641_1- libgcc=15.1.0=h767d61c_4- libgcc-ng=15.1.0=h69a702a_4- libgomp=15.1.0=h767d61c_4- liblzma=5.8.1=hb9d3cd8_2- libnsl=2.0.1=hb9d3cd8_1- libsqlite=3.50.4=h0c1763c_0- libuuid=2.38.1=h0b41bf4_0- libxcrypt=4.4.36=hd590300_1- libzlib=1.3.1=hb9d3cd8_2- ncurses=6.5=h2d0b736_3- openssl=3.5.2=h26f9b46_0- pip=25.2=pyh8b19718_0- python=3.10.18=hd6af730_0_cpython- readline=8.2=h8c095d6_2- setuptools=80.9.0=pyhff2d567_0- tk=8.6.13=noxft_hd72426e_102- wheel=0.45.1=pyhd8ed1ab_1- pip:- accelerate==1.7.0- aiofiles==23.2.1- aiohappyeyeballs==2.6.1- aiohttp==3.12.15- aiosignal==1.4.0- altair==5.5.0- annotated-types==0.7.0- antlr4-python3-runtime==4.9.3- anyio==4.10.0- async-timeout==5.0.1- attrs==25.3.0- audioread==3.0.1- av==15.0.0- bitsandbytes==0.47.0- certifi==2025.8.3- cffi==1.17.1- charset-normalizer==3.4.3- click==8.2.1- contourpy==1.3.2- cycler==0.12.1- datasets==3.1.0- decorator==5.2.1- dill==0.3.8- docstring-parser==0.17.0- einops==0.8.1- exceptiongroup==1.3.0- fastapi==0.116.1- ffmpy==0.6.1- filelock==3.19.1- fire==0.7.1- fonttools==4.59.1- frozenlist==1.7.0- fsspec==2024.9.0- gradio==5.31.0- gradio-client==1.10.1- groovy==0.1.2- h11==0.16.0- hf-transfer==0.1.9- hf-xet==1.1.7- httpcore==1.0.9- httpx==0.28.1- huggingface-hub==0.34.4- idna==3.10- importlib-resources==6.5.2- jinja2==3.1.6- joblib==1.5.1- jsonschema==4.25.0- jsonschema-specifications==2025.4.1- kiwisolver==1.4.9- lazy-loader==0.4- librosa==0.11.0- llamafactory==0.9.4.dev0- llvmlite==0.44.0- markdown-it-py==4.0.0- markupsafe==2.1.5- matplotlib==3.10.5- mdurl==0.1.2- modelscope==1.29.0- mpmath==1.3.0- msgpack==1.1.1- multidict==6.6.4- multiprocess==0.70.16- narwhals==2.1.2- networkx==3.4.2- numba==0.61.2- numpy==1.26.4- nvidia-cublas-cu12==12.8.4.1- nvidia-cuda-cupti-cu12==12.8.90- nvidia-cuda-nvrtc-cu12==12.8.93- nvidia-cuda-runtime-cu12==12.8.90- nvidia-cudnn-cu12==9.10.2.21- nvidia-cufft-cu12==11.3.3.83- nvidia-cufile-cu12==1.13.1.3- nvidia-curand-cu12==10.3.9.90- nvidia-cusolver-cu12==11.7.3.90- nvidia-cusparse-cu12==12.5.8.93- nvidia-cusparselt-cu12==0.7.1- nvidia-nccl-cu12==2.27.3- nvidia-nvjitlink-cu12==12.8.93- nvidia-nvtx-cu12==12.8.90- omegaconf==2.3.0- orjson==3.11.2- packaging==25.0- pandas==2.3.1- peft==0.15.2- pillow==10.4.0- platformdirs==4.3.8- pooch==1.8.2- propcache==0.3.2- protobuf==6.32.0- psutil==7.0.0- pyarrow==21.0.0- pycparser==2.22- pydantic==2.10.6- pydantic-core==2.27.2- pydub==0.25.1- pygments==2.19.2- pyparsing==3.2.3- python-dateutil==2.9.0.post0- python-multipart==0.0.20- pytz==2025.2- pyyaml==6.0.2- referencing==0.36.2- regex==2025.7.34- requests==2.32.4- rich==14.1.0- rpds-py==0.27.0- ruff==0.12.9- safehttpx==0.1.6- safetensors==0.5.3- scikit-learn==1.7.1- scipy==1.15.3- semantic-version==2.10.0- sentencepiece==0.2.1- shellingham==1.5.4- shtab==1.7.2- six==1.17.0- sniffio==1.3.1- soundfile==0.13.1- soxr==0.5.0.post1- sse-starlette==3.0.2- starlette==0.47.2- sympy==1.14.0- termcolor==3.1.0- threadpoolctl==3.6.0- tiktoken==0.11.0- tokenizers==0.21.1- tomlkit==0.12.0- torch==2.8.0- tqdm==4.67.1- transformers==4.55.0- triton==3.4.0- trl==0.9.6- typer==0.16.0- typing-extensions==4.14.1- typing-inspection==0.4.1- tyro==0.8.14- tzdata==2025.2- urllib3==2.5.0- uvicorn==0.35.0- websockets==11.0.3- xxhash==3.5.0- yarl==1.20.1
prefix: /root/miniforge3/envs/qlora

3.2導出環境基本信息

若只需快速遷移或記錄環境基本信息,可使用以下命令導出當前環境中安裝的所有包和版本號到package-list.txt文件:

conda list --export > package-list.txt

4.導入環境信息

4.1根據environment.yml文件創建環境

將environment.yml文件復制到目標機器上,進入該文件所在目錄,執行以下命令創建環境:

conda env create -f environment.yml

創建完成后,可使用以下命令激活新環境(將your_environment_name替換為實際環境名稱):

conda activate your_environment_name

4.2根據package-list.txt文件安裝包

將package-list.txt文件復制到目標機器上,進入文件所在目錄,執行以下命令安裝包:

conda install --file package-list.txt

本文來自互聯網用戶投稿,該文觀點僅代表作者本人,不代表本站立場。本站僅提供信息存儲空間服務,不擁有所有權,不承擔相關法律責任。
如若轉載,請注明出處:http://www.pswp.cn/diannao/96004.shtml
繁體地址,請注明出處:http://hk.pswp.cn/diannao/96004.shtml
英文地址,請注明出處:http://en.pswp.cn/diannao/96004.shtml

如若內容造成侵權/違法違規/事實不符,請聯系多彩編程網進行投訴反饋email:809451989@qq.com,一經查實,立即刪除!

相關文章

模型微調/量化技術整理

一、模型微調技術1.模型微調簡介大模型微調(Fine-tuning),是指在已經預訓練好的大語言模型基礎上(基座模型),使用特定的數據集進行進一步訓練,讓模型適應特定任務或領域。通常LLM的預訓練是無監督的,但微調…

實踐筆記-VSCode與IDE同步問題解決指南;程序總是進入中斷服務程序。

一、VSCode 修改文件后,IDE 未同步如果你在 VSCode 中異步修改了項目文件內容,但 S32DS 或 Keil(等集成開發環境)中的項目沒有同步更新,有兩個解決方法:檢查文件是否已保存:確保 VSCode 中修改的…

C#WPF實戰出真汁04--登錄功能實現

1、登錄功能實現要點對于登錄系統,應該注意幾個要點:用戶認證流程設計,密碼存儲與驗證,會話管理,防暴力破解措施,錯誤處理與提示2、登錄功能的視圖模型首先在xaml文件中必須指定該頁面使用的視圖模型&#…

鴻蒙入門簡化版

第一步: 首先下載DEVStudio https://developer.huawei.com/consumer/cn/deveco-studio/ 第二步: 了解基本的ArkTs語言 https://developer.huawei.com/consumer/cn/doc/harmonyos-guides/introduction-to-arkts 第三步 : 教學視頻有兩個途徑&a…

day25|學習前端js

函數聲明,被提升(hoisting)。函數表達式必須先定義才能用。對象解構,按屬性名數組解構按順序點運算符. 對象.屬性名哪些可迭代(可以被for..of循環的東西):array,string,m…

quic協議與應用開發

quic為什么出現?quic主要是為了解決TCP協議的局限性而提出的,具體來說是要解決如下問題:1. 加密連接建立時間長TCP協議是傳輸層協議,而TLS是會話層協議,在Linux等主流操作系統中TCP在內核實現而TLS一般在用戶態實現&am…

【淺學】tflite-micro + ESP32S3 + VScode + ESP-IDF 基于例程快速實現自己的圖像分類模型訓練部署全流程

如果你用Pytorch訓練的模型那么可以參考我的步驟,使用的是Tensorflow的話參考官方文檔即可,但流程都是一樣的,每一步我都會提到部分操作細節及注意事項 官方教程 要詳細學習的話tflite-micro里的微控制器章節下都詳細看(頁面左側…

【HarmonyOS】應用設置全屏和安全區域詳解

【HarmonyOS】應用設置全屏和安全區域詳解 一、前言 IDE創建的鴻蒙應用,默認采取組件安全區布局方案。頂部會預留狀態欄區域,底部會預留導航條區域。這就是所謂的安全區域。 如果不處理,界面效果很割裂。所以業內UI交互設計,都會設…

openfeign 只有接口如何創建bean的

OpenFeign 能夠為純接口創建 Spring Bean,其核心機制是通過動態代理和 Spring 的 FactoryBean 機制實現的。以下是詳細的工作原理:1. EnableFeignClients 注解的啟動在 Spring Boot 主類上添加 EnableFeignClients 注解:SpringBootApplicatio…

【展廳多媒體】互動地磚屏怎么提升展廳互動感的?

在數字化展廳設計中,互動地磚屏 正成為提升觀眾參與度的重要工具。這種融合視覺科技與交互體驗的裝置,通過動態影像與即時反饋,讓參觀者從被動觀看轉變為主動探索,從而大幅增強展廳的互動感。 Led地面互動屏的優勢在于其強大的視…

AI賦能電力巡檢:變壓器漏油智能檢測系統全解析

🔥 AI賦能電力巡檢:變壓器漏油智能檢測系統全解析 📖 前言 在電力系統的日常運維中,變壓器作為核心設備,其安全運行直接關系到整個電網的穩定性。傳統的人工巡檢方式不僅效率低下,還存在安全隱患和漏檢風險…

GitHub上值得Star的計算機視覺項目

GitHub上值得Star的計算機視覺項目 前言 一、OpenCV:計算機視覺領域的瑞士軍刀 1.1 項目簡介 1.2 核心功能與技術特點 1.3 代碼示例 二、YOLO 系列:實時目標檢測的領導者 2.1 項目簡介 2.2 核心功能與技術特點 2.3 代碼示例 三、Detectron2:Facebook AI Research 的目標檢測…

【深度學習】pytorch深度學習框架的環境配置

文章目錄1. 配置cuda環境2. 配置conda環境3. 配置pytorch gpu環境1. 配置cuda環境 在命令行輸入以下命令可以查看當前顯卡驅動版本和最高支持的cuda版本 nvidia-smi根據cuda版本去官網下載并安裝cuda 下載鏈接:https://developer.nvidia.com/cuda-toolkit-archive…

數據處理與統計分析 —— 房源數據集分析案例

數據集網盤下載: 鏈接:https://pan.quark.cn/s/0e577858dba3?pwdFJnb 提取碼:FJnb代碼僅供參考具體可打開ipynb文件進行學習和練習:鏈接:https://pan.quark.cn/s/8efbe3061fad?pwdT47B 提取碼:T47Bimport…

藍牙如何測試?

車載藍牙測試需覆蓋 連接穩定性、功能完整性、兼容性、交互體驗等核心維度,結合車載場景的特殊性(如行駛中信號干擾、多設備交互、安全需求),具體測試點如下: 一、基礎配對與連接測試 1. 首次配對 觸發配對:車機端 “藍牙設置” 中搜索設備、手機端搜索車機(車機名稱是…

算法02 二進制與位運算

二進制作為計算機底層數據的核心表示方式,其獨特的位結構和運算規則在算法設計中有著廣泛且關鍵的應用。以下從基礎操作、算法技巧、數據結構、經典問題等多個維度,全面梳理二進制在算法中的應用: 一、基礎位運算:算法的“原子操作…

PAT 1071 Speech Patterns

題目大意是說給出一個文本,找出里面出現最多的單詞,如果有多個單詞出現次數一樣多,則輸出字典序最小的。 需要注意的是: 給出的文本字符串不僅有數字還有字母,還有一些特殊的字符,還有空格。 而單詞是只包含…

CSS中的 :root 偽類

在CSS中&#xff0c;偽類是一種用于選擇元素特定狀態的選擇器。:root 偽類專門用于選擇文檔的根元素&#xff08;在HTML中通常是<html>元素&#xff09;&#xff0c;它是CSS變量&#xff08;Custom Properties&#xff09;的理想載體&#xff0c;常用于定義全局樣式變量&…

能源行業數字化轉型:邊緣計算網關在油田場景的深度應用

能源行業數字化轉型&#xff1a;邊緣計算網關在油田場景的深度應用能源行業是國民經濟的支柱產業&#xff0c;而油田作為能源生產的重要基地&#xff0c;其數字化轉型對于提高生產效率、降低能耗、減少碳排放具有重要意義。然而&#xff0c;油田往往地處偏遠&#xff0c;油井分…

CAG緩存增強生成與RAG檢索增強生成對比

深度定制 LLM 知識,除了 RAC &#xff0c;現在又有新技術假設有一份200頁的產品手冊,你想讓 LLM 準確回答里面的相關問題,要實現這個目標,除了常用的檢索增強生成技術 rep ,現在有了新思路,緩存增強生成 CAG &#xff0c;它是什么,何時使用.RAG檢索增強是常規套路,CAG緩存增強是…