LLaMA-Factory微調大模型Qwen2.5

1、開始ModelScope社區GPU環境

訓練或微調模型都是非常耗費算力的。如果電腦的配置不高,可使用一些云服務器來做這項工作。如ModelScope(魔搭)社區的GPU環境,目前提供36小時免費運算,足夠微調一個大模型了。

注冊ModelScope(魔搭)社區賬號(可能還要注冊或認證阿里云賬號),進入“我的NoteBook”:

我的Notebook · 魔搭社區

啟動大概需要2分鐘,等GPU環境啟動好以后點擊"查看NoteBook"進入。

開啟后,會提示永久性數據只保存在/mnt/workspace/目錄下。

魔塔社區內置了JupyterLab的功能,進入之后,可以找到 Notebook 標簽,新建一個Notebook(當然你在terminal 里執行也沒問題)。

如下箭頭所示,點擊即可創建一個新的 Notebook 頁面。

2、克隆LLaMA-Factory

(如果使用本地電腦進行微調,以下步驟都可參考)

打開NoteBook的終端,在默認目錄(/mnt/workspace/)下執行命令:

git clone --depth 1 https://github.com/hiyouga/LLaMA-Factory.git

建議使用--depth 1參數,將data及一些示例的訓練數據下載下來,以便修改微調。

3、配置環境

3.1、創建虛擬環境

進入LLaMA-Factory目錄:

cd LLaMA-Factory/

創建虛擬環境:

python -m venv env  # env為虛擬環境文件夾名稱,可自定義,如llama-factory-env

激活虛擬環境:NoteBook終端是linux系統,激活虛擬環境命令如下(同macOS):

source env/bin/activate # env為創建的虛擬環境名稱

如果是windows系統,使用如下命令激活虛擬環境:

env\Scripts\activate

注意:重啟NoteBook后,記得先激活虛擬環境!

3.2、安裝依賴

安裝必要的依賴,如:

pip install --upgrade pip     # 更新pip
pip install bitsandbytes>=0.39.0 

3.3、安裝LLaMA-Factory

使用以下命令安裝:

pip3 install -e ".[torch,metrics]"

4、模型下載測試

4.1、下載模型

首先下載LLM大語言模型,這里使用QWen2.5-0.5B,參數5億個,微調時間短,在低配置電腦上也能運行。

模型在魔搭社區上有,地址是:

本文來自互聯網用戶投稿,該文觀點僅代表作者本人,不代表本站立場。本站僅提供信息存儲空間服務,不擁有所有權,不承擔相關法律責任。
如若轉載,請注明出處:http://www.pswp.cn/bicheng/81225.shtml
繁體地址,請注明出處:http://hk.pswp.cn/bicheng/81225.shtml
英文地址,請注明出處:http://en.pswp.cn/bicheng/81225.shtml

如若內容造成侵權/違法違規/事實不符,請聯系多彩編程網進行投訴反饋email:809451989@qq.com,一經查實,立即刪除!

相關文章

Python 3.13.3 安裝教程

原文來自:Python 3.13.3 安裝教程 | w3cschool筆記 (請勿標記為付費!!!) Python 是一種廣泛使用的編程語言,廣泛應用于 Web 開發、科學計算、數據處理、人工智能等領域。Python 3.13.3 作為 P…

sqli-labs靶場29-31關(http參數污染)

目錄 前言 less29(單引號http參數污染) less30(雙引號http參數污染) less31(雙引號括號http參數污染) 前言 在JSP中,使用request.getParameter("id")獲取請求參數時,如果存在多個同名參數&a…

npm cross-env工具包介紹(跨平臺環境變量設置工具)

文章目錄 cross-env:跨平臺環境變量設置工具什么是cross-env?為什么需要cross-env?平臺差異帶來的問題 cross-env的工作原理核心功能技術實現 安裝與基本使用安裝步驟基本使用方法運行效果 高級使用技巧設置多個環境變量環境變量傳遞與鏈式命…

mac docker彈窗提示Docker 啟動沒有響應

一、原因分析 這臺筆記電腦是Mac M3操作系統,安裝Docker之后,Docker應用程序一直啟動不起來。 二、解決辦法 sudo rm /Library/PrivilegedHelperTools/com.docker.vmnetd sudo cp /Applications/Docker.app/Contents/Library/LaunchServices/com.docker.vmnetd /Library/Pri…

Golang基礎知識—cond

cond 通常指 sync.Cond,它是標準庫 sync 包中用于實現 條件變量 的同步原語。條件變量在多 goroutine 協作場景中非常有用,尤其在需要根據特定條件協調多個 goroutine 的執行順序時。 sync.Cond 的核心作用 條件變量用于 等待某個條件滿足 或 通知其他等…

MySQL 8.0 OCP 1Z0-908 題目解析(1)

題目001 Choose two. User fwuserlocalhost is registered with the SQL Enterprise Firewall and has been granted privileges for the sakila database. Examine these commands that you executed and the results: mysql> SELECT MODE FROM INFORMATION_SCHEMA.SQL…

【Tools】git使用詳解以及遇到問題匯總

這里寫目錄標題 安裝git安裝 TortoiseGitgit github gitlab, Gitee 區別visual studio中使用gitgit使用步驟git命令git刪除某些歷史提交記錄git找回丟失代碼git上傳文本和二進制和gitignore刪除文件刪不掉的問題 安裝git https://blog.csdn.net/mukes/article/details/1156938…

畫立方體軟件開發筆記 js-pytorch xlsx 導出 excel pnpm安裝

js-pytorch npm install -g pnpm pnpm add js-pytorch 放著,等我把模型訓練好了再用這個對接 xlsx pnpm install xlsx ai寫代碼,一遍就通了 import * as XLSX from "xlsx"; import { linelist } from ./2dviewport.js; function export…

Kotlin并發請求的一些知識記錄

private suspend fun fetchDataConcurrently(list: MutableList<MyType>,onRequestResult: (Int, List<MyType>?) -> Unit //高階函數回調) {val deferredList mutableListOf<Deferred<MyType?>>()// 設定任務超時時間為12秒&#xff0c;并使用 …

配置VScodePython環境Python was not found;

Python was not found; run without arguments to install from the Microsoft Store, or disable this shortcut from Settings > Manage App Execution Aliases. 候試試重啟電腦。 在卸載重裝python后會出現難以解決的局面&#xff0c;系統變量&#xff0c;命令行&#…

OracleLinux7.9-ssh問題

有套rac環境&#xff0c;db1主機無法ssh db1和db1-priv&#xff0c;可以ssh登錄 db2和db2-priv [rootdb1 ~]# ssh db1 ^C [rootdb1 ~]# ssh db2 Last login: Wed May 14 18:25:19 2025 from db2 [rootdb2 ~]# ssh db2 Last login: Wed May 14 18:25:35 2025 from db1 [rootdb2…

如何創建maven項目

1.IDEA 中創建 Maven 項目 步驟一&#xff1a;點擊 File -> New -> Project&#xff0c;在彈出的窗口左側選擇 Maven&#xff0c;點擊 Next&#xff1a; 步驟二&#xff1a;填寫項目的 GroupId、ArtifactId、Version 等信息&#xff08;這些對應 pom.xml 中的關鍵配置&am…

Python爬蟲實戰:研究ajax異步渲染加密

一、引言 在當今數字化時代,數據已成為推動各行業發展的核心驅動力。網絡爬蟲作為一種高效的數據采集工具,能夠從互聯網上自動獲取大量有價值的信息。然而,隨著 Web 技術的不斷發展,越來越多的網站采用了 AJAX(Asynchronous JavaScript and XML)異步渲染技術來提升用戶體…

滬深股指期貨指數怎么參考交易?

滬深股指期貨指數&#xff0c;其實它就是咱們炒股時的一個“風向標”和“工具箱”。今天咱們就來聊聊怎么參考這個指數來交易&#xff0c;讓你也能輕松上手&#xff01; 一、滬深股指期貨指數是啥&#xff1f; 滬深股指期貨指數&#xff0c;簡單來說&#xff0c;就是基于滬深…

演員評論家算法

一、演員評論家算法核心思想和原理 演員(actor)代表策略&#xff0c;評論家代表價值函數。演員評論家算法是基于價值和策略的綜合性方法。具體來說該算法使用了策略梯度和時序差分方法&#xff0c;是二者的一種有機結合。 1. 主要思想 策略梯度算法以軌跡為單位更新&#xf…

PyCharm 快捷鍵指南

PyCharm 快捷鍵指南 常用編輯快捷鍵 代碼完成&#xff1a;Ctrl Space 提供基本的代碼完成選項&#xff08;類、方法、屬性&#xff09;導入類&#xff1a;Ctrl Alt Space 快速導入所需類語句完成&#xff1a;Ctrl Shift Enter 自動結束代碼&#xff08;如添加分號&#…

計算圖存儲采用矩陣嗎,和張量關系

計算圖存儲采用矩陣嗎,和張量關系 計算圖的存儲方式與張量的關系 一、計算圖的存儲方式 計算圖(Computational Graph)是一種用于描述數學運算的有向無環圖(DAG),其節點代表運算(如加減乘除、矩陣乘法、激活函數等),邊代表運算的輸入和輸出(通常是張量)。計算圖的…

RDD中分區、分區器及自定義分區器的學習

深入理解 Spark 中 RDD 分區與分區器&#xff1a;原理、應用及自定義實現 在大數據處理領域&#xff0c;Apache Spark 憑借其高效的分布式計算能力成為了眾多開發者的首選框架。在 Spark 中&#xff0c;彈性分布式數據集&#xff08;Resilient Distributed Dataset&#xff0c…

OpenCV CUDA 模塊中用于在 GPU 上計算矩陣中每個元素的絕對值或復數的模函數abs()

操作系統&#xff1a;ubuntu22.04 OpenCV版本&#xff1a;OpenCV4.9 IDE:Visual Studio Code 編程語言&#xff1a;C11 算法描述 void cv::cuda::abs(InputArray src, OutputArray dst, Stream &stream Stream::Null()) 是 OpenCV 的 CUDA 模塊中的一個函數&#xff0c;…

FramePack - 開源 AI 視頻生成工具

&#x1f3ac; 項目簡介 由開發者 lllyasviel 創建的一個輕量級動畫幀處理工具庫&#xff0c;專門用于游戲開發、動畫制作和視頻處理中的幀序列打包與管理。該項目采用高效的算法實現&#xff0c;能夠顯著提升動畫資源的處理效率。 此 AI 視頻生成項目&#xff0c;旨在通過低顯…