Ubuntu22系統上源碼部署LLamaFactory+微調模型 教程【親測成功】

0.LLamaFactory

LLaMA-Factory 是一個開源的低代碼大模型訓練與微調框架,旨在簡化大規模語言模型(LLM)的微調、評估和部署流程,幫助開發者和研究人員更高效地定制和優化模型。

1.安裝部署

1.1克隆倉庫

git clone --depth 1 https://github.com/hiyouga/LLaMA-Factory.git

克隆成功如下圖所示
克隆成功

1.2切換目錄

cd LLaMA-Factory

切換步驟

1.3通過conda創建python環境

conda create -n llama-factory python=3.10

截圖成功

1.4激活虛擬環境

conda activate llama-factory

激活環境

1.5在conda環境中安裝LLama-Factory相關依賴

pip install -e ".[torch,metrics]" --no-build-isolation

安裝過程如下
安裝過程

2.啟動LLama-Factory可視化微調界面(由 Gradio 驅動)

llamafactory-cli webui

命令截圖

3.在瀏覽器輸入服務器ip+端口

啟動成功如下圖所示
啟動成功

4.從Hugging-Face上面下載基座模型

4.1創建一個文件夾統一存放所有基座模型

mkdir Hugging-Face

4.2修改 HuggingFace 鏡像源(加速下載)

export HF_ENDPOINT=https://hf-mirror.com

修改鏡像源

4.3修改模型默認下載位置

export HF_HOME=/data/Hugging-Face

修改下載位置
————————————————————————
NOTES:
4.2和4.3的做法是在臨時會話中生效,如果想要永久化生效,如下操作:
(1)打開配置文件

sudo vi ~/.bashrc

(2)寫入以下內容

export HF_ENDPOINT=https://hf-mirror.com
export HF_HOME=/data/Hugging-Face

配置內容

(3)配置生效

source ~/.bashrc

配置生效
(4)驗證生效即可

echo $HF_HOME 
echo $HF_ENDPOINT

如下圖所示
生效

——————————————————————————

4.4安裝HuggingFace官方下載工具

pip install -U huggingface_hub

——————————————————
NOTES:
1.??pip install??
Python 包管理工具的標準安裝命令。
2.??-U參數??
--upgrade的簡寫,表示強制升級到最新版本(若已安裝則更新)。
3.??huggingface_hub??
HuggingFace 官方提供的 Python 庫,用于:
?訪問 Hub 上的模型/數據集
?管理倉庫和文件
?集成 Transformers/Diffusers 等庫
———————————————————
執行成功如下
成功

4.5執行下載命令

huggingface-cli download --resume-download deepseek-ai/DeepSeek-R1-Distill-Qwen-1.5B

下載哪個模型到HuggingFace官網上面搜索即可
基座模型
下載成功截圖
下載成功
模型位置
模型成功下載

5.在LLamaFactory可視化頁面上加載模型,檢驗是否加載成功

5.1選擇模型

選擇模型
——————————————————
NOTES:
這里的模型路徑不是整個模型文件夾,而是精確到模型特定快照的唯一哈希值snapshots
路徑如下所示
路徑
——————————————————

5.2執行測試

5.2.1 分別點擊chat->加載模型,出現如下界面即為成功
成功
5.2.2 聊天測試

下圖即為成功
聊天測試

6.準備用于訓練的數據集并添加到指定位置

本文來自互聯網用戶投稿,該文觀點僅代表作者本人,不代表本站立場。本站僅提供信息存儲空間服務,不擁有所有權,不承擔相關法律責任。
如若轉載,請注明出處:http://www.pswp.cn/pingmian/93615.shtml
繁體地址,請注明出處:http://hk.pswp.cn/pingmian/93615.shtml
英文地址,請注明出處:http://en.pswp.cn/pingmian/93615.shtml

如若內容造成侵權/違法違規/事實不符,請聯系多彩編程網進行投訴反饋email:809451989@qq.com,一經查實,立即刪除!

相關文章

打靶日常-sql注入(手工+sqlmap)

小知識: 注入點:在哪里輸入sgl指令中的參數 執行點:在那個頁面拼接sql指令并發送給數據庫執行 回顯點:執行的結果顯示在哪個頁面 sqlmap知識點: 輸出等級 -v3 范圍0-6 默認1 一般3 考試3 測試等級 --level=1 范圍…

繞過服務端文件上傳檢測:黑名單繞過技術與實戰

繞過服務端文件上傳檢測:黑名單繞過技術與實戰文件上傳漏洞是Web安全中常見且危害極大的漏洞類型之一,而黑名單機制是最基礎的防御手段。本文將深入探討三種經典的黑名單繞過技術,并提供實戰案例與防御方案。引言 文件上傳功能是現代Web應用的…

在職老D滲透日記day21:sqli-labs靶場通關(第27a關)get聯合注入 過濾select和union “閉合

5.27a.第27a關 get聯合注入 過濾select和union "閉合function blacklist($id) { $id preg_replace(/[\/\*]/,"", $id); //strip out /* $id preg_replace(/[--]/,"", $id); //Strip out --. $id preg_replace(/[#]/,"", $id); //Strip …

Git#cherry-pick

場景 項目里有多個分支,在某個分支commit內容想要應用到當前分支 命令 git cherry-pick --helpgit cherry-pick commit-ish:某個其他分支的commit應用到當前所在分支 (默認自動提交)git cherry-pick -n commit-ish:–no-commit(不自動提交)&a…

極海APM32F107V6 gpio模擬串口

一、原理部分 之前用外設都是直接用的硬件自帶的庫,雖然以前有學過原理和時序,但是因為工作其實也很少會有需要gpio模擬串口的情況,但總會有串口用完,但是需要一個類似打印串口的情況。今天也是開整,然后用硬件的庫對…

【數據可視化-94】2025 亞洲杯總決賽數據可視化分析:澳大利亞隊 vs 中國隊

🧑 博主簡介:曾任某智慧城市類企業算法總監,目前在美國市場的物流公司從事高級算法工程師一職,深耕人工智能領域,精通python數據挖掘、可視化、機器學習等,發表過AI相關的專利并多次在AI類比賽中獲獎。CSDN…

鏈表基本運算詳解:查找、插入、刪除及特殊鏈表

在上一篇文章中,我們介紹了線性表的基本概念和順序存儲。本文將深入探討單鏈表的基本運算,并介紹循環鏈表和雙向鏈表這兩種特殊的鏈表結構,幫助讀者全面掌握鏈表的操作技巧。 文章目錄1.單鏈表基本運算鏈表的查找操作按序號查找按值查找鏈表的…

8.19作業

1.聊天室1.1服務器#include <myhead.h> #define SER_PORT 8888 #define SER_IP "192.168.174.128"struct msg {char type;char usrname[20];char msgtext[1024]; };int main(int argc, const char *argv[]) {int sfd socket(AF_INET,SOCK_STREAM,0);if (sfd-1…

95、23種設計模式之建造者模式(4/23)

建造者模式&#xff08;Builder Pattern&#xff09;是23種經典設計模式中的創建型模式之一&#xff0c;其核心思想是將復雜對象的構建過程與其表示分離&#xff0c;使得同樣的構建流程可以生成不同結構或配置的對象。以下從定義、結構、應用場景、優缺點及代碼示例展開分析&am…

LIA-X - 一張照片生成任意表情肖像動畫視頻 精準操控面部動作 支持50系顯卡 一鍵整合包下載

LIA-X 是一個可解釋的潛在肖像動畫生成器&#xff0c;只需要一張照片加一段驅動視頻生成任意表情肖像動畫&#xff0c; 旨在將驅動視頻中的面部動態精細地轉移到源肖像上&#xff0c;同時提供對頭部、嘴巴和眼睛的精細控制。同時支持圖像和視頻的編輯任務&#xff0c;比如對頭部…

Google 的 Opal:重新定義自動化的 AI 平臺

1. 真實世界測試&#xff1a;結果出乎意料 我讓 Opal 接受了三項極具挑戰性的任務&#xff1a; 1.1. 博客生成器挑戰 我的提示&#xff1a;“研究并撰寫一篇關于 2 億美元融資對無代碼&#xff08;no-code&#xff09;影響的文章。” 發生了什么&#xff1a;Opal 不僅僅是寫…

【FreeRTOS】任務通知

任務通知通知狀態的三種取值taskNOT_WAITING_NOTIFICATION&#xff1a;任務沒有在等待通知taskWAITING_NOTIFICATION&#xff1a;任務在等待通知taskNOTIFICATION_RECEIVED&#xff1a;任務接收到了通知&#xff0c;也被稱為 pending(有數據了&#xff0c;待處理)如下面兩個場景…

BEV:隱式相機視角轉換-----BEVFormer

一、背景 基于imp投影的相機視角轉換&#xff0c;對相機的內外參依賴較高&#xff0c;BEV 網格融合固定&#xff0c;可能對小目標不夠敏感&#xff1b;考慮通過transformer的方式進行相機的視角轉換&#xff0c;BEV query 可以自適應關注關鍵區域&#xff0c;提高小目標檢測&am…

zsh 使用筆記 命令行智能提示 bash智能

目錄 安裝&#xff1a; 升級&#xff1a; zsh 有什么用&#xff1f; zsh 安裝&#xff1a; sudo apt update sudo apt install zsh -y 升級&#xff1a; omz update zsh 有什么用&#xff1f; 相比 bash&#xff0c;zsh 更智能、更方便&#xff0c;常見優勢有&#xff…

Laya的適配模式選擇

文章目錄SCALE_FIXED_AUTOSCALE_SHOWALLSCALE_FULLSCALE_FIXED_HEIGHTSCALE_FIXED_WIDTHSCALE_NOSCALESCALE_EXACTFITSCALE_NOBORDERdemoSCALE_FIXED_AUTO NO.1會透&#xff0c;拉伸能解決官網解釋&#xff1a;應用保持設計比例不變&#xff0c;全屏顯示全部內容(類似showall&…

Android中flavor的使用

在我的開發中&#xff0c;有這樣的需求&#xff0c;有一個項目&#xff0c;需要適配不同的執法儀設備&#xff0c;這些執法儀都是Android系統的&#xff0c;而且有的有系統簽名&#xff0c;有的沒有&#xff0c;比如我共有四款型號&#xff0c;有三款有系統簽名&#xff0c;每款…

如何使用DeepSeek解析長pdf的文本

直接使用python工具解析pdf文件&#xff0c;可能因為格式兼容問題&#xff0c;導致解析出的文本幾乎不可讀。 這里嘗試使用Deepseek解析pdf文件&#xff0c;這里僅考慮文本&#xff0c;不考慮其他要素。 1 解析第一步 將pdf作為附件上傳到deepseekchat界面&#xff0c;輸入如…

W3C CSS 活動

W3C CSS 活動 引言 CSS(層疊樣式表)是現代網頁設計中不可或缺的技術之一。W3C(萬維網聯盟)作為全球互聯網標準制定的主要組織,定期舉辦各類CSS相關的活動,旨在促進CSS技術的發展與普及。本文將詳細介紹W3C CSS活動,包括活動內容、參與方式以及活動意義。 活動內容 1…

React Native 與 UniApp 對比

React Native 優點: 由 Facebook 開發維護&#xff0c;社區生態強大 使用 JavaScript/TypeScript 開發&#xff0c;學習曲線相對平緩 真正的原生渲染&#xff0c;性能接近原生應用 支持熱重載&#xff0c;開發效率高 可訪問所有原生平臺 API 大型應用案例豐富(如 Faceboo…

Dijkstra和多層圖 0

眾所周知&#xff0c;Dijkstra經常拿來解決不帶負權和環的單元最短路。我們先來看一下他的實現過程 (由于樸素版用的不多&#xff0c;我們直接上堆優化) 模板 #include<bits/stdc.h> #define mf(x,y) make_pair(x,y)//x距離&#xff0c;y節點 using namespace std; …