【GPT入門】第48課 LlamaFacotory 合并原模型與LoRA模型

【GPT入門】第48課 LlamaFacotory 合并原模型與LoRA模型

  • 1.合并原模型與LoRA訓練的增量模型
  • 2. 測試模型

1.合并原模型與LoRA訓練的增量模型

  • llamafactory-cli webui 執行合并

在這里插入圖片描述

  • 合并后模型大小
(base) root@autodl-container-b4b04ea4f2-b5ee47d1:~# du -sh  /root/autodl-tmp/models/*
15G     /root/autodl-tmp/models/Llama3-8B-Chinese-Chat1
15G     /root/autodl-tmp/models/Llama3-8B-Chinese-Chat1-merged
15G     /root/autodl-tmp/models/Llama3-8B-Chinese-Chat1-merged-ui
  • 模型文件詳情
(base) root@autodl-container-b4b04ea4f2-b5ee47d1:~# du -sh  /root/autodl-tmp/models/Llama3-8B-Chinese-Chat1-merged-ui/*
4.0K    /root/autodl-tmp/models/Llama3-8B-Chinese-Chat1-merged-ui/Modelfile
4.0K    /root/autodl-tmp/models/Llama3-8B-Chinese-Chat1-merged-ui/chat_template.jinja
4.0K    /root/autodl-tmp/models/Llama3-8B-Chinese-Chat1-merged-ui/config.json
4.0K    /root/autodl-tmp/models/Llama3-8B-Chinese-Chat1-merged-ui/generation_config.json
4.7G    /root/autodl-tmp/models/Llama3-8B-Chinese-Chat1-merged-ui/model-00001-of-00004.safetensors
4.7G    /root/autodl-tmp/models/Llama3-8B-Chinese-Chat1-merged-ui/model-00002-of-00004.safetensors
4.6G    /root/autodl-tmp/models/Llama3-8B-Chinese-Chat1-merged-ui/model-00003-of-00004.safetensors
1.1G    /root/autodl-tmp/models/Llama3-8B-Chinese-Chat1-merged-ui/model-00004-of-00004.safetensors
24K     /root/autodl-tmp/models/Llama3-8B-Chinese-Chat1-merged-ui/model.safetensors.index.json
4.0K    /root/autodl-tmp/models/Llama3-8B-Chinese-Chat1-merged-ui/special_tokens_map.json
17M     /root/autodl-tmp/models/Llama3-8B-Chinese-Chat1-merged-ui/tokenizer.json
52K     /root/autodl-tmp/models/Llama3-8B-Chinese-Chat1-merged-ui/tokenizer_config.json

2. 測試模型

在這里插入圖片描述
在這里插入圖片描述

本文來自互聯網用戶投稿,該文觀點僅代表作者本人,不代表本站立場。本站僅提供信息存儲空間服務,不擁有所有權,不承擔相關法律責任。
如若轉載,請注明出處:http://www.pswp.cn/news/919540.shtml
繁體地址,請注明出處:http://hk.pswp.cn/news/919540.shtml
英文地址,請注明出處:http://en.pswp.cn/news/919540.shtml

如若內容造成侵權/違法違規/事實不符,請聯系多彩編程網進行投訴反饋email:809451989@qq.com,一經查實,立即刪除!

相關文章

Python爬蟲實戰:研究tumblr,構建博客平臺數據采集分析系統

1. 引言 1.1 研究背景 在信息爆炸的時代,社交媒體平臺已成為人們獲取信息、表達觀點和進行社交互動的主要渠道。這些平臺上積累的海量數據包含了用戶偏好、社會趨勢、文化現象等豐富信息,對學術研究、市場分析、產品開發等領域具有重要價值。 Tumblr 作為一個綜合性的輕博客…

集成算法學習總結

一、集成學習基礎認知 核心思想:集成學習(ensemble learning)通過構建并結合多個個體學習器來完成學習任務,類似于 “多個專家共同決策”,通常比單個學習器的性能更優。其核心邏輯是利用多個學習器的優勢互補&#xff…

線程安全的產生以及解決方案

線程安全原子性(Atomicity)、可見性(Visibility)、有序性(Ordering) 是保證線程安全的三大核心要素 —— 線程安全問題的本質,幾乎都是這三個特性中的一個或多個被破壞導致的。操作不會被 “中途…

Spring Cloud Netflix學習筆記01

文章目錄前言一、微服務概述什么是微服務?微服務與微服務架構微服務優缺點優點缺點微服務技術棧有那些?二.SpringCloud入門概述SpringCloud是什么?SpringCloud和SpringBoot的關系Dubbo 和 SpringCloud技術選型總結SpringCloud能干嘛&#xff…

專題:2025母嬰行業消費洞察與分齡營養趨勢報告|附40 +份報告PDF、交互圖表數據匯總下載

原文鏈接:https://tecdat.cn/?p43654 當95后媽媽拿著計算器對比DHA純度,當爸爸們為“防紅屁屁紙尿褲”貨比三家,母嬰行業的風向早就變了。從“一把奶粉喂到3歲”到“按月齡定制營養包”,從“進口就好”到“看專利數據下單”&…

redhat6/centos6 配置yum源

由于RHEL6/centos6系統官方早就停止通知維護了,公司的開發服務器有比較老,發現竟然scp都沒有裝。。。今天配置個本地yum源,安裝一下常規軟件和開發環境比較簡單,直接上代碼1.上傳一個centos6的iso文件CentOS-6.5-x86_64-bin-DVD1.…

day31 SQLITE

數據庫相關函數數據庫創建int sqlite3_open( const char *filename, sqlite3 **ppDb);功能:打開數據庫,不存在則創建參數:const char *filename 數據庫名sqlite3 **ppDb 二級指針,傳出ppDb數據庫的一級指…

嵌入式-SPI番外之按鈕驅動程序的編寫-Day15

目錄 一、按鈕簡單操作回憶 二、按鈕新操作實現 (1)按鈕的點擊實現燈亮/滅 ①連接電路 ②初始化板載LED和按鈕 ③按鈕程序的基本原理(核心仍為0亮/1滅) ④按鈕消抖的原理 三、按鈕封裝的操作-點擊,雙擊&#xf…

星域智鏈科技:用科技點亮生活,以 AI 拓展無限可能

星域智鏈科技(東莞市)有限公司簡介 星域智鏈科技(東莞市)有限公司,理念是 讓科技便利生活、豐富生活,專注于科技、AI領域。 全場景 GPS 定位器 —— 精準追蹤,守護安全,適用于車輛…

國內代理IP在SEO行業中的應用

隨著互聯網的快速發展,SEO(搜索引擎優化)已經成為了數字營銷的重要組成部分。無論是企業還是個人站長,都希望通過SEO提升自己網站的排名和流量。然而,隨著競爭的激烈,傳統的SEO優化手段已經逐漸顯現出局限性…

Linux + arm 內存屏障

ARM 硬件層的屏障指令DMB (Data Memory Barrier):保證在它之前的內存訪問(符合給定域/類型)在它之后的內存訪問之前對可見性排序。常用域:ish(Inner Shareable),sy(system-wide&…

網絡安全中的遠程控制活動檢測與防御策略

本文還有配套的精品資源,點擊獲取 簡介:遠程控制技術在IT領域中用于網絡連接和設備操作,但同樣被黑客利用進行非法入侵。端口占用情況是識別遠程控制活動的關鍵因素,使用工具如"cports"可以監控這些端口。系統中未知…

UIGestureRecognizer 各個子類以及其作用

在 iOS 里,UIGestureRecognizer 是一個抽象基類,專門用來處理手勢事件。它本身不能直接用,必須用它的 子類。這些子類分別對應常見的手勢識別器。常見的 UIGestureRecognizer 子類及作用1. UITapGestureRecognizer作用:點擊手勢&a…

計算機網絡 HTTPS 全流程

HTTPS 通信的全流程(特別是 TLS 握手階段)中使用的三個隨機數是保障安全性的核心設計,不能隨意減少。每個隨機數都承擔著至關重要的安全職責。下面詳細解釋 HTTPS 全流程,并重點分析這三個隨機數的作用和必要性:&#…

DL00271-基于YOLOv11的激光雷達LiDAR船舶目標檢測含完整數據集

【CSDN推薦】基于YOLOv11的激光雷達(LiDAR)船舶目標檢測——含完整數據集!🚢 科研人員必看! 高校老師、學生和研究者們,前沿技術來了!本論文利用YOLOv11模型,結合激光雷達&#xff0…

SQL-leetcode—3374. 首字母大寫 II

3374. 首字母大寫 II 表:user_content -------------------- | Column Name | Type | -------------------- | content_id | int | | content_text| varchar | -------------------- content_id 是這張表的唯一主鍵。 每一行包含一個不同的 ID 以及對應的文…

告別籠統的 200 OK:一份給 API 設計者的 HTTP 狀態碼終極指南

文章目錄寫在前面問題描述核心結論與建議簡要描述詳細闡述1xx - 信息性響應 (Informational)2xx - 成功 (Successful)3xx - 重定向 (Redirection)4xx - 客戶端錯誤 (Client Error)5xx - 服務器錯誤 (Server Error)HTTP 狀態碼速查表參考以及更多更詳細的狀態碼查詢寫在前面 你…

從防抖節流到鏈表樹:編程世界中的抽象優化藝術

從防抖節流到鏈表樹:編程世界中的抽象優化藝術 在編程的知識體系中,有些概念看似毫不相關,卻在底層邏輯上有著驚人的相似之處。防抖與節流、鏈表與樹,這兩組分屬不同領域的概念,正是這種思維共性的典型代表。它們不僅展…

第三階段數據-3:數據庫腳本生成,備份與還原,分離與附加

1_生成數據庫腳本(1)在數據庫上右鍵選擇任務(2)選擇生成腳本(3)選擇下一步,如果下次不想顯示此頁面,可勾選不再顯示此頁(4)如果導出全部數據,選擇…

React框架超詳細入門到實戰項目演練【前端】【React】

React框架 1.前端展示解釋 當客戶端訪問服務器時,會從服務器中下載很多靜態文件到本地,比如css、js等前端渲染文件 下載完成之后瀏覽器會將這些文件組合形成前端頁面渲染出來。 2.React概述 React是一個專注于構建用戶界面的JavaScript庫,…