linux上使用unsloth微調大模型的環境踩坑之路-4070ti、4090

我們實驗室有2套環境
一套:4070ti。安裝了cuda12.4
一套:3張4090.安裝了cuda12.4
現在開始給第一套裝能運行unsloth能運行的環境
第一步:開始創建虛擬環境
conda create -n test_env python=3.11
第二步:進入虛擬環境
conda activate test_env
第三步:直接開始下載unsloth
根據官方說的,這樣很多依賴比如torch、transformers直接能用到最新的依賴
pip install unsloth

好了,第一套裝好了
在這里插入圖片描述
開始裝4090的,也是cuda12.4
跟第一個相同操作,唯一不同虛擬環境名字改一下,我這里不規范,大家規范一下
第一步:開始創建虛擬環境
conda create -n unsloth-myenvs python=3.11
第二步:進入虛擬環境
conda activate unsloth-myenvs
第三步:直接開始下載unsloth
根據官方說的,這樣很多依賴比如torch、transformers直接能用到最新的依賴
pip install unsloth
同樣進行運行微調程序
在這里插入圖片描述
搞笑的來了,他喵Transformers版本高了,對4090支持不好,會報錯

ValueError: Pointer argument (at 2) cannot be accessed from Triton (cpu tensor?)
0%|          | 0/200 [00:01<?, ?it/s]

降下版本,先看看Transformers有哪些版本
在這里插入圖片描述
先看看4.48.3可以否
直接一手pip install transformers==4.48.3
不行,同樣的錯誤,我就感覺很納悶,我看unsloth和這個transformers版本關系看到有個關聯
unsloth-zoo 2025.3.8 requires transformers!=4.47.0,>=4.46.1
那直接試了試pip install transformers= =4.46.3
到現在我終于明白,unsloth為了增加grop的功能、以及加速功能,很多驅動版本都對應不上

總結總結
能不裝cuda12.4就別裝,最好12.1很多驅動沒跟上
能先用穩定版就用穩定版,最新bug太多
不單單和transformers有關,還和Triton這個新加的并行加速也有關
祝用unsloth的兄弟們好運

本文來自互聯網用戶投稿,該文觀點僅代表作者本人,不代表本站立場。本站僅提供信息存儲空間服務,不擁有所有權,不承擔相關法律責任。
如若轉載,請注明出處:http://www.pswp.cn/bicheng/73296.shtml
繁體地址,請注明出處:http://hk.pswp.cn/bicheng/73296.shtml
英文地址,請注明出處:http://en.pswp.cn/bicheng/73296.shtml

如若內容造成侵權/違法違規/事實不符,請聯系多彩編程網進行投訴反饋email:809451989@qq.com,一經查實,立即刪除!

相關文章

網絡安全演練有哪些形式

OPENVAS使用 1、確定指定IP是否能ping通 2、創建掃描目標 3、創建掃描任務&#xff08;scan management →newtask&#xff09; 4、開始任務start 5、查看掃描細節 6、查看掃描結果&#xff0c;包含漏洞詳細信息&#xff0c;亦可到處PDF文件 7、導出掃描結果報告 8、為…

ConcurrentModificationException:檢測到并發修改完美解決方法

&#x1f6a6; ConcurrentModificationException&#xff1a;檢測到并發修改完美解決方法 &#x1f4a1; 摘要 1. 什么是ConcurrentModificationException&#xff1f;&#x1f914; 2. ConcurrentModificationException的常見場景 &#x1f6a6; 2.1 使用for-each循環遍歷集合…

電路原理(電容 集成電路NE555)

電容 1.特性&#xff1a;充放電&#xff0c;隔直流&#xff0c;通交流 2.電容是通過聚集正負電荷來存儲電能的 3.電容充放電過程可等效為導通回路 4.多電容并聯可以把容量疊加&#xff0c;但是多電容串聯就不會&#xff0c;只會疊加電容的耐壓值。 6.電容充放電時相當于通路&a…

深入解析 React 最新特性:革新、應用與最佳實踐

深入解析 React 最新特性&#xff1a;革新、應用與最佳實踐 1. 引言 React 作為前端開發的核心技術之一&#xff0c;近年來不斷推出 新的 API 和優化機制&#xff0c;從 Concurrent Rendering&#xff08;并發模式&#xff09; 到 Server Components&#xff08;服務器組件&a…

【氮化鎵】高輸入功率應力誘導的GaN 在下的退化LNA退化

2019年,中國工程物理研究院電子工程研究所的Tong等人基于實驗與第一性原理計算方法,研究了Ka波段GaN低噪聲放大器(LNA)在高輸入功率應力下的退化機制。實驗結果表明,在27 GHz下施加1 W連續波(CW)輸入功率應力后,LNA的增益下降約1 dB,噪聲系數(NF)增加約0.7 dB。進一…

C#程序員接口調用工具與方法

作為專注于接口調用的C#軟件工程師&#xff0c;以下工具和方法能顯著提升開發效率與代碼質量&#xff1a; 一、接口開發與測試自動化工具 1. API測試與Mock工具 Postman Newman 支持RESTful/GraphQL接口調試與自動化測試&#xff0c;通過集合&#xff08;Collection&#xf…

Spring Boot項目中集成sa-token實現認證授權和OAuth 2.0第三方登錄

OAuth 2.0第三方登錄 OAuth 2.0 是一種授權協議&#xff0c;允許第三方應用在不暴露用戶密碼的情況下訪問用戶的資源。它通常用于第三方登錄場景&#xff0c;例如使用GitHub、Google等社交平臺進行登錄。 在sa-token框架中&#xff0c;OAuth 2.0第三方登錄可以通過集成sa-tok…

數字化新零售與 AI 大模型,如何重塑大健康賽道??

在數字化浪潮中&#xff0c;大健康賽道正經歷深刻變革。數字化新零售營銷模式的興起&#xff0c;與 AI 大模型的強大能力相結合&#xff0c;為大健康領域帶來了全新的發展機遇。 數字化新零售營銷模式融合線上線下&#xff0c;運用大數據、云計算分析消費者行為&#xff0c;實…

高速PCB設計(布線設計)

以下是針對高速PCB布線設計的綜合筆記&#xff0c;結合用戶提供的設計規范及行業通用原則整理而成&#xff1a; 一、關鍵信號布線原則 布線優先級 順序&#xff1a;射頻信號&#xff1e;中/低頻信號&#xff1e;時鐘信號&#xff1e;高速信號射頻信號需包地處理&#xff0c;線…

宇樹ROS1開源模型在ROS2中Gazebo中仿真

以GO1為例 1. CMakelists.txt更新語法 cmake_minimum_required(VERSION 3.8) project(go1_description) if(CMAKE_COMPILER_IS_GNUCXX OR CMAKE_CXX_COMPILER_ID MATCHES "Clang")add_compile_options(-Wall -Wextra -Wpedantic) endif() # find dependencies find…

嵌入式學習第二十四天--網絡 服務器

服務器模型 tcp服務器: socket bind listen accept recv/send close 1.支持多客戶端訪問 //單循環服務器 socket bind listen while(1) { accept while(1) { recv/send } } close 2.支持多客戶端同時訪問 (并發能力) 并發服務器 socket bind …

使用GPTQ量化Llama-3-8B大模型

使用GPTQ量化8B生成式語言模型 服務器配置&#xff1a;4*3090 描述&#xff1a;使用四張3090&#xff0c;分別進行單卡量化&#xff0c;多卡量化。并使用SGLang部署量化后的模型&#xff0c;使用GPTQ量化 原來的模型精度為FP16&#xff0c;量化為4bit 首先下載gptqmodel量化…

防汛應急包,快速響應,守護安全

根據中國水利部統計&#xff0c;自1949年以來&#xff0c;我國幾乎每年都面臨洪水威脅&#xff0c;其中20世紀90年代后洪澇災害頻率顯著增加&#xff0c;僅1990-2009年間就發生超4000起較大災害&#xff0c;直接經濟損失近3萬億元&#xff0c;受災人口達20億人次。在2020年長江…

從 Vue 到 React:理解作用與副作用

作用 VS 副作用 響應式作用&#xff1a; 響應式作用是 Vue 響應式系統的一部分&#xff0c;它指的是跟蹤函數的依賴關系&#xff0c;并在它們的值發生變化時重新運行該函數的過程。watchEffect 是最直接的創建作用的方式&#xff08;如 watch 和 computed&#xff09;。 副作…

a = b c 的含義

簡單一句話&#xff1a; result condition && value; condition 為真取 value的值&#xff0c;condition為假就取condition的值&#xff0c;真取后假取前 // 示例 1: b 為真值 let b 1; let c 2; let a b && c; console.log(a); // 輸出: 2// 示例 2: b 為…

【大模型系列】llama.cpp本地運行大模型

上一篇鏈接: 【大模型系列】使用ollama本地運行千問2.5模型 我們講了ollama本地運行大模型&#xff0c;這里我們介紹另一種本地運行大模型的方法&#xff1a;llamacpp 軟件下載 下載地址&#xff1a;https://github.com/ggml-org/llama.cpp/releases 下載cpu版本的llamacpp&a…

PyQt基礎——簡單的圖形化界面(窗口)

一、代碼展示 import sysfrom PyQt6.QtGui import QPixmap from PyQt6.QtWidgets import QWidget, QApplication, QLabel, QLineEdit, QPushButton from PyQt6 import uic from PyQt6.QtCore import Qt# 封裝一個我的窗口類 class MyWidget(QWidget):def __init__(self):supe…

泰山派開發之—Ubuntu24.04下Linux開發環境搭建

簡介 最近翻到了吃灰已久的泰山派&#xff0c;是剛出來的時候用優惠券買的&#xff0c;當時價格挺便宜的&#xff0c;最近給它翻出來了&#xff0c;打算試試做個項目。買的泰山派容量是2G16G&#xff0c;SOC芯片使用的是RK3566&#xff0c;搭載1TOP算力的NPU&#xff0c;并且具…

HTTP 協議中常見的錯誤狀態碼(詳細介紹)

以下是 HTTP 協議中常見的錯誤狀態碼及其原因的總結&#xff0c;按錯誤類型分類整理&#xff1a; 4xx 客戶端錯誤 400 Bad Request 原因&#xff1a;請求格式錯誤&#xff0c;服務器無法解析。常見場景&#xff1a; 請求頭或請求體語法錯誤&#xff08;如 JSON/XML 格式錯誤…

kkFileView文件預覽組件部署說明

kkFileView組件部署流程指南 在數字化辦公與文件管理場景中&#xff0c;在線文件預覽功能極為關鍵。kkFileView作為一款優秀的開源在線文件預覽組件&#xff0c;支持多種格式文件的預覽&#xff0c;為企業和開發者提供了便捷的解決方案。下面將詳細介紹其部署步驟。 一、前期準…