Qwen2.5-VL實現本地GPTQ量化

Qwen2.5-VL實現本地GPTQ量化

pingmian/2025/9/8 5:41:50/文章來源:https://blog.csdn.net/qq_44908396/article/details/151190549

本文不生產技術，只做技術的搬運工！！

前言

公開的Qwen2.5-VL模型雖然功能非常強大，但有時面對專業垂直領域的問題往往會出現一些莫名其妙的回復，這時候大家一版選擇對模型進行微調，而微調后的模型如果直接部署則顯存開銷過大，這時就需要執行量化，下面將介紹執行本地GPTQ量化的具體流程。

ms-swift

由于作者沒有找到AutoGPTQ框架下進行Qwen2.5-VL的量化教程，所以干脆偷懶，使用ms-swift進行量化

這里安裝完成后還需要補充一下安裝

pip install qwen_vl_utils
pip install torch==2.6.0 torchvision==0.21.0 torchaudio==2.6.0

執行量化

CUDA_VISIBLE_DEVICES=0,1,2,3 \
swift export \--model /data/qwen2.5-vl-32b/ \--dataset 'AI-ModelScope/alpaca-gpt4-data-zh#500' \

本文來自互聯網用戶投稿，該文觀點僅代表作者本人，不代表本站立場。本站僅提供信息存儲空間服務，不擁有所有權，不承擔相關法律責任。
如若轉載，請注明出處：http://www.pswp.cn/pingmian/95739.shtml
繁體地址，請注明出處：http://hk.pswp.cn/pingmian/95739.shtml
英文地址，請注明出處：http://en.pswp.cn/pingmian/95739.shtml

如若內容造成侵權/違法違規/事實不符，請聯系多彩編程網進行投訴反饋email:809451989@qq.com，一經查實，立即刪除！

相關文章

【Redis】常用數據結構之Hash篇：從常用命令到使用場景詳解

【Redis】常用數據結構之Hash篇：從常用命令到使用場景詳解

目錄 1.前言插播一條消息~ 2.正文 2.1Hash與String對比 2.2常用命令 2.2.1HSET 2.2.2HGET 2.2.3HEXISTS 2.2.4HDEL 2.2.5HKEYS 2.2.6HVALS 2.2.7HGETALL 2.2.8HMGET 2.2.9HLEN 2.2.10HSETNX 2.2.11HINCRBY 2.2.12HINCRBYFLOAT 2.3內部編碼 2.3.1. ziplist&…

閱讀更多...

OSPF基礎部分知識點

OSPF基礎部分知識點

OSPF基礎前言路由器根據路由表轉發數據包，路由表項可通過手動配置和動態路由協議生成。（兩種生成方式）靜態路由比動態路由使用更少的帶寬，并且不占用CPU資源來計算和分析路由更新。當網絡結構比較簡單時，只需配…

閱讀更多...

Flutter 真 3D 游戲引擎來了，flame_3d 了解一下

Flutter 真 3D 游戲引擎來了，flame_3d 了解一下

在剛剛結束的 FlutterNFriends 大會上，Flame 展示了它們關于 3D 游戲的支持：flame_3d ，Flame 是一個以組件系統（Flame Component System, FCS）、游戲循環、碰撞檢測和輸入處理為核心的 Flutter 游戲框架，而…

閱讀更多...

無需公網IP，電腦隨時與異地飛牛同步互聯保持數據一致性

無需公網IP，電腦隨時與異地飛牛同步互聯保持數據一致性

最近小白有這樣一個煩惱：隨身帶著的電腦每天都在更新內容，于是就會有很多很多的存稿。電腦的空間開始變得不夠用了。各式各樣的圖片、視頻、文稿等內容，如果要整理到飛牛NAS上，好像很麻煩，而且每次都是需要回到家里才能…

閱讀更多...

數據庫中間件ShardingSphere v5.2.1

數據庫中間件ShardingSphere v5.2.1

數據庫中間件ShardingSphere v5.2.1 文章目錄數據庫中間件ShardingSphere v5.2.1一概述1 數據庫的瓶頸2 優化的手段3 主從復制4 讀寫分離5 分庫分表5.1 背景5.2 垂直分片5.3 水平分片6 ShardingSphere簡介二 ShardingSphere-JDBC講解1 讀寫分離實現1.1 基于Docker搭建MySQL主從…

閱讀更多...

[Upscayl圖像增強] Electron主進程命令 | 進程間通信IPC

[Upscayl圖像增強] Electron主進程命令 | 進程間通信IPC

第三章：Electron主進程命令歡迎回來🐻??? 在第一章：渲染器用戶界面（前端）中，我們探索了您與之交互的按鈕和菜單。然后在第二章：AI模型中，我們了解了讓您的圖像看起來更棒的&qu…

閱讀更多...

電競護航小程序成品搭建三角洲行動護航小程序開發俱樂部點單小程序成品游戲派單小程序定制

電競護航小程序成品搭建三角洲行動護航小程序開發俱樂部點單小程序成品游戲派單小程序定制

功能列表：商家入駐成為管事平臺公告客服密鑰客服管理發單模板快捷發單自定義發單打手入駐訂單裁決即時通訊 （接單者員與發單者） 打手排行邀請排行余額提現技術棧：前端uniapp 后端java

閱讀更多...

Redis數據庫基礎

Redis數據庫基礎

1.關系型數據庫和NoSQL數據庫數據庫主要分為兩大類:關系型數據庫與NoSQL數據庫關系型數據庫，是建立在關系模型基礎是的數據庫，其借助集合代數等數學概念和方法來處理數據庫中的數據主流的MySQL，Oracle，MS SQL Server 和DB2都屬于這…

閱讀更多...

【Java實戰?】Java日志框架實戰：Logback與Log4j2的深度探索

【Java實戰?】Java日志框架實戰：Logback與Log4j2的深度探索

目錄一、日志框架概述1.1 日志的作用1.2 常見日志框架1.3 日志級別二、Logback 框架實戰2.1 Logback 依賴導入2.2 Logback 配置文件2.3 日志輸出格式自定義2.4 Logback 進階配置三、Log4j2 框架實戰3.1 Log4j2 依賴導入3.2 Log4j2 配置文件3.3 Log4j2 與 SLF4J 整合3.4 日志框架…

閱讀更多...

基于WFOA與BP神經網絡回歸模型的特征選擇方法研究(Python實現)

基于WFOA與BP神經網絡回歸模型的特征選擇方法研究(Python實現)

說明：這是一個機器學習實戰項目（附帶數據代碼文檔），如需數據代碼文檔可以直接到文章最后關注獲取或者私信獲取。 1.項目背景在大數據分析與智能建模領域，高維數據廣泛存在于金融預測、環境監測和工業過程控制等場景…

閱讀更多...

??AI生成PPT工具推薦，從此以后再也不用擔心不會做PPT了??

??AI生成PPT工具推薦，從此以后再也不用擔心不會做PPT了??

對于很多人老說，做ppt實在太麻煩了，快速制作出專業且美觀的PPT成為眾多人的需求，AI生成PPT工具應運而生，極大地提升了PPT制作的效率。以下為大家推薦多個實用的AI生成PPT工具。 1、AiPPT星級評分：★★★★★ AiPPT是一…

閱讀更多...

CentOS系統停服，系統遷移Ubuntu LTS

CentOS系統停服，系統遷移Ubuntu LTS

CentOS官方已全面停止維護CentOS Linux項目，公告指出 CentOS 7在2024年6月30日停止技術服務支持，(在此之前 2022年1月1日起CentOS官方已經不再對CentOS 8提供服務支持），詳情見CentOS官方公告。一、系統遷移評估用戶需要開始計…

閱讀更多...

Linux知識回顧總結----文件系統

Linux知識回顧總結----文件系統

上章講的是 os 如果管理被打開的文件，那么沒有被打開的文件（也就是在磁盤單中的文件）使用文件系統進行管理。了解完這一章，我們就可以理解我們如果想要打開一個文件的是如何找到整個文件，然后如何把它加載到內存中的&a…

閱讀更多...

iOS藍牙使用及深入剖析高頻高負載傳輸丟包解決方案（附源碼）

iOS藍牙使用及深入剖析高頻高負載傳輸丟包解決方案（附源碼）

最近開發了一套iOS原生的藍牙SDK，總結了一些有價值的踩過的坑，分享出來給有需要的同學做個參考。一、藍牙的使用 iOS有一套封裝好的完善的藍牙API ，可以很便捷的實現與藍牙的連接和通信，藍牙通信的大體流程如下，先對基…

閱讀更多...

Python 正則表達式實戰：用 Match 對象輕松解析拼接數據流

Python 正則表達式實戰：用 Match 對象輕松解析拼接數據流

摘要這篇文章圍繞 Python 的正則表達式 Match 對象（特別是 endpos、lastindex、lastgroup 以及 group / groups 等方法/屬性）做一個從淺入深、貼近日常開發場景的講解。我們會給出一個真實又常見的使用場景：解析由設備/服務發來的“拼接式”…

閱讀更多...

基于Pygame的六邊形戰術推演系統深度剖析——從數據結構到3D渲染的完整實現（附完整代碼）

基于Pygame的六邊形戰術推演系統深度剖析——從數據結構到3D渲染的完整實現（附完整代碼）

1. 項目概述與技術選型戰術推演系統是軍事訓練和游戲開發中的重要組成部分，它能夠模擬真實的戰術場景，為用戶提供策略思考的平臺。本文將深入分析一套基于Python Pygame框架開發的城市巷戰戰術推演系統，該系統采用六邊形網格布局，實現了恐怖分子與反恐精英的對抗模擬，具…

閱讀更多...

支持二次開發的代練App源碼：訂單管理、代練監控、安全護航功能齊全，一站式解決代練護航平臺源碼（PHP+ Uni-app）

支持二次開發的代練App源碼：訂單管理、代練監控、安全護航功能齊全，一站式解決代練護航平臺源碼（PHP+ Uni-app）

一、技術架構：高性能與跨平臺的核心支撐前端框架Uni-app：基于Vue.js的跨平臺框架，支持編譯至微信小程序、H5、iOS/Android App及PC端，代碼復用率超80%，顯著降低開發成本。實時通信：集成WebSocket實現訂單狀…

閱讀更多...

AI熱點周報（8.31~9.6）： Qwen3?Max?Preview上線、GLM-4.5提供一鍵遷移、Gemini for Home，AI風向何在？

AI熱點周報（8.31~9.6）： Qwen3?Max?Preview上線、GLM-4.5提供一鍵遷移、Gemini for Home，AI風向何在？

名人說：博觀而約取，厚積而薄發。——蘇軾《稼說送張琥》創作者：Code_流蘇(CSDN)（一個喜歡古詩詞和編程的Coder😊） 目錄一、3分鐘速覽版：一張表看懂本周AI大事二、國內：模型與生態的…

閱讀更多...

異步操作終止2

異步操作終止2

您提的這個問題非常棒，說明您思考得非常深入！您完全正確，我之前的示例中使用的 return; 會中斷 handleDraw 函數中所有后續的邏輯，這在很多場景下并不是我們想要的。我們的目標是只中斷畫圖這一個特定的邏輯，而讓函數…

閱讀更多...

《AI大模型應知應會100篇》第67篇 Web應用與大模型集成開發實踐——1小時打造國產大模型智能客服系統

《AI大模型應知應會100篇》第67篇 Web應用與大模型集成開發實踐——1小時打造國產大模型智能客服系統

第67篇：Web應用與大模型集成開發實踐——1小時打造國產大模型智能客服系統一句話核心價值：無需翻墻！用Flask國產大模型API（通義/文心一言/訊飛）快速構建合規Web問答系統，電商客服人力成本直降70%&#xff…

閱讀更多...

最新文章