如何在本地部署魔搭上千問Qwen2.5-VL-32B-Instruct-AWQ模型在顯卡1上面運行推理，并開啟api服務

如何在本地部署魔搭上千問Qwen2.5-VL-32B-Instruct-AWQ模型在顯卡1上面運行推理，并開啟api服務

pingmian/2025/8/24 1:28:48/文章來源:https://blog.csdn.net/weixin_42672685/article/details/146903654

環境：

云服務器Ubuntu

NVIDIA H20 96GB

Qwen2.5-VL-32B

Qwen2.5-VL-72B

問題描述：

如何在本地部署魔搭上千問Qwen2.5-VL-32B-Instruct-AWQ模型在顯卡1上面運行推理，并開啟api服務

在這里插入圖片描述

解決方案：

1.環境準備

硬件要求

顯卡1（顯存需≥48GB，推薦≥64GB）
CUDA 11.7或更高版本
Python 3.8+

2.軟件依賴

設置清華conda鏡像

conda config --add channels https://mirrors.tuna.tsinghua.edu.cn/anaconda/pkgs/main/
conda config --add channels https://mirrors.tuna.tsinghua.edu.cn/anaconda/pkgs/free/
conda config --add channels https

本文來自互聯網用戶投稿，該文觀點僅代表作者本人，不代表本站立場。本站僅提供信息存儲空間服務，不擁有所有權，不承擔相關法律責任。
如若轉載，請注明出處：http://www.pswp.cn/pingmian/75482.shtml
繁體地址，請注明出處：http://hk.pswp.cn/pingmian/75482.shtml
英文地址，請注明出處：http://en.pswp.cn/pingmian/75482.shtml

如若內容造成侵權/違法違規/事實不符，請聯系多彩編程網進行投訴反饋email:809451989@qq.com，一經查實，立即刪除！

相關文章

基于方法分類的無監督圖像去霧論文

基于方法分類的無監督圖像去霧論文

在之前的博客中，我從研究動機的角度對無監督圖像去霧論文進行了分類，而現在我打算根據論文中提出的方法進行新的分類。 1. 基于對比學習的方法 2022年論文《UCL-Dehaze: Towards Real-world Image Dehazing via Unsupervised Contrastive Learning》&a…

閱讀更多...

4月3號.

4月3號.

JDK7前時間相關類: 時間的相關知識: Data時間類: //1.創建對象表示一個時間 Date d1 new Date(); //System.out.println(d1);//2.創建對象表示一個指定的時間 Date d2 new Date(0L); System.out.println(d2);//3.setTime修改時間 //1000毫秒1秒 d2.setTime(1000L); System.o…

閱讀更多...

數據結構與算法：子數組最大累加和問題及擴展

數據結構與算法：子數組最大累加和問題及擴展

前言子數組最大累加和問題看似簡單，但能延伸出的題目非常多，千題千面，而且會和其他算法結合出現。一、最大子數組和 class Solution { public:int maxSubArray(vector<int>& nums) {int n=nums.size();vector<int>dp(n);//i位置往左能延伸出的最大累加…

閱讀更多...

MIT6.828 Lab3-2 Print a page table (easy)

MIT6.828 Lab3-2 Print a page table (easy)

實驗內容實現一個函數來打印頁表的內容，幫助我們更好地理解 xv6 的三級頁表結構。修改內容 kernel/defs.h中添加函數聲明，方便其它函數調用 void vmprint(pagetable_t);// lab3-2 Print a page tablekernel/vm.c中添加函數具體定義采用…

閱讀更多...

2025高頻面試設計模型總結篇

2025高頻面試設計模型總結篇

文章目錄設計模型概念單例模式工廠模式策略模式責任鏈模式設計模型概念設計模式是前人總結的軟件設計經驗和解決問題的最佳方案，它們為我們提供了一套可復用、易維護、可擴展的設計思路。 （1）定義： 設計模式是一套經過驗證的…

閱讀更多...

Java基礎：面向對象進階（二）

Java基礎：面向對象進階（二）

01-static static修飾成員方法 static注意事項（3種） static應用知識：代碼塊 static應用知識：單列模式 02-面向對象三大特征之二：繼承什么是繼承？ 使用繼承有啥好處? 權限修飾符單繼承、Object類方法重…

閱讀更多...

Spring框架如何做EhCache緩存？

Spring框架如何做EhCache緩存？

在Spring框架中，緩存是一種常見的優化手段，用于減少對數據庫或其他資源的訪問次數，從而提高應用性能。Spring提供了強大的緩存抽象，支持多種緩存實現（如EhCache、Redis、Caffeine等），并可以通過…

閱讀更多...

NVIDIA顯卡

NVIDIA顯卡

NVIDIA顯卡作為全球GPU技術的標桿，其產品線覆蓋消費級、專業級、數據中心、移動計算等多個領域，技術迭代貫穿架構創新、AI加速、光線追蹤等核心方向。以下從技術演進、產品矩陣、核心技術、生態布局四個維度展開深度解析： 一、技術演進&…

閱讀更多...

【BUG】生產環境死鎖問題定位排查解決全過程

【BUG】生產環境死鎖問題定位排查解決全過程

目錄生產環境死鎖問題定位排查解決過程0. 表面現象1. 問題分析（1）數據庫連接池資源耗盡（2）數據庫鎖競爭(3) 代碼實現問題 2. 分析解決(0) 分析過程（1）優化數據庫連接池配置（2）優化數…

閱讀更多...

【計算機網絡應用層】

【計算機網絡應用層】

文章目錄計算機網絡應用層詳解一、前言二、應用層的功能三、常見的應用層協議1. HTTP/HTTPS（超文本傳輸協議）2. DNS（域名系統）3. FTP（文件傳輸協議）4. SMTP/POP3/IMAP（電子郵件協議&#xff09…

閱讀更多...

Linux 虛擬化方案

Linux 虛擬化方案

一、Linux 虛擬化技術分類 1. 全虛擬化 (Full Virtualization) 特點：Guest OS 無需修改，完全模擬硬件代表技術： KVM (Kernel-based Virtual Machine)：主流方案，集成到 Linux 內核 QEMU：硬件模擬器&…

閱讀更多...

樹莓派 5 換清華源

樹莓派 5 換清華源

首先備份原設置 cp /etc/apt/sources.list ~/sources.list.bak cp /etc/apt/sources.list.d/raspi.list ~/raspi.list.bak修改配置 /etc/apt/sources.list 文件替換內容如下（原內容刪除） deb https://mirrors.tuna.tsinghua.edu.cn/debian/ bookworm …

閱讀更多...

WGAN原理及實現（pytorch版）

WGAN原理及實現（pytorch版）

WGAN原理及實現一、WGAN原理1.1 原始GAN的缺陷1.2 Wasserstein距離的引入1.3 Kantorovich-Rubinstein對偶1.4 WGAN的優化目標1.4 數學推導步驟1.5 權重裁剪 vs 梯度懲罰1.6 優勢1.7 總結二、WGAN實現2.1 導包2.2 數據加載和處理2.3 構建生成器2.4 構建判別器2.5 訓練和保存模…

閱讀更多...

Unity網絡開發基礎 (3) Socket入門 TCP同步連接與簡單封裝練習

Unity網絡開發基礎 (3) Socket入門 TCP同步連接與簡單封裝練習

本文章不作任何商業用途僅作學習與交流教程來自Unity唐老獅關于練習題部分是我觀看教程之后自己實現所以和老師寫法可能不太一樣唐老師說掌握其基本思路即可,因為前端程序一般不需要去寫后端邏輯 1.認識Socket的重要API Socket是什么 Socket（套接字&#xff0…

閱讀更多...

【linux】一文掌握 ssh和scp 指令的詳細用法（ssh和scp 備忘速查）

【linux】一文掌握 ssh和scp 指令的詳細用法（ssh和scp 備忘速查）

文章目錄入門連接執行SCP配置位置SCP 選項配置示例ProxyJumpssh-copy-id SSH keygenssh-keygen產生鑰匙類型known_hosts密鑰格式此快速參考備忘單提供了使用 SSH 的各種方法。參考： OpenSSH 配置文件示例 (cyberciti.biz)ssh_config (linux.die.net) 入門連…

閱讀更多...

真實筆試題

真實筆試題

文章目錄線程題樹的深度遍歷線程題實現一個類支持100個線程同時向一個銀行賬戶中存入一元錢.需通過同步機制消除競態條件,當所有線程執行完成后,賬戶余額必須精確等于100元 package com.itheima.thread;public class ShowMeBug {private double balance; // 賬戶余額priva…

閱讀更多...

2.2 路徑問題專題：LeetCode 63. 不同路徑 II

2.2 路徑問題專題：LeetCode 63. 不同路徑 II

動態規劃解決LeetCode 63題：不同路徑 II（含障礙物） 1. 題目鏈接 LeetCode 63. 不同路徑 II 2. 題目描述一個機器人位于 m x n 網格的左上角，每次只能向右或向下移動一步。網格中可能存在障礙物（標記為 1&#xff…

閱讀更多...

2874. 有序三元組中的最大值 II

2874. 有序三元組中的最大值 II

給你一個下標從 0 開始的整數數組。nums 請你從所有滿足的下標三元組中，找出并返回下標三元組的最大值。如果所有滿足條件的三元組的值都是負數，則返回。i < j < k(i, j, k)0 下標三元組的值等于。(i, j, k)(nums[i] - nums[j]) * nums[k…

閱讀更多...

【論文筆記】Llama 3 技術報告

【論文筆記】Llama 3 技術報告

Llama 3中的頂級模型是一個擁有4050億參數的密集Transformer模型，并且它的上下文窗口長度可以達到128,000個tokens。這意味著它能夠處理非常長的文本，記住和理解更多的信息。Llama 3.1的論文長達92頁，詳細描述了模型的開發階段、優化策略、模…

閱讀更多...

JVM深入原理(一+二)：JVM概述和JVM功能

JVM深入原理(一+二)：JVM概述和JVM功能

目錄 1. JVM概述 1.1. Java程序結構 1.2. JVM作用 1.3. JVM規范和實現 2. JVM功能 2.1. 功能-編譯和運行 2.2. 功能-內存管理 2.3. 功能-即時編譯 1. JVM概述 1.1. Java程序結構 1.2. JVM作用 JVM全稱是Java Virtual Machine-Java虛擬機 JVM作用:本質上是一個運行在…

閱讀更多...

最新文章