【GPT入門】第65課 vllm指定其他卡運行的方法，解決單卡CUDA不足的問題

【GPT入門】第65課 vllm指定其他卡運行的方法，解決單卡CUDA不足的問題

web/2025/9/11 9:29:24/文章來源:https://blog.csdn.net/spark_dev/article/details/151324040

【GPT入門】第65課 vllm指定其他卡運行的方法，解決單卡CUDA不足的問題

１.原理
- - 說明：
２.實踐

１.原理

要將 vllm 部署在第二張 GPU 卡上（設備編號為 1），只需在命令前添加 CUDA_VISIBLE_DEVICES=1 環境變量指定 GPU 設備：

CUDA_VISIBLE_DEVICES=1 vllm serve /root/autodl-tmp/models_xxzh/Qwen/Qwen1.5-1.8B-Chat

說明：

CUDA_VISIBLE_DEVICES=1 是核心配置，強制程序僅使用編號為 1 的 GPU（第二張卡，GPU 編號從 0 開始計數）
若需驗證 GPU 編號，可先運行 nvidia-smi 查看所有 GPU 設備的序號和狀態

如需額外參數（如指定端口、并發數等），可直接追加在命令后，例如：

CUDA_VISIBLE_DEVICES=1 vllm serve /root/autodl-tmp/models_xxzh/Qwen/Qwen1.5-1.8B-Chat --port 8000 --max-num-seqs 32

２.實踐

下面的圖是nvitop，（通過pip install nvitop 安裝）的截圖

運行前
指定第一個卡運行
命令：

CUDA_VISIBLE_DEVICES=1  vllm serve /root/autodl-tmp/models_xxzh/Qwen/Qwen1.5-1.8B-Chat

在這里插入圖片描述

其他llm程序默認在第0個卡運行

本文來自互聯網用戶投稿，該文觀點僅代表作者本人，不代表本站立場。本站僅提供信息存儲空間服務，不擁有所有權，不承擔相關法律責任。
如若轉載，請注明出處：http://www.pswp.cn/web/96267.shtml
繁體地址，請注明出處：http://hk.pswp.cn/web/96267.shtml
英文地址，請注明出處：http://en.pswp.cn/web/96267.shtml

如若內容造成侵權/違法違規/事實不符，請聯系多彩編程網進行投訴反饋email:809451989@qq.com，一經查實，立即刪除！

相關文章

Spring Boot Actuator自定義指標與監控實踐指南

Spring Boot Actuator自定義指標與監控實踐指南

Spring Boot Actuator自定義指標與監控實踐指南本篇文章以生產環境實戰經驗為主線，結合某電商系統的業務場景，講解如何在Spring Boot Actuator中添加并暴露自定義指標，并使用Prometheus和Grafana進行完整的監控與告警配置。一、業務場景描述…

閱讀更多...

Vue報錯＜template v-for=“option in cardOptions“ :key=“option.value“＞

Vue報錯＜template v-for=“option in cardOptions“ :key=“option.value“＞

在Vue項目中遇到報錯，原因是模板中使用了<template>標簽內的v-for指令，而當前Vue版本不支持此用法。解決方案是移除<template>標簽，直接在<el-option>上使用v-for。同時優化計算屬性cardOptions，使其能夠兼容歷…

閱讀更多...

人工智能學習：Transformer結構中的規范化層（層歸一化）

人工智能學習：Transformer結構中的規范化層（層歸一化）

Transformer結構中的規范化層（層歸一化）一、規范化層（層歸一化）介紹概念層歸一化（Layer Normalization）是一種用于提高深度神經網絡訓練穩定性和加速收斂的技術，廣泛應用于現代深度學習模型中，尤其是在Transformer等序列建模網絡中。它通過對每一層的輸出進行歸一化…

閱讀更多...

盼之代售最新版 decode__1174

盼之代售最新版 decode__1174

聲明本文章中所有內容僅供學習交流使用，不用于其他任何目的，抓包內容、敏感網址、數據接口等均已做脫敏處理，嚴禁用于商業用途和非法用途，否則由此產生的一切后果均與作者無關！ 逆向分析部分python代碼 cp1 execj…

閱讀更多...

Transformer系列 | Pytorch復現Transformer

Transformer系列 | Pytorch復現Transformer

🍨 本文為🔗365天深度學習訓練營中的學習記錄博客🍖 原作者：K同學啊一、Transformer和Seq2Seq 在之前的博客中我們學習了Seq2Seq(深度學習系列 | Seq2Seq端到端翻譯模型)，知曉了Attention為RNN帶來的優點。那么有沒有…

閱讀更多...

【MySQL】常用SQL語句

【MySQL】常用SQL語句

介紹常用的DDL語句、DML語句基本語法分號結尾使用空格和縮進不區分大小寫--或#注釋單行內容 /*注釋多行內容*/DDL數據定義語句：定義數據庫、表、字段一、操作庫-- 創建庫create database db1;-- 創建庫是否存在，不存在則創建create database if not exi…

閱讀更多...

云手機就是虛擬機嗎？

云手機就是虛擬機嗎？

云手機并非等同于虛擬機，盡管二者存在一定相似性，但有著諸多區別，以下從多個方面來分析：云手機是一種基于云計算技術，將云端服務器虛擬化為手機設備，用戶能通過網絡遠程操控的虛擬手機服務，它從…

閱讀更多...

準確--Nginx 1.28.0 安裝與配置流程

準確--Nginx 1.28.0 安裝與配置流程

Nginx 1.28.0 安裝與配置流程 1. 下載與解壓 cd ~ wget http://nginx.org/download/nginx-1.28.0.tar.gz tar -zxvf nginx-1.28.0.tar.gz cd nginx-1.28.02. 配置編譯參數 ./configure \--prefix/home/ynnewweb/nginx \--with-http_ssl_module \--with-http_gzip_static_module…

閱讀更多...

無標記點動捕新范式：Xsens系統助力人形機器人實現毫米級動作復刻

無標記點動捕新范式：Xsens系統助力人形機器人實現毫米級動作復刻

Xsen搭載Manus數據手套在機器人操作與機器學習中的應用當前，人形機器人正加速向工業裝配、家庭陪護、倉儲物流等場景滲透，而 “如何讓機器人的動作既符合人類運動規律，又能實現高精度執行” 成為制約其落地的核心瓶頸。Xsens 高精度全身動捕系…

閱讀更多...

mysql57超管root忘記密碼怎么辦

mysql57超管root忘記密碼怎么辦

目錄背景 1.首先停止數據庫 2.使用免密模式啟動 3.修改密碼 3.1刷新權限配置 3.2修改密碼 4.殺掉mysql 5.重新正常啟動mysql 6.查看mysql狀態 7.驗證 7.1首先服務器本地驗證 7.2遠程驗證背景數據庫密碼忘記了,急的抓耳撓腮,怎么也想不起來,于是就開始重置吧 1.…

閱讀更多...

RESTful API：@RequestParam與@PathVariable實戰對比

RESTful API：@RequestParam與@PathVariable實戰對比

RequestParam vs PathVariable 在刪除和查找操作中的使用差異在項目實戰中，選擇使用 RequestParam 還是 PathVariable 來接收ID參數，通常基于以下幾個考慮因素： 1. RESTful API 設計原則查找操作使用 PathVariable GetMapping("/depts…

閱讀更多...

劇本殺小程序系統開發：開啟沉浸式社交娛樂新紀元

劇本殺小程序系統開發：開啟沉浸式社交娛樂新紀元

在當今數字化浪潮席卷的時代，社交娛樂方式正經歷著前所未有的變革。劇本殺，這一融合了角色扮演、推理懸疑與社交互動的線下娛樂項目，近年來迅速風靡全國，成為年輕人熱衷的社交新寵。而隨著移動互聯網的蓬勃發展，劇本殺…

閱讀更多...

中線安防保護器，也叫終端電氣綜合治理保護設備為現代生活筑起安全防線

中線安防保護器，也叫終端電氣綜合治理保護設備為現代生活筑起安全防線

中線安防保護器（Neutral Line Protection Device，簡稱NLPD）是一種專門用于監測和保護電力系統中性線的安全裝置。中線安防保護器的基本原理為:通過電流檢測環節采集系統中性線上過電流信息， 經控制器快速計算并提取各次諧波電流的…

閱讀更多...

Spring Cloud Alibaba快速入門02-Nacos配置中心(下)

Spring Cloud Alibaba快速入門02-Nacos配置中心(下)

文章目錄前言配置中心 - 數據隔離示例1.先創建命名空間2.創建配置3.克隆配置4.動態切換環境5.yml多文檔模式spring.profiles.activedevspring.profiles.activetest總結前言上一章簡單了解了Nacos配置中心的基本用法，這一章將開始Nacos配置中心的實戰案例。配置中…

閱讀更多...

基于結構光相移法的三維重建

基于結構光相移法的三維重建

基于結構光相移法的三維重建程序 1. 介紹結構光相移法是一種常用的三維重建技術，通過投射條紋圖案并捕捉其變形來計算物體的三維形狀。相移法通過多次投射不同相位的條紋圖案，利用相位信息來提取物體表面的深度信息。 2. MATLAB實現 2.1 生成條紋圖案首…

閱讀更多...

機器學習10——降維與度量學習（K近鄰、多維縮放、主成分分析）

機器學習10——降維與度量學習（K近鄰、多維縮放、主成分分析）

上一章：機器學習09——聚類下一章：機器學習11——特征選擇與稀疏學習機器學習實戰項目：【從 0 到 1 落地】機器學習實操項目目錄：覆蓋入門到進階，大學生就業 / 競賽必備文章目錄一、k近鄰學習（kNN&#…

閱讀更多...

Js 圖片加載完成與圖片緩存加載的區別

Js 圖片加載完成與圖片緩存加載的區別

這兩個有什么區別// 圖片加載完成后淡入$img.on(load, function () {$img.css(opacity, 1);});// 處理圖片緩存情況if ($img[0].complete) {$img.css(opacity, 1);}要理解這兩段代碼的區別，需要先明確它們的核心作用場景和執行時機差異—— 本質是解決 “圖片加載完…

閱讀更多...

國產化PDF處理控件Spire.PDF教程：如何在 Java 中通過模板生成 PDF

國產化PDF處理控件Spire.PDF教程：如何在 Java 中通過模板生成 PDF

在企業級應用開發中，生成 PDF 文檔是一項非常常見的需求。無論是發票、報告、合同，還是其他業務文檔，開發人員通常都需要一種高效、穩定的方式來創建 PDF。與其逐行繪制 PDF 內容，不如直接利用模板 ——常見的模板形式包括 HTML …

閱讀更多...

Spring Cloud Gateway WebFlux現cvss10分高危漏洞，可導致環境屬性篡改

Spring Cloud Gateway WebFlux現cvss10分高危漏洞，可導致環境屬性篡改

漏洞概述Spring官方披露了Spring Cloud Gateway Server WebFlux組件中存在一個高危漏洞（編號CVE-2025-41243），該漏洞在特定配置下允許攻擊者篡改Spring環境屬性。該漏洞已獲得CVSS 10.0的最高嚴重性評級。根據安全公告，該漏洞被描…

閱讀更多...

嵌入式 SQLite 數據庫開發筆記

嵌入式 SQLite 數據庫開發筆記

嵌入式 SQLite 數據庫開發入門筆記在嵌入式開發中，數據存儲與管理是不可或缺的環節。對于資源有限的系統，輕量級數據庫 SQLite 是一個非常理想的選擇。它無需獨立服務進程，直接嵌入到應用中即可使用，既能滿足數據持久化需求&#…

閱讀更多...

最新文章