windows 安裝vllm cuda版本

windows 安裝cuda版本

查看window cuda版本

nvidia-smi
在這里插入圖片描述

vllm 獲取鏡像,此版本需要cuda 版本12.8 或以上

docker pull vllm/vllm-openai:latest

下載模型

git lfs installcd e:\ai mkdir   vllm\models\qwen2cd vllm\models#通過git下載git clone https://www.modelscope.cn/qwen/qwen2-0.5b.git Qwen2-0.5B#通過sdk下載pip install modelscope from modelscope import snapshot_download
model_dir = snapshot_download('qwen/qwen2-0.5b',local_dir='e:\ai\vllm\models\qwen2')#通過命令下載conda create --name vLLM python=3.10 -yconda activate vllmpip install modelscopemodelscope download --model qwen/qwen2-0.5b --local_dir e:\ai\vllm\models\qwen2

下載結果

在這里插入圖片描述

運行vllm

services:vllm:container_name: vllmrestart: noimage: vllm/vllm-openai:latestruntime: nvidiaipc: host	 #environment:# - HF_HUB_OFFLINE = 1# - CUDA_VISIBLE_DEVICES = 0volumes:- E:\ai\vllm\models\Qwen2:/modelscommand: ["--model", "/models/Qwen/qwen2-0___5b","--served_model_name", "qen2","--gpu_memory_utilization", "0.90","--max_model_len", "1024 ","--tensor-parallel-size", "1"]ports:- 8000:8000deploy:resources:reservations:devices:- driver: nvidiacapabilities: [ gpu ]count: all

vllm 運行時提示,需要的gpu版本,運行后查看cuda版本

在這里插入圖片描述

cuda版本可以做升級處理

CUDA下載地址:CUDA Toolkit Archive | NVIDIA Developer

升級處理 安裝選自定義全部安裝

啟動vllm

cd E:\project\vllm-maindocker-compose up -d

在這里插入圖片描述
在這里插入圖片描述

本文來自互聯網用戶投稿,該文觀點僅代表作者本人,不代表本站立場。本站僅提供信息存儲空間服務,不擁有所有權,不承擔相關法律責任。
如若轉載,請注明出處:http://www.pswp.cn/bicheng/84713.shtml
繁體地址,請注明出處:http://hk.pswp.cn/bicheng/84713.shtml
英文地址,請注明出處:http://en.pswp.cn/bicheng/84713.shtml

如若內容造成侵權/違法違規/事實不符,請聯系多彩編程網進行投訴反饋email:809451989@qq.com,一經查實,立即刪除!

相關文章

Node.js特訓專欄-基礎篇:1. Node.js環境搭建與項目初始化詳細指南

我將為你詳細講解 Node.js 環境搭建與項目初始化的步驟,包含常見問題解決和最佳實踐,幫助你快速上手。 詳細步驟說明 1. 環境搭建 Windows用戶: 訪問Node.js官網(https://nodejs.org)下載LTS版本安裝包(推薦長期支持版&#xf…

13.安卓逆向2-frida hook技術-HookJava構造方法

免責聲明:內容僅供學習參考,請合法利用知識,禁止進行違法犯罪活動! 內容參考于:圖靈Python學院 工具下載: 鏈接:https://pan.baidu.com/s/1bb8NhJc9eTuLzQr39lF55Q?pwdzy89 提取碼&#xff1…

php基礎:常見函數

內建函數 文章目錄 內建函數1、文件操作函數:2、代碼執行函數:3、反序列化函數:4、數據庫操作函數:5、類型轉換與比較函數:6、其他常見函數: 1、文件操作函數: include(): 導入并執行指定的 PHP…

教程:PyCharm 中搭建多級隔離的 Poetry 環境(從 Anaconda 到項目專屬.venv)

核心思維:為什么需要 “多級隔離”? 在復雜項目中,環境沖突是最棘手的問題(比如系統 Python 版本不同、依賴包版本沖突)。通過 “Anaconda 虛擬環境 → 項目 Poetry 環境 → 工具級隔離” 的三層架構,實現…

Rollup vs Webpack 深度對比:前端構建工具終極指南

前端工程領域始終面臨一個根本選擇:如何在模塊化編碼規范與工程化構建效率之間取得最佳平衡。Rollup與Webpack分別代表著兩種不同維度的解決方案,本文將揭示它們的真實應用場景與核心差異。 一、核心差異全景圖(附最新對比) 核心能…

Module Federation 和 Native Federation 的比較

前言 Module Federation 是 Webpack 5 引入的微前端架構方案,允許不同獨立構建的應用在運行時動態共享模塊。 Native Federation 是 Angular 官方基于 Module Federation 理念實現的專為 Angular 優化的微前端方案。 概念解析 Module Federation (模塊聯邦) Modul…

Easy Excel

Easy Excel 一、依賴引入二、基本使用1. 定義實體類(導入/導出共用)2. 寫 Excel3. 讀 Excel 三、常用注解說明(完整列表)四、進階:自定義轉換器(Converter) 其它自定義轉換器沒生效 Easy Excel在…

iOS 26 攜眾系統重磅更新,但“蘋果智能”仍與國行無緣

美國西海岸的夏天,再次被蘋果點燃。一年一度的全球開發者大會 WWDC25 如期而至,這不僅是開發者的盛宴,更是全球數億蘋果用戶翹首以盼的科技春晚。今年,蘋果依舊為我們帶來了全家桶式的系統更新,包括 iOS 26、iPadOS 26…

AI高考志愿助手應用架構設計并上線實施運行

環境: AI高考志愿助手 問題描述: AI高考志愿助手應用架構設計并上線實施運行 業務需求:開發一個AI升學助手,功能是幫助用戶模擬填報高考志愿等功能,數據是歷年各專業的錄取分數線表格。數據確認: 近3年約100多萬條數據,原始數據是excel表格數據。解決方案: 一、項…

深入淺出掌握 Axios(持續更新)

在了解ajax和axios之前,我們先觀察一下他們是什么英文的縮寫 ajax 的名字為 asynchroanous JavaScript and XML 而axios的名稱來源于英文單詞“axis”與“I/O”的結合,并非直接縮寫自某個特定短語。 先導知識 在本文我們簡單的介紹一下ajax后著重講解…

windows10下搭建nfs服務器

windows10下搭建nfs服務器 有參考這篇博客 Windows10搭建NFS服務 - fuzidage - 博客園 下載 NFS Server這個app 通過網盤分享的文件:nfs1268 (1).exe 鏈接: https://pan.baidu.com/s/1rE4h710Uh-13kWGXvjkZzw 提取碼: mwa4 --來自百度網盤超級會員v5的分享 下載后…

npm符號鏈接

前言 最近在寫一個快應用項目,demo中依賴了本地文件,package.json如下: 此時 node_modules 下出現了 mysdk,復制整個項目,但是copy的項目中的node_modules并未出現該文件,導致報錯。 解決方案 觀察 pa…

SQL 中 IDENTITY 列的特殊處理.

SQL 處理中,遇到提示: "消息 544,級別 16,狀態 1,第 3 行 當 IDENTITY_INSERT 設置為 OFF 時,不能為表 BM 中的標識列插入顯式值。" 即當 SQL Server 表中的 ??標識列(Identity Column)?? 插入顯式值,但未啟用 IDENTITY_INSERT 選項。由此報錯,以下是詳…

網絡安全等級保護中關于SSL證書的整改如何處理?

SSL證書在網絡安全等級保護(等保)體系中扮演著至關重要的角色,是實現多個等保核心要求(尤其是三級及以上)的關鍵技術手段之一。其重要性主要體現在以下幾個方面: 滿足“身份鑒別”要求(等保要求…

Docker容器化打造elasticsearch8.18.2集群企業實戰(含kibana+證書認證)

主機信息 主機配置4Core8GB硬盤大于80GB 主機名IP地址角色10-0-17-12310.0.17.123es-node110-0-17-15810.0.17.158es-node2kibana-15610.0.17.156kibana 一、環境準備 1. 安裝 Docker 這里就不介紹如何安裝docker了,本文docker版本為20 2. 主機名與網絡與內核配置…

JAVA語言的學習(Day_1)

寫一個項目并運行: 第一步:新建一個.txt文本。右擊點開用Notepad打開,并編輯。 編輯并保存后,可以在文件的查看中,顯示出文件的類型(eg: .txt / .java)。將txt文本的.txt類型改為.java。 之后在下面的截…

JS 原型與原型鏈詳解

JavaScript 原型與原型鏈詳解 文章目錄 JavaScript 原型與原型鏈詳解一、基礎概念類1.1 什么是原型?JavaScript 中如何訪問一個對象的原型?1.2 構造函數、實例對象和原型對象之間的關系是什么?1.3 prototype 和 **proto** 的區別是什么&#…

DEVICENET轉MODBUS TCP網關連接DeviceNet數字遠程IO模塊配置案例

設備與網絡架構,主控設備:支持Modbus TCP協議的PLC(如西門子S7-1200)。網關設備:開疆智能Modbus TCP轉DeviceNet網關KJ-DVCZ-MTCPS(需支持DeviceNet從站功能)。目標設備:DeviceNet數…

Ubuntu下使用PyTurboJPEG加速圖像編解碼

目錄 一、概述 二、安裝PyTurboJPEG 三、測試 一、概述 在計算機視覺領域,圖像編解碼是繞不開的基礎環節。雖然 OpenCV 能解決大部分圖像處理問題,但在性能要求嚴苛的場景下存在短板。本文將介紹基于 libjpeg-turbo 的高效 JPEG 編解碼庫 PyTurboJPE…

MCU、MPU、GPU、Soc、DSP、FPGA、CPLD……它們到底是什么?

MCU、MPU、GPU、Soc、DSP、FPGA、CPLD…… 這些簡稱在各大論壇、會議、發布會中屢見不鮮,看到簡稱,雖然也能說出大概; 但要問具體是什么?用在什么場景?又有什么區別……好像還是差點意思;本篇文章就記錄一…