mac m1安裝大模型工具vllm

1 更新系統環境

參考vllm官網文檔,vllm對apple m1平臺mac os, xcoder, clang有如下要求

OS:?macOS Sonoma?or later

SDK:?XCode 15.4?or later with Command Line Tools

Compiler:?Apple Clang >= 15.0.0

在App Store更新macOS和XCoder,依據XCoder版本號安裝command line tools。

https://developer.apple.com/download/all/?q=Command%20Line%20Tools

?2 安裝anconda并初始化虛擬環境

下載并安裝apple m1版本anconda

比如 Anaconda3-2025.06-0-MacOSX-arm64.pkg

https://www.anaconda.com/download-success

初始化conda虛擬環境

conda create -n vllm python=3.12

conda activate vllm

3 安裝vllm

1)下載vllm

git clone?https://github.com/vllm-project/vllm.git

大部分情況git clone會失敗,所以直接下載vllm的release版本,這里下載0.92,鏈接如下。

https://github.com/vllm-project/vllm/releases/download/v0.9.2/vllm-0.9.2.tar.gz

https://github.com/vllm-project/vllm/releases

2)安裝vllm

先安裝依賴

cd vllm

pip install -r requirements/cpu.txt

conda install cmake

conda install ninja

再安裝vllm

pip install -e .

需注意的是以上操作要在mac自帶終端下完成,在iterm下會遇到編譯問題。

4 驗證vllm

vLLM 將 Hugging Face 模型下載到本地,默認?~/cache/huggingface/hub?文件夾中。

以下是測試代碼。

import osos.environ["HF_ENDPOINT"] = "https://hf-mirror.com"from vllm.entrypoints.llm import LLM
from vllm.sampling_params import SamplingParamsmodel_name = "deepseek-ai/DeepSeek-R1-Distill-Qwen-1.5B"llm = LLM(model=model_name, max_model_len=128)sampling_params = SamplingParams(temperature = 0.9,max_tokens = 100)
prompt = "中國首都在那?"
output = llm.generate(prompt, sampling_params)print(output)
print(output[0].outputs[0].text)

另外,vLLM 還可以作為服務運行。

目前存在的問題是運行慢,后續看有效量化方法,比如llama.cpp的int4量化,鏈接如下。

https://blog.csdn.net/liliang199/article/details/149246699

reference

---

vllm

https://github.com/vllm-project/vllm.git

vllm?CPU install doc

https://docs.vllm.ai/en/latest/getting_started/installation/cpu.html

mac command line tools

https://developer.apple.com/download/all/?q=Command%20Line%20Tools

小白入門:使用vLLM在本機MAC上部署大模型

https://www.53ai.com/news/OpenSourceLLM/2025040116542.html

hf-mirror

https://hf-mirror.com/

本文來自互聯網用戶投稿,該文觀點僅代表作者本人,不代表本站立場。本站僅提供信息存儲空間服務,不擁有所有權,不承擔相關法律責任。
如若轉載,請注明出處:http://www.pswp.cn/web/88325.shtml
繁體地址,請注明出處:http://hk.pswp.cn/web/88325.shtml
英文地址,請注明出處:http://en.pswp.cn/web/88325.shtml

如若內容造成侵權/違法違規/事實不符,請聯系多彩編程網進行投訴反饋email:809451989@qq.com,一經查實,立即刪除!

相關文章

解鎖localtime:使用技巧與避坑指南

目錄 一、引言 1.1 背景與目的 1.2 localtime 函數簡介 二、localtime 函數詳解 2.1 函數原型與參數 2.2 返回值與 tm 結構體 2.3 基本使用示例 三、localtime 函數的缺陷剖析 3.1 多次調用同一共享區間導致錯誤 3.1.1 問題現象展示 3.1.2 原因深入分析 3.1.3 實際影…

鄭州機械設計研究所 -PHM產品序列概覽

1.設備狀態監測系統 動態信號監測很像是三個獨立通道,振動,轉速,然后高頻的某個頻帶。或者是同一個振動信號做的低頻和高頻兩個帶通,時域和頻域組圖。實時檢測,很明顯是24個時 -頻指標。 動態分析看起來像趨勢圖。 2.…

《棒壘球知道》奧運會的吉祥物是什么·棒球1號位

Olympic Mascots & Baseball/Softball Games History ?(奧運吉祥物與棒壘球賽事全科普)1984洛杉磯奧運會 / Los Angeles 1984Mascot: Sam the Eagle(山姆鷹)美國精神象征,紅白藍配色超吸睛!Baseball/S…

【提高篇-基礎知識與編程環境:1、Linux系統終端中常用的文件與目錄操作命令】

Linux終端提供了豐富的命令來操作文件和目錄,以下簡單介紹一些常用的命令: 一、目錄操作命令 pwd - 顯示當前工作目錄 pwd #輸出當前所在目錄的絕對路徑 cd - 切換目錄 cd /path/to/directory # 切換到指定目錄 cd … # …

前端性能優化:從之理論到實踐的破局道

🚀 前端性能優化:從之理論到實踐的破局道 摘要:本文針對首屏加載、渲染卡頓等核心痛點,結合當前主流技術棧給出可落地的優化方案一、為什么你的頁面"又慢又卡"? 用戶真實體驗數據: 加載時間超過3…

2025年最新Python+Playwright自動化測試- 隱藏元素定位與操作

1.簡介 對于前端隱藏元素,一直是自動化定位元素的隱形殺手,讓人防不勝防。腳本跑到隱藏元素時位置時報各種各樣的錯誤,可是這種隱藏的下拉菜單又沒有辦法避免,所以非常頭痛,這一篇只為交流隱藏元素自動化定位處理方法以…

跨境電商稅務解決之道:在合規航道上駛向全球市場

首席數據官高鵬律師數字經濟團隊創作AI輔助當某3C品類跨境賣家因未同步境內交易流水被處以20萬元罰款,當某服飾品牌因歐盟增值稅申報疏漏導致貨物滯留港口,當東南亞市場的“低稅率紅利”變成“稅務稽查雷區”——跨境電商的黃金時代里,稅務合…

(6)機器學習小白入門 YOLOv:圖片的數據預處理

(1)機器學習小白入門YOLOv :從概念到實踐 (2)機器學習小白入門 YOLOv:從模塊優化到工程部署 (3)機器學習小白入門 YOLOv: 解鎖圖片分類新技能 (4)機器學習小白入門YOLOv :圖片標注實操手冊 (5)機器學習小白入門 YOLOv:…

康謀新聞 | 康謀加入ASAM組織,全球首個ASIL-D認證自動駕駛仿真平臺aiSim引領安全新標桿

康謀新聞康謀科技正式加入全球汽車標準化組織 ASAM(Association for Standardization of Automation and Measuring Systems),成為其正式會員單位!ASAM作為國際汽車行業標準化領域的權威機構,致力于推動仿真、測試及數…

《PyQt6-3D:開啟Python 3D開發新世界》

一、引言 在 Python 的廣袤開發世界中,3D 開發領域正以驚人的速度蓬勃發展,為眾多領域帶來了前所未有的創新與變革。從沉浸式的游戲體驗到逼真的虛擬現實場景,從精準的工業設計模擬到生動的影視動畫制作,3D 技術的身影無處不在&am…

第一屆OpenHarmonyCTF--Crypto--WriteUp

第一屆OpenHarmonyCTF–Crypto–WriteUp Ea5y_rsa題目附件解壓后尋找有用的源代碼: // RsaUtil import { cryptoFramework } from kit.CryptoArchitectureKit; import { buffer } from kit.ArkTS;class RsaUtil{private keyPair: cryptoFramework.KeyPair | null n…

Copilot 在 VS Code 中的免費替代方案

## 引言隨著 GitHub Copilot 推出付費 Pro 版,許多開發者開始尋找免費替代方案。本文精選 7 款 2025 年主流免費 AI 編程工具,涵蓋不同使用場景和編程語言需求。## 主流替代方案對比| 工具名稱 | 核心優勢 | 支持語…

視頻能轉成gif動圖嗎?怎么弄?

在一些社交平臺中,分享短小有趣的片段。GIF自動循環播放,無需用戶點擊。兼容性高,幾乎所有平臺都支持直接預覽。例子:將電影/綜藝的搞笑片段轉為GIF傳播。游戲精彩操作截取為GIF分享。這就需要我們掌握把視頻轉換成gif動圖的技術&…

【Pyhton】Json.dump 語法說明

目錄json.dump() 的語法參數說明1. obj2. fp3. skipkeys4. ensure_ascii5. check_circular6. allow_nan7. cls8. indent9. separators10. default11. sort_keys**示例代碼****基本用法**使用 indent 和 separators使用 default 參數總結json.dump() 是 Python 中 json 模塊用于…

LangGraph-2-interrupt 流程中斷

interrupt 是 LangGraph 中一個強大的流程控制機制,允許在狀態機執行過程中根據特定條件中斷當前流程并跳轉到其他節點。這種機制特別適用于處理異常情況、用戶中斷或特定業務規則的觸發。在 LangGraph 中,interrupt_before 和 interrupt_after 是兩個強…

前綴和|差分

題目:MT2047距離平方和你有𝑛n個點,請編寫一個程序,求這𝑛n個點的距離的平方和。格式輸入格式:第一行:一個整數𝑛(0≤𝑛≤100000)n(0≤…

x86架構CPU市場格局

x86架構的CPU市場是全球處理器市場的核心,涵蓋PC(桌面端與移動端)、服務器和超算等領域,主要玩家為英特爾(Intel)和AMD。以下基于最新數據分析市場格局及各領域份額,輔以國產廠商動態。 1. 總體…

【Swift開發】屏蔽NSSecureCoding頻繁警告

解決 iOS 開發中 NSSecureCoding 警告的最佳實踐 問題背景 在開發 Mac 應用時,我遇到了一個令人困擾的問題:Xcode 控制臺不斷輸出 NSSecureCoding allowed classes list contains [NSObject class] 相關的警告信息。這些警告雖然不影響應用功能&#xff…

SpringBoot實現MCP

前言 之前的文章都是各種使用MCP,自從有了MCP我們立馬感受到大模型真的可以幫我們干活了,實際上當我們想把企業內部的業務向AI方向轉型的話主要就是實現MCP,另外加上多Agent在流程上的控制和自有的知識庫這就可以滿足企業80%的需求了,剩下的2…

windows對\和/敏感嗎?

在Windows系統中,路徑分隔符\和/的敏感性需要分情況來看: 1. 文件系統層面 Windows文件系統(如NTFS、FAT32)不區分\和/。 例如,以下路徑是等效的: C:\Users\Documents\file.txt C:/Users/Documents/file.tx…