UOS+N 卡 + CUDA 環境下 X86 架構 DeepSeek 基于 vLLM 部署與 Dify 平臺搭建指南

一、文檔說明

本文檔是一份關于 DeepSeek 在X86架構下通vLLM工具部署的操作指南,主要面向需要在UOS+N卡+CUDA環境中部署DeepSeek的技術人員,旨在指導文檔使用者完成從 Python 環境升級、vLLM 庫安裝、模型部署到 Dify 平臺搭建的全流程操作。

二、安裝Python步驟

因為UOSV20默認集成Python版本是2.7和3.7版本,因此需要手動編譯升級Python版本至Python3.10.16版本。

1.下載Python3.10.16源碼包

終端執行如下命令,從官方? 指定地址獲取源碼包。

wget https://www.python.org/ftp/python/3.10.16/Python-3.10.16.tar.xz

?2. 配置編譯選項

終端執行如下命令解壓下載的文件,并進入解壓后文件目錄

tar -xvf Python-3.10.16.tar.xz

cd Python-3.10.16

3. 編譯源碼

依次在終端執行./configure和make命令,進行源碼編譯。這一步會根據系統環境和配置選項進行相關設置和編譯操作,可能需要一定時間,請耐心等待。

4. 安裝Python3.10.16

??執行如下命令完成Python 3.10.16的安裝。

make install

??執行如下命令添加pip命令

ln -s ?/usr/local/pip3.10 ??/usr/bin/pip

5. 更新升級pip

??執行如下命令對pip進行升級

pip install --upgrade pip

6. 查看python安裝是否成果

?在終端輸入`python3 -V`,若顯示`Python 3.10.16`,則表明安裝成功。如下圖所示:

python3 -V

7. 創建Python3.10.16虛擬環境

?執行如下命令,創建名為vllm_venv的虛擬環境,為后續安裝vLLM庫提供隔離的運行環境。

python3 -m venv vllm_venv

三、安裝vLLM庫

1. 激活Python3.10.16虛擬環境

??在終端執行如下命令,激活之前創建的虛擬環境,激活成功后,命令行提示符前會出現`(vllm_venv)`標識。

source vllm_venv/bin/activate

2. 安裝vLLM庫

在激活的虛擬環境中,執行`pip3 install vllm`命令安裝vLLM庫

pip3 install vllm

3. 安裝ModelScopse庫

繼續在虛擬環境中執行如下命令,完成ModelScopse庫的安裝。

pip3 install modelscopse

4. 下載模型文件

執行如下命令,將模型文件下載到指定目錄。

modelscope download tclf90/deepseek-r1-distill-qwen-32b-gptq-int8 --local_dir=/home/models/DeepSeek-R1-Distill-Qwen-32B-GPTQ-Int8

5. 啟動vLLM服務

執行如下命令啟動vLLM服務,并對各參數進行說明:

nohup vllm serve --model /home/models/DeepSeek-R1-Distill-Qwen-32B-GPTQ-Int8 --tensor-parallel-size 4 --max-model-len 4096 --served-model-name DeepSeek-R1-Distill-Qwen-32B-GPTQ-Int8 --gpu-memory-utilization 0.8 --api-key uniontech > vllm.log 2>&1 &

參數說明:

--model:指定要使用的大語言模型的名稱或路徑。

--tensor-parallel-size:指定張量并行的大小。該模型支持1/2/4

--max-model-len:指定模型支持的最大輸入長度。

--served-model-name:指定服務的模型名稱。

--gpu-memory-utilization:指定 GPU 內存的利用率,默認值0.9。

--api-key:指定API key值。

服務啟動后,可以通過`tail -f vllm.log`命令查看服務啟動日志,監控日志以確認服務是否啟動成功。

四、二進制安裝docker(選擇)

若當前環境已安裝Docker,則可跳過此步驟,直接安裝Dify平臺;若未安裝,可按以下步驟進行安裝:

1. 下載docker二進制文件

在終端執行如下命令,從指定鏡像源下載二進制文件。

wget https://mirrors.tuna.tsinghua.edu.cn/docker-ce/linux/static/stable/x86_64/docker-20.10.17.tgz

2. 進入到docker目錄下載docker-compose

??進入到存放docker相關文件的目錄(根據實際情況確定具體路徑)。

??執行如下命令下載docker-compose文件。

wget https://github.com/docker/compose/releases/download/v2.34.0/docker-compose-linux-x86_64

mv docker-compose-linux-x86_64 docker-compose

3. 創建軟鏈接、

??執行如下命令,將docker目錄下的所有文件軟鏈接到/usr/bin目錄下

sudo ln -svf /home/xyh/tools/docker/* /usr/bin/

注:需要將命令中docker地址修改修改成個人本地docker實際地址

4. 使用root用戶創建開機自動啟腳本

cat > /usr/lib/systemd/system/docker.service <<EOF

[Unit]

Wants=network-online.target

[Service]

Type=notify

ExecStart=/usr/bin/dockerd

[Install]

WantedBy=multi-user.target

EOF

5. 配置Docker源

??

?vi /etc/docker/daemon.json

?{

? ? "registry-mirrors":["https://image.cloudlayer.icu/","https://docker.m.daocloud.io"]

?}

6. 加載service腳本

在終端依次執行如下命令,加載并重啟docker服務。

sudo systemctl daemon-reload

sudo systemctl restart docker

7. 設置開機自啟動Docker服務

執行如下命令,設置Docker服務開機自啟動。

sudo systemctl enable docker

8. 查看docker版本

?執行如下命令,查看安裝的Docker版本,確認安裝是否成功。

docker --version

???

五、安裝Dify平臺

1. 下載Dify平臺源碼

在終端執行如下命令,從GitHub倉庫下載Dify平臺源碼。

git clone https://github.com/langgenius/dify.git

2. 配置docker源

vi /etc/docker/daemon.json

?{

"registry-mirrors":["https://image.cloudlayer.icu/","https://docker.m.daocloud.io"]

}

3. 調整dify配置文件

??進入`dify/docker`目錄,執行`cd dify/docker`命令。

??復制示例配置文件,執行`cp.env.example.env`命令。

??編輯.env文件在文件末尾增加CUSTOM_MODEL_ENABLED=true啟用本地模型

4. 通過docker啟動dify平臺

執行如下命令啟動Dify平臺。首次啟動時,由于需要下載基礎鏡像,耗時可能較長,請耐心等待。

docker-compose up -d

5. 停止dify服務

若需停止Dify服務,執行如下命令即可。

docker-compose down

本文來自互聯網用戶投稿,該文觀點僅代表作者本人,不代表本站立場。本站僅提供信息存儲空間服務,不擁有所有權,不承擔相關法律責任。
如若轉載,請注明出處:http://www.pswp.cn/web/76834.shtml
繁體地址,請注明出處:http://hk.pswp.cn/web/76834.shtml
英文地址,請注明出處:http://en.pswp.cn/web/76834.shtml

如若內容造成侵權/違法違規/事實不符,請聯系多彩編程網進行投訴反饋email:809451989@qq.com,一經查實,立即刪除!

相關文章

操作系統之shell實現(下)

&#x1f31f; 各位看官好&#xff0c;我是maomi_9526&#xff01; &#x1f30d; 種一棵樹最好是十年前&#xff0c;其次是現在&#xff01; &#x1f680; 今天來學習C語言的相關知識。 &#x1f44d; 如果覺得這篇文章有幫助&#xff0c;歡迎您一鍵三連&#xff0c;分享給更…

Spark,流量統計案例

提前創好一個文件夾分為四個類 FlowBean中的代碼內容為&#xff1a;package org.example.flow; import org.apache.hadoop.io.Writable; import java.io.DataInput; import java.io.DataOutput; import java.io.IOException; //hadoop 序列化 //三個屬性&#xff1a;手機…

下載油管視頻 - yt-dlp

文章目錄 1. yt-dlp與you-get介紹1.1 主要功能對比1.2 使用場景1.3 安裝 2. 基本命令介紹2.1 默認下載視頻2.2 指定畫質和格式規則2.3 下載播放列表2.4 備注 3. 參考資料 之前只使用you-get下載b站視頻&#xff0c;當時了解you-get也可下載油管視頻&#xff0c;但之前無此需求&…

基于javaweb的SSM+Maven教材管理系統設計與實現(源碼+文檔+部署講解)

技術范圍&#xff1a;SpringBoot、Vue、SSM、HLMT、Jsp、PHP、Nodejs、Python、爬蟲、數據可視化、小程序、安卓app、大數據、物聯網、機器學習等設計與開發。 主要內容&#xff1a;免費功能設計、開題報告、任務書、中期檢查PPT、系統功能實現、代碼編寫、論文編寫和輔導、論文…

VS2022+QT環境配置及基本操作

參考文章 2025最新&#xff01;Visual Studio 2022 QT6.7 環境配置全攻略&#xff1a;一鍵搞定安裝與亂碼問題&#xff0c;開發效率翻倍&#xff01;&#xff08;全網最詳細教程&#xff0c;手把手教你搭建完美開發環境&#xff01;&#xff09;_vs2022 qt-CSDN博客 下載QT …

使用percona-toolkit同步mysql表數據

背景 做了主備mysql的配置以后&#xff0c;可能因為切換過程造成不一致的情況&#xff0c;這個時候可以處理的方式是全量導入再導出&#xff0c;這個有個問題就是操作的數據太多了 我們只需要數據補全同步即可 mysql的同步是基于binlog的&#xff0c;如果沒有記錄的部分的數據…

MDG 實現后端主數據變更后快照自動刷新的相關設置

文章目錄 前言實現過程BGRFC期初配置&#xff08;可選&#xff09;設置 MDG快照 BGRFC維護BP出站功能模塊 監控 前言 眾所周知&#xff0c;在MDG變更請求創建的同時&#xff0c;所有reuse模型實體對應的快照snapshot數據都會記錄下來。隨后在CR中&#xff0c;用戶可以修改這些…

重裝系統 之 Dell戴爾服務器 PowerEdge R750xs + window server2012r2 || 2016

因要求需要給新服務器裝個 win server2012或者2016系統 XXX使用U盤制作PE系統U盤安裝系統不行&#xff0c;適合普通win8&#xff0c;win10&#xff0c;win11U盤制作PE系統U盤安裝win10系統教程U盤制作PE系統U盤安裝win10系統教程https://mp.weixin.qq.com/s/t0W8aNJaHPAU8T78nh…

基于Spring Security 6的OAuth2 系列之二十六 - 終章

之所以想寫這一系列&#xff0c;是因為之前工作過程中使用Spring Security OAuth2搭建了網關和授權服務器&#xff0c;但當時基于spring-boot 2.3.x&#xff0c;其默認的Spring Security是5.3.x。之后新項目升級到了spring-boot 3.3.0&#xff0c;結果一看Spring Security也升級…

一鍵配置多用戶VNC遠程桌面:自動化腳本詳解

在當今遠程工作盛行的時代,高效且安全地管理多用戶遠程桌面訪問變得至關重要。本文將介紹一個強大的自動化腳本,該腳本能夠快速創建用戶并配置VNC遠程桌面環境,大大簡化了系統管理員的工作。 一、背景介紹 在Linux系統中,手動配置VNC服務器通常需要執行多個步驟,包括創建…

IOT項目——雙軸追光系統

雙軸太陽能追光系統 - ESP32實現 系統概述 這個系統使用&#xff1a; ESP32開發板2個舵機&#xff08;水平方向和垂直方向&#xff09;4個光敏電阻&#xff08;用于檢測光照方向&#xff09;適當的電阻&#xff08;用于光敏電阻分壓&#xff09; 接線示意圖 --------------…

Maven集成模塊打包使用

文章目錄 1.問題思考&#xff08;如何對集成模塊進行打包&#xff09;2.問題解決 &#xff08;如何對集成模塊進行打包&#xff09;3.使用者使用該jar包(jar包安裝本地倉庫和使用) 1.問題思考&#xff08;如何對集成模塊進行打包&#xff09; 思考&#xff1a;假設有這么一個場…

OpenVINO教程(二):圖片目標檢測推理應用

YOLO模型物體檢測 下面是一個簡單的python程序,他的功能是使用yolo11n模型對coco_bike.jpg照片進行檢測,并顯示檢測結果 代碼步驟如下: coco_bike.jpg照片加載yolo模型使用模型進行detect推理顯示推理結果 下面是完整的代碼 from pathlib import Pathimport urllib.request…

聚類算法(K-means、DBSCAN)

聚類算法 K-means 算法 算法原理 K-means 是一種基于類內距離最小化的劃分式聚類算法&#xff0c;其核心思想是通過迭代優化將數據劃分為 K 個簇。目標函數為最小化平方誤差&#xff08;SSE&#xff09;&#xff1a; S S E ∑ i 1 K ∑ x ∈ C i ∣ ∣ x ? μ i ∣ ∣ 2…

Oracle在ERP市場擊敗SAP

2024年&#xff0c;甲骨文&#xff08;Oracle&#xff09;以87億美元的ERP收入和6.63%的市場份額&#xff0c;首次超越SAP&#xff0c;成為全球最大的ERP應用軟件供應商&#xff0c;結束了SAP自上世紀80年代以來在該領域的長期霸主地位。據APPS RUN THE WORLD的市場調研&#x…

嵌入式面試高頻筆試題目解析

一、基礎概念與 C 語言核心題 1. 指針與內存操作 典型題目: char str[] = "hello"; char *ptr = "world"; str[0] = H; // 合法嗎? ptr[0] = W; // 合法嗎?為什么?解析: str 是棧上數組,可修改內容,str[0]=H 合法。ptr 指向常量字符串區,修改會…

【Python】Selenium切換網頁的標簽頁的寫法(全!!!)

在使用selenium做網站爬取測試的時候&#xff0c;我們經常會遇到一些需要點擊的元素&#xff0c;才能點擊到我們想要進入的頁面&#xff0c; 于是我們就要模擬 不斷地 點點點擊 鼠標的樣子。 這個時候網頁上就會有很多的標簽頁&#xff0c;你的瀏覽器網頁標簽欄 be like: 那…

MySQL GTID模式主從同步配置全指南:從配置到故障轉移

前言 MySQL主從復制是企業級數據庫架構的基礎&#xff0c;而GTID(Global Transaction Identifier)模式則是MySQL 5.6版本后推出的革命性復制技術。本文將詳細介紹如何配置基于GTID的主從同步&#xff0c;并包含實用的故障轉移操作指南。 一、GTID模式核心優勢 相比傳統基于…

MAC系統下完全卸載Android Studio

刪除以下文件 /Applications/Android Studio.app /Users/用戶名/Library/Application Support/Google/AndroidStudio2024.2 /Users/用戶名/Library/Google/AndroidStudio /Users/用戶名/Library/Preferences/com.google.android.studio.plist /Users/用戶名/Library/Cache…

<C#>.NET WebAPI 的 FromBody ,FromForm ,FromServices等詳細解釋

在 .NET 8 Web API 中&#xff0c;[FromBody]、[FromForm]、[FromHeader]、[FromKeyedServices]、[FromQuery]、[FromRoute] 和 [FromServices] 這些都是用于綁定控制器動作方法參數的特性&#xff0c;下面為你詳細解釋這些特性。 1. [FromBody] 作用&#xff1a;從 HTTP 請求…