Ubuntu 22 Linux上部署DeepSeek R1保姆式操作詳解（Xinference方式）

Ubuntu 22 Linux上部署DeepSeek R1保姆式操作詳解（Xinference方式）

news/2025/8/16 17:24:37/文章來源:https://blog.csdn.net/daobaqin/article/details/146768740

一、安裝步驟

1.基礎環境安裝

安裝顯卡驅動、cuda，根據自己硬件情況查找相應編號，本篇不介紹這部分內容，只給出參考指令，詳情請讀者自行查閱互聯網其它參考資料。

sudo apt install nvidia-utils-565-server

sudo apt install nvidia-cuda-toolkit

因機器上有其它使用python環境的應用，故使用conda來管理python環境。
?

（1）安裝conda管理器

更新軟件包

sudo apt update

sudo apt upgrade

安裝基本依賴

sudo apt install wget curl bzip2 ca-certificates

下載Anaconda安裝腳本

wget https://repo.anaconda.com/archive/Anaconda3-2023.03-1-Linux-x86_64.sh

運行安裝腳本，按提示一路執行下去，中間需要輸入yes并確認

bash Anaconda3-2023.03-1-Linux-x86_64.sh

初始化Anaconda，執行下面指令，或者關閉命令窗口后重新開啟一個窗口。

source ~/.bashrc

驗證安裝結果

conda env list

（2）創建xinference所需的虛擬環境并激活它

conda create -n Xinference python=3.10.15

conda activate Xinference

（3）安裝chatglm-cpp

https://github.com/li-plus/chatglm.cpp/releases

切換到剛下載的文件所在目錄，運行指令：

pip install chatglm_cpp-0.4.2-cp310-cp310-manylinux_2_17_x86_64.manylinux2014_x86_64.whl

2.安裝Xinfernece

pip install xinference[all]

xinference有好幾種支持的種類，如gpu/cpu/transformers/vllm/metal，用all參數代表全部安裝，這樣以后不管接入哪種類型的大模型都不需要再次安裝了。

3.檢驗環境是否安裝成功

檢驗pytorch是否支持gpu，運行python指令

??? import torch
??? print(torch.__version__)
??? print(torch.cuda.is_available())

如果報錯，運行下面指令安裝支持gpu的依賴包。（根據自己顯卡配置確定cuda版本號，ubuntu系統正常在安裝xinference過程中已經安裝了以下依賴包）

pip install torch==2.6.0+cu128 torchvision==0.21.0+cu128 torchaudio==2.6.0+cu128 --index-url https://download.pytorch.org/whl/cu128

pip3 install -U xformers --index-url https://download.pytorch.org/whl/cu128

安裝后驗證是否成功：

二、啟動Xinference

xinference-local --host 0.0.0.0 --port 9999

windows下只能使用127.0.0.1或者局域網中的本機ip地址，linux可以使用0.0.0.0包含127.0.0.1和局域網中的本機ip地址，這樣就可以在企業內共享了，同時也能使用127.0.0.1訪問。

運行成功后界面如下

三、配置注冊模型文件

1.下載模型文件

到https://huggingface.co/deepseek-ai/DeepSeek-R1-Distill-Qwen-1.5B

如果不能科學上網，打不開上面網址，也可以到國內阿里的開源網站下載：

https://www.modelscope.cn/models/deepseek-ai/DeepSeek-R1-Distill-Qwen-1.5B/files

紅色框內的文件全部下載，保存到同一個目錄中，根據硬件配置選擇不同的模型文件，這里我是演示，所以選擇1.5B，一般企業內做知識庫，建議至少選擇32B，顯存32GB以上，我試過32GB跑32B的模型很吃力，響應很慢。

2.注冊模型文件

上圖中的路徑要換成linux的目錄格式，如/home/qkm/deepseekR1/1-5B，因為截圖忘保存了，用windows模式下的截圖替換了一下。

3.啟動模型文件

四、體驗與模型對話

點擊下圖箭頭處，可以啟動與大模型的聊天

使用conda創建的虛擬環境和安裝的依賴包，往同類操作系統復制時，只要直接拷貝過去即可，基本可以與docker的跨系統部署相媲美了。

本文來自互聯網用戶投稿，該文觀點僅代表作者本人，不代表本站立場。本站僅提供信息存儲空間服務，不擁有所有權，不承擔相關法律責任。
如若轉載，請注明出處：http://www.pswp.cn/news/900362.shtml
繁體地址，請注明出處：http://hk.pswp.cn/news/900362.shtml
英文地址，請注明出處：http://en.pswp.cn/news/900362.shtml

如若內容造成侵權/違法違規/事實不符，請聯系多彩編程網進行投訴反饋email:809451989@qq.com，一經查實，立即刪除！

相關文章

Immutable.js 完全指南：不可變數據的藝術與實踐

Immutable.js 完全指南：不可變數據的藝術與實踐

引言在現代前端開發中，狀態管理是一個核心挑戰。隨著應用復雜度增加，如何高效、安全地管理應用狀態變得至關重要。Immutable.js 是 Facebook 推出的一個 JavaScript 庫，它提供了持久化不可變數據結構，可以幫助開發者更好地管理應…

閱讀更多...

字符串數據類型的基本運算

字符串數據類型的基本運算

任務描述本關任務：從后臺輸入任意三個字符串，求最大的字符串。相關知識字符串本身是存放在一塊連續的內存空間中，并以’\0’作為字符串的結束標記。字符指針變量本身是一個變量，用于存放字符串的第 1 個字符的地址。字符數…

閱讀更多...

Ubuntu 22.04 一鍵部署openManus

Ubuntu 22.04 一鍵部署openManus

openManus 前言 OpenManus-RL，這是一個專注于基于強化學習（RL，例如 GRPO）的方法來優化大語言模型（LLM）智能體的開源項目，由來自UIUC 和 OpenManus 的研究人員合作開發。前提要求安裝deepseek docker方式安裝，windows 方式安裝，Linux安裝方式

閱讀更多...

PDF 轉圖片，一行代碼搞定！批量支持已上線！

PDF 轉圖片，一行代碼搞定！批量支持已上線！

大家好，我是程序員晚楓。今天我要給大家帶來一個超實用的功能——popdf 現在支持 PDF 轉圖片了，而且還能批量操作！是不是很激動？別急，我來手把手教你玩轉這個功能。 1. 一行代碼搞定單文件轉換 popdf 的核心就是簡單暴…

閱讀更多...

《比特城的機密郵件：加密、簽名與防篡改的守護之戰》

《比特城的機密郵件：加密、簽名與防篡改的守護之戰》

點擊下面圖片帶您領略全新的嵌入式學習路線 🔥爆款熱榜 88萬閱讀 1.6萬收藏第一章：風暴前的密令比特城的議會大廳內，首席長老艾德文握著一卷足有半人高的羊皮紙，眉頭緊鎖。紙上是即將頒布的《新紀元法典》——這份文件不僅內…

閱讀更多...

8.用戶管理專欄主頁面開發

8.用戶管理專欄主頁面開發

用戶管理專欄主頁面開發寫在前面用戶權限控制用戶列表接口設計主頁面開發前端account/Index.vuelangs/zh.jsstore.js 后端Paginator概述基本用法代碼示例屬性與方法 urls.pyviews.py 運行效果總結歡迎加入Gerapy二次開發教程專欄！ 本專欄專為新手開發者精心策劃了…

閱讀更多...

http://noi.openjudge.cn/_2.5基本算法之搜索_1804:小游戲

http://noi.openjudge.cn/_2.5基本算法之搜索_1804:小游戲

文章目錄題目深搜代碼寬搜代碼深搜數據演示圖總結題目 1804:小游戲總時間限制: 1000ms 內存限制: 65536kB 描述一天早上，你起床的時候想：“我編程序這么牛，為什么不能靠這個賺點小錢呢？”因此你決定編寫一個小游戲。游戲在一…

閱讀更多...

發生梯度消失, 梯度爆炸問題的原因，怎么解決?

發生梯度消失, 梯度爆炸問題的原因，怎么解決?

目錄一、梯度消失的原因二、梯度爆炸的原因三、共同的結構性原因四、解決辦法五、補充知識一、梯度消失的原因梯度消失指的是在反向傳播過程中，梯度隨著層數的增加指數級減小（趨近于0），導致淺層網絡的權重幾乎無法更新…

閱讀更多...

【USRP】srsRAN 開源 4G 軟件無線電套件

【USRP】srsRAN 開源 4G 軟件無線電套件

srsRAN 是SRS開發的開源 4G 軟件無線電套件。 srsRAN套件包括： srsUE - 具有原型 5G 功能的全棧 SDR 4G UE 應用程序srsENB - 全棧 SDR 4G eNodeB 應用程序srsEPC——具有 MME、HSS 和 S/P-GW 的輕量級 4G 核心網絡實現安裝系統 Ubuntu 20.04 USRP B210 sudo …

閱讀更多...

ChatGPT 4：解鎖AI文案、繪畫與視頻創作新紀元

ChatGPT 4：解鎖AI文案、繪畫與視頻創作新紀元

文章目錄一、ChatGPT 4的技術革新二、AI文案創作：精準生成與個性化定制三、AI繪畫藝術：從文字到圖像的神奇轉化四、AI視頻制作：自動化剪輯與創意實現五、知識庫與ChatGPT 4的深度融合六、全新的變革和機遇《ChatGPT 4 應用詳解：A…

閱讀更多...

在js中數組相關用法講解

在js中數組相關用法講解

數組 uniqueArray 簡單數組去重 /*** 簡單數組去重* param arr* returns*/ export const uniqueArray <T>(arr: T[]) > [...new Set(arr)];const arr1 [1,1,1,1 2, 3];uniqueArray(arr); // [1,2,3]uniqueArrayByKey 根據 key 數組去重 /*** 根據key數組去重* …

閱讀更多...

RT-Thread ulog 日志組件深度分析

RT-Thread ulog 日志組件深度分析

一、ulog 組件核心功能解析輕量化與實時性 ? 資源占用：ulog 核心代碼僅需 ROM<1KB，RAM<0.2KB，支持在資源受限的MCU（如STM32F103）中運行。 ? 異步/同步模式：默認采用異步環形緩沖區（rt_…

閱讀更多...

T113s3遠程部署Qt應用（dropbear）

T113s3遠程部署Qt應用（dropbear）

T113-S3 是一款先進的應用處理器，專為汽車和工業控制市場而設計。它集成了雙核CortexTM-A7 CPU和單核HiFi4 DSP，提供高效的計算能力。 T113-S3 支持 H.265、H.264、MPEG-1/2/4、JPEG、VC1 等全格式解碼。獨立的硬件編碼器可以編碼為 JPEG 或 MJPEG。集…

閱讀更多...

12.青龍面板自動化我的生活

12.青龍面板自動化我的生活

安裝 docker方式 docker run -dit \ -v /root/ql:/ql/data \ -p 5700:5700 \ -e ENABLE_HANGUPtrue \ -e ENABLE_WEB_PANELtrue \ --name qinglong \ --hostname qinglong \ --restart always \ whyour/qinglongk8s方式 https://truecharts.org/charts/stable/qinglong/ he…

閱讀更多...

Maven 遠程倉庫推送方法

Maven 遠程倉庫推送方法

步驟 1：配置 pom.xml 中的遠程倉庫地址在項目的 pom.xml 文件中添加 distributionManagement 配置，指定遠程倉庫的 URL。 xml 復制 <project>...<distributionManagement><snapshotRepository><id…

閱讀更多...

Spring Boot 日志配置 SLF4J 和 Logback

Spring Boot 日志配置 SLF4J 和 Logback

文章目錄一、前言二、案例一：初識日志三、案例二：使用Lombok輸出日志四、案例三：配置Logback 一、前言在開發 Java 應用時，日志記錄是不可或缺的一部分。日志可以記錄應用的運行狀態、錯誤信息和調試信息，幫助開發者…

閱讀更多...

JS API 事件監聽

JS API 事件監聽

焦點事件案例：搜索框激活下拉菜單事件對象事件對象存儲事件觸發時的相關信息可以判斷用戶按鍵，點擊元素等內容如何獲取事件綁定的回調函數中的第一個形參就是事件對象一般命名為e,event 事件對象常用屬性 type類型 click mouseenter client…

閱讀更多...

DDD與MVC擴展能力對比

DDD與MVC擴展能力對比

一、架構設計理念的差異二、擴展性差異的具體表現三、DDD擴展性優勢的深層原因四、MVC擴展性不足的典型場景五、總結：架構的本質與選擇六、例子1）場景描述2）MVC實現示例（三層架構）3）DDD實現示例&#xff08…

閱讀更多...

針對 SQL 查詢中 IN 子句性能優化以及等值 JOIN 和不等值 JOIN 對比的詳細解決方案、代碼示例及表格總結

針對 SQL 查詢中 IN 子句性能優化以及等值 JOIN 和不等值 JOIN 對比的詳細解決方案、代碼示例及表格總結

以下是針對 SQL 查詢中 IN 子句性能優化以及等值 JOIN 和不等值 JOIN 對比的詳細解決方案、代碼示例及表格總結： 問題 1：IN 的候選值過多（如超過 1000 個） 問題描述當 IN 列表中的值過多時，SQL 會逐個比較每個值…

閱讀更多...

手部穴位檢測技術：基于OpenCV和MediaPipe的實現

手部穴位檢測技術：基于OpenCV和MediaPipe的實現

手部穴位檢測是醫學和健康管理領域的重要技術之一。通過準確識別手部的關鍵穴位，可以為中醫診斷、康復治療以及健康監測提供支持。本文將介紹一種基于OpenCV和MediaPipe的手部穴位檢測方法，展示如何利用計算機視覺技術實現手部關鍵點的檢測，并進一步標注手部的穴位位置。技…

閱讀更多...

最新文章