【DeepSeek】Ubuntu快速部署DeepSeek(Ollama方式)

文章目錄

  • 人人都該學習的DeepSeek
  • DeepSeek不同版本功能差異
  • DeepSeek與硬件直接的關系
  • DeepSeek系統兼容性
  • 部署方式選擇
  • 部署步驟(Ollama方式)
    • 1.選定適合的deepseek版本
    • 2.環境準備
    • 3.安裝Ollama
    • 4.部署deepseek
    • 5.測試使用

在這里插入圖片描述

人人都該學習的DeepSeek

DeepSeek 作為一款先進的人工智能工具,具備強大的推理能力和廣泛的應用場景,能夠幫助用戶高效解決復雜問題。它支持文本生成、代碼編寫、數據分析、情感分析等多種任務,適用于教育、醫療、金融、創意等各行各業。它的開源特性使得個人和企業能夠低成本地利用其功能,推動AI技術的普及。無論是提升工作效率、輔助學習,還是解決生活中的問題,DeepSeek 都能提供智能化支持。

DeepSeek不同版本功能差異

版本特點適用場景
?1.5B輕量級模型,參數量少,推理速度快,適合低資源環境。短文本生成、基礎問答、移動端應用(如簡單智能助手)。
?7B平衡型模型,性能與資源需求適中,支持中等復雜度任務。文案撰寫、表格處理、統計分析、簡單代碼生成。
?8B性能略強于7B,優化邏輯推理和代碼生成。代碼生成、邏輯推理(如數學題解決)、中等復雜度文本生成。
?14B高性能模型,擅長復雜任務(如數學推理、長文本生成)。數據分析、長文本生成(如研究報告)、多模態任務預處理。
?32B專業級模型,支持高精度任務和大規模數據處理。語言建模、金融預測、復雜病例分析(醫療場景)。
?70B頂級模型,多模態任務支持,科研級分析能力。高精度臨床決策(醫療)、多模態數據分析、前沿科學研究。
671B超大規模基礎模型,最高準確性和推理速度,支持國家級研究。氣候建模、基因組分析、通用人工智能探索。

注:671B是我們常說的滿血版deepseek。

?關鍵點

?1. 輸入輸出

  • ?短文本處理?(1.5B-7B):最大支持16k tokens,適合對話和短文生成。
  • ?長文本處理?(32B+):32k-10M tokens,可處理整本書籍或科研論文。
  • ?多模態支持:32B及以上版本實驗性支持圖文混合輸入,671B版本實現視頻流解析。

?2. 推理計算

  • ?數學能力:7B版本僅支持四則運算,32B版本可解微積分方程(準確率92%)。
  • ?代碼生成:7B生成單文件腳本,14B支持全棧項目架構設計(含單元測試)。

?3. 部署

  • ?量化支持:1.5B支持8-bit量化(體積壓縮至400MB),70B需保留FP16精度。
  • ?分布式訓練:70B版本支持千卡并行訓練(吞吐量1.2 exaFLOPs),671B版本兼容量子計算節點。

?

DeepSeek與硬件直接的關系

參數推薦顯卡型號顯存要求內存存儲適用場景
1.5BNVIDIA RTX 30604-8GB8GB+3GB+ SSD低資源設備部署、簡單對話
7BNVIDIA RTX 3070/40608GB+16GB+8GB+ NVMe SSD本地開發測試、中小型企業任務
8BNVIDIA RTX 30908GB+16GB+8GB+ NVMe SSD高精度輕量級任務
14BNVIDIA RTX 309016GB+32GB+15GB+ NVMe SSD企業級復雜任務、專業咨詢
32BNVIDIA A100 40GB24GB+64GB+30GB+ NVMe SSD高精度專業領域任務
70BNVIDIA A100 80GB 多卡≥40GB(多卡)128GB+70GB+ NVMe SSD企業級復雜任務處理、科研
671BNVIDIA H100/HGX 集群640GB(8卡并行)512GB+400GB+ NVMe SSD超大規模科研計算、國家級項目

注:32B是一個分水嶺,從該版本開始對硬件要求開始急速升高。

DeepSeek系統兼容性

操作系統兼容性與性能問題與風險工具與部署建議
Windows支持輕量級至中型模型(如7B-32B量化版)底層架構限制可能導致閃退或延遲,需關閉后臺程序、更新顯卡驅動推薦使用Ollama進行一鍵部署,結合任務管理器監控資源占用,性能較Linux低10%-15%
Linux適配全版本模型(含70B+超算級部署)需注意安全防護(88.9%未防護服務器存在漏洞風險)通過LMDeploy優化推理速度,SGLang實現多模型協同,建議Ubuntu系統,性能最優 且支持分布式計算
Mac僅支持1.5B-8B輕量模型,依賴M系列芯片NPU加速(如M2 Ultra)模型選擇受限,復雜任務響應延遲顯著(生成速度約2-3 tokens/秒)必須通過Ollama進行4-bit量化壓縮,優先使用Metal框架加速

注:部署時Linux系統最優。

部署方式選擇

  1. 優先選 Ollama 的場景
    • 快速原型開發、個人項目測試
    • 硬件資源有限(如無高端 GPU)
    • 無需復雜參數調優
  2. 優先選直接部署的場景
    • 企業級服務需高并發、低延遲響應
    • 需定制模型或優化底層計算(如 FP8 加速、MOE 負載均衡)
    • 對數據隱私和合規性要求極高

部署步驟(Ollama方式)

1.選定適合的deepseek版本

按照自己的需求選取合適的deepseek版本,可參照上文的表格內容。
選擇的依據主要是:

  • 使用場景
  • 功能需要
  • 硬件限制
  • 成本要求

2.環境準備

準備好Ubuntu系統,deepseek推薦使用Ubuntu20.04及以上版本。當前示例使用的是Ubuntu18.04版本。

當前配置情況:

  • CPU:16核心
  • 內存:64Gb
  • 硬盤:128Gb
  • GPU:RTX 4090

顯卡驅動準備
準備好裸機后首先更新系統:

sudo add-apt-repository ppa:graphics-drivers/ppa #18.04版本較舊,需要加上新的驅動
sudo apt update && sudo apt upgrade -y  # 更新系統包
sudo apt install nvidia-driver-535  # 安裝NVIDIA驅動

安裝好顯卡驅動后,確認顯卡運行情況:

nvidia-smi

如圖所示是驅動完成。
在這里插入圖片描述

CUDA環境準備

sudo apt update
sudo apt install nvidia-cuda-toolkit

3.安裝Ollama

安裝Ollama:

curl -fsSL https://ollama.ai/install.sh | sh  # 執行官方安裝腳本

啟用Ollama:

sudo systemctl start ollama  # 啟動服務
ollama --version  # 輸出版本號即成功

可能的問題:

1.如果下載Ollama網絡慢導致異常中斷,可能如下所示:

curl: (16) Error in the HTTP2 framing layer
gzip: stdin: unexpected end of file
tar: Child returned status 1
tar: Error is not recoverable: exiting now

解決方案:

curl -fsSL https://ollama.com/install.sh -o ollama_install.sh
sed -i 's|https://ollama.com/download/ollama-linux|https://gh.llkk.cc/https://github.com/ollama/ollama/releases/download/v0.5.7/ollama-linux|g' ollama_install.sh
chmod +x ollama_install.sh
sudo ./ollama_install.sh

4.部署deepseek

ollama pull deepseek-r1:14b  # 下載14B參數版本

整個過程需要一些時間:
在這里插入圖片描述
在這里插入圖片描述

5.測試使用

測試deepseek運行情況:

ollama run deepseek-r1:14b

在這里插入圖片描述

本文來自互聯網用戶投稿,該文觀點僅代表作者本人,不代表本站立場。本站僅提供信息存儲空間服務,不擁有所有權,不承擔相關法律責任。
如若轉載,請注明出處:http://www.pswp.cn/diannao/72661.shtml
繁體地址,請注明出處:http://hk.pswp.cn/diannao/72661.shtml
英文地址,請注明出處:http://en.pswp.cn/diannao/72661.shtml

如若內容造成侵權/違法違規/事實不符,請聯系多彩編程網進行投訴反饋email:809451989@qq.com,一經查實,立即刪除!

相關文章

redis熱key

在 Redis 中,熱 Key(Hot Key) 是指被頻繁訪問的 Key,可能會導致以下問題: 性能瓶頸:單個 Redis 實例的 CPU 或網絡帶寬被耗盡。 數據傾斜:在 Redis 集群中,熱 Key 可能導致某個節點…

宇樹科技嵌入式面試題及參考答案(春晚機器人的公司)

目錄 設計一個帶看門狗(Watchdog)的嵌入式系統,描述故障恢復流程 在資源受限的 MCU 上實現 OTA 升級功能,描述關鍵設計點 如何實現 OTA(空中升級)功能?描述固件校驗和回滾機制的設計要點 推挽輸出與開漏輸出的區別?舉例說明其在 GPIO 控制中的應用 UART、SPI、I2C …

Axure常用變量及使用方法詳解

點擊下載《Axure常用變量及使用方法詳解.pdf》 摘要 Axure RP 作為一款領先的前端原型設計工具,提供了全面的 變量 和 函數 系統,以支持復雜的交互設計和動態內容展示。本文將從專業角度詳細解析 Axure 中的 全局變量、中繼器數據集變量/函數、元件變量…

SpringBoot - 用責任鏈模式實現業務編排

文章目錄 前因責任鏈:像工作臺一樣組織代碼CodeSEQ3.1 定義處理器規范3.2 實現具體處理器3.3 共享上下文3.4 組裝責任鏈 適用場景優勢 前因 2000多行的業務邏輯里,各種校驗規則、促銷計算、庫存操作像意大利面條一樣纏繞在一起。最要命的是這樣的代碼結…

upload-labs詳解(13-20)文件上傳分析

目錄 upload-labs-env upload-labs-env第十三關 文件包含漏洞 代碼 測試 上傳一個.jpg圖片 上傳一個.png文件 上傳一個.gif圖片 upload-labs-env第十四關 代碼 思路 upload-labs-env第十五關 代碼 思路 upload-labs-env第十六關 代碼 思路 測試 上傳gif格式…

網絡安全通信架構圖

🍅 點擊文末小卡片 ,免費獲取網絡安全全套資料,資料在手,漲薪更快 在安全通信里面我經常聽到的2個東西就是SSL和TLS,這2個有什么區別呢?以及HTTPS是怎么通信的?包括對稱加密、非對稱加密、摘要、…

Java中的String類

目錄 1. String類的重要性 2. 常用方法 2.1 字符串構造 2.2 String對象的比較 2.3 字符串查找 2.4 轉化 2.5 字符串替換 2.6 字符串拆分 2.7 字符串截取 2.8 其他操作方法 2.9 字符串的不可變性 2.10 字符串修改 3. StringBuilder和StringBuffer 3.1 StringBuilde…

深度分頁介紹及優化建議

深度分頁介紹 查詢偏移量過大的場景我們稱為深度分頁,這會導致查詢性能較低,例如: # MySQL 在無法利用索引的情況下跳過1000000條記錄后,再獲取10條記錄 SELECT * FROM t_order ORDER BY id LIMIT 1000000, 10 深度分頁問題的原…

live555推流服務器異常

1.后端異常信息: MultiFramedRTPSink::afterGettingFrame1(): The input frame data was too large for our buffer size (100176). 48899 bytes of trailing data was dropped! Correct this by increasing "OutPacketBuffer::maxSize" to at least m…

每日OJ_牛客_宵暗的妖怪_DP_C++_Java

目錄 牛客_宵暗的妖怪_DP 題目解析 C代碼 Java代碼 牛客_宵暗的妖怪_DP 宵暗的妖怪 描述: 露米婭作為宵暗的妖怪,非常喜歡吞噬黑暗。這天,她來到了一條路上,準備吞噬這條路上的黑暗。這條道路一共被分為n 部分&…

20250306-筆記-精讀class CVRPEnv:step(self, selected)

文章目錄 前言一、if self.time_step<4:控制時間步的遞增判斷是否在配送中心特定時間步的操作更新更新當前節點和已選擇節點列表更新需求和負載更新訪問標記更新負無窮掩碼更新步驟狀態&#xff0c;將更新后的狀態同步到 self.step_state 二、使用步驟總結 前言 class CVRP…

Flowable 基本入門

flowable.7z官方版下載丨最新版下載丨綠色版下載丨APP下載-123云盤 1、Flowable介紹 Flowable是BPMN的一個基于java的軟件實現&#xff0c;不過Flowable不僅僅包括BPMN&#xff0c;還有DMN決策表和CMMN Case管理引擎&#xff0c;并且有自己的用戶管理、微服務API等一系列功能&a…

完全背包-一維數組

52. 攜帶研究材料&#xff08;第七期模擬筆試&#xff09; 題目描述 小明是一位科學家&#xff0c;他需要參加一場重要的國際科學大會&#xff0c;以展示自己的最新研究成果。他需要帶一些研究材料&#xff0c;但是他的行李箱空間有限。這些研究材料包括實驗設備、文獻資料和…

景聯文科技:以專業標注賦能AI未來,驅動智能時代的精準躍遷

在人工智能技術重塑全球產業格局的今天&#xff0c;高質量訓練數據已成為驅動算法進化的核心燃料。作為數據智能服務領域的領軍者&#xff0c;景聯文科技深耕數據標注行業多年&#xff0c;以全棧式數據解決方案為核心&#xff0c;構建起覆蓋數據采集、清洗、標注、質檢及算法調…

洛谷B2074 計算星期幾

B2074 計算星期幾 - 洛谷 代碼區&#xff1a; #include<algorithm> #include<iostream> #include<unordered_map> #include<string> using namespace std; int main() {unordered_map<int, string> m { { 1,"Monday" },{2,"Tue…

協同過濾推薦算法+微信小程序的農產品團購推薦平臺(程序+論文+講解+安裝+調試+售后)

感興趣的可以先收藏起來&#xff0c;還有大家在畢設選題&#xff0c;項目以及論文編寫等相關問題都可以給我留言咨詢&#xff0c;我會一一回復&#xff0c;希望幫助更多的人。 系統介紹 在當今時代&#xff0c;科學技術正以令人矚目的速度迅猛進步&#xff0c;經濟社會也隨之…

十大經典排序算法簡介

一 概述 本文對十大經典排序算法做簡要的總結(按常用分類方式排列),包含核心思想、時間/空間復雜度及特點。 二、比較類排序 1. 冒泡排序 (BUBBLE SORT) 思想:重復交換相鄰逆序元素,像氣泡上浮 復雜度: 時間:O(n^2)(最好情況O(n)) 空間:O(1) 特點:簡單但效率低,穩…

[自然語言處理]pytorch概述--什么是張量(Tensor)和基本操作

pytorch概述 PyTorch 是?個開源的深度學習框架&#xff0c;由 Facebook 的??智能研究團隊開發和維護&#xff0c;于2017年在GitHub上開源&#xff0c;在學術界和?業界都得到了?泛應? pytorch能做什么 GPU加速自動求導常用網絡層 pytorch基礎 量的概念 標量&#xf…

Spring統一格式返回

目錄 一&#xff1a;統一結果返回 1&#xff1a;統一結果返回寫法 2&#xff1a;String類型報錯問題 解決方法 二&#xff1a;統一異常返回 統一異常返回寫法 三&#xff1a;總結 同志們&#xff0c;今天咱來講一講統一格式返回啊&#xff0c;也是好久沒有講過統一格式返…

【無標題】四色拓撲模型與宇宙歷史重構的猜想框架

### 四色拓撲模型與宇宙歷史重構的猜想框架 --- #### **一、理論基礎&#xff1a;四色拓撲與時空全息原理的融合** 1. **宇宙背景信息的拓撲編碼** - **大尺度結構網絡**&#xff1a;將星系團映射為四色頂點&#xff0c;纖維狀暗物質結構作為邊&#xff0c;構建宇宙尺度…