DeepSeek-R1 本地部署教程(超簡版)

文章目錄

  • 一、DeepSeek相關網站
  • 二、DeepSeek-R1硬件要求
  • 三、本地部署DeepSeek-R1
    • 1. 安裝Ollama
      • 1.1 Windows
      • 1.2 Linux
      • 1.3 macOS
    • 2. 下載和運行DeepSeek模型
    • 3. 列出本地已下載的模型
  • 四、Ollama命令大全
  • 五、常見問題解決
  • 附:DeepSeek模型資源


一、DeepSeek相關網站

官方網站:DeepSeek

開源模型:https://huggingface.co/deepseek-ai

GitHub地址:https://github.com/deepseek-ai

接口文檔:首次調用 API | DeepSeek API 文檔

二、DeepSeek-R1硬件要求

以下是 DeepSeek-R1 系列模型在不同規模下的硬件需求(以 Q4_K_M 量化 為例)。這些需求是估算值,實際需求可能因實現方式和上下文長度而有所不同:

模型規模顯存需求 (Q4_K_M)硬件需求說明
1.5B~1.5 GB輕量級,適合大多數消費級 GPU(如 GTX 1060 以上)
7B4.7 GB示例數據(Q4_K_M 量化),需要中端 GPU(如 RTX 3060)
8B~5.4 GB略高于 7B,適合 RTX 3060/3070
14B~9.4 GB需要高端消費級 GPU(如 RTX 3080/3090)
32B~21.5 GB需要專業級 GPU(如 A100 或 3090 24GB)
70B~47 GB通常需要多 GPU 或 云服務器(如 A100 40GB)
671B~450 GB僅適合分布式系統或超大規模集群

說明:

  1. 量化方式:假設使用 4-bit 量化(Q4_K_M),顯存需求較低。如果使用 FP16/32,顯存需求會大幅增加(如 7B FP16 需要約 14 GB)。

  2. 硬件建議
    1.5B-14B:適合消費級 GPU,如 RTX 3060/3080。
    32B-70B:需要專業級 GPU 或多 GPU 并行。
    671B:僅適合超大規模集群或分布式系統。

  3. 上下文長度:長上下文會進一步增加顯存需求,建議根據實際場景調整硬件配置。

如果需要更高精度(如 FP16/32)的顯存需求,可以按比例估算(FP16 約為 Q4_K_M 的 4 倍)

三、本地部署DeepSeek-R1

1. 安裝Ollama

https://ollama.com/download

根據你的操作系統選擇安裝方式:

在這里插入圖片描述

1.1 Windows

  1. 訪問 https://ollama.com/download/windows 下載Windows安裝程序。
  2. 雙擊安裝,完成后在命令行輸入 ollama 驗證。

1.2 Linux

curl -fsSL https://ollama.ai/install.sh | sh

1.3 macOS

方式1:直接下載安裝,訪問 https://ollama.com/download/mac 下載macOS安裝包,雙擊安裝。

方式2:Homebrew 安裝

brew install ollama

2. 下載和運行DeepSeek模型

訪問 ollama 網站 deepseek-r1 各個版本:https://ollama.com/library/deepseek-r1

在這里插入圖片描述

選擇電腦符合條件的模型規模,復制命令。

  • 方式一:直接運行

以使用70b為例,打開命令行粘貼或輸入:

ollama run deepseek-r1:70b

在這里插入圖片描述

當我們沒有該模型時會自動下載并運行,如果已經下載完成,運行該命令則直接啟動。

運行后出現以下提示表示成功:

>>> Send a message (/? for help)

  • 方式二:下載并部署

拉取的過程后面可能會很慢,對于 linux 和 mac 使用掛在后臺拉取:

nohup ollama pull deepseek-r1:70b &

3. 列出本地已下載的模型

ollama list

在這里插入圖片描述

四、Ollama命令大全

命令描述示例
ollama run [model-name]啟動模型并與之交互ollama run deepseek-r1:7b
ollama list列出本地已下載的模型ollama list
ollama pull [model-name]從模型庫中下載一個模型ollama pull deepseek-r1:7b
ollama rm [model-name]刪除本地的一個模型ollama rm deepseek-r1:7b
ollama show [model-name]查看某個模型的詳細信息ollama show deepseek-r1:7b
ollama serve啟動 Ollama 服務ollama serve
ollama stop停止 Ollama 服務ollama stop
ollama logs查看 Ollama 的日志信息ollama logs
ollama create [model-name] -f [config-file]使用自定義的模型配置文件創建模型ollama create deepseek-r1:7b -f ./my-model-config.yaml
ollama export [model-name] [output-file]導出模型為文件ollama export deepseek-r1:7b ./llama2-model.tar
ollama import [input-file]從文件導入模型ollama import ./llama2-model.tar
ollama version查看 Ollama 的版本信息ollama version
ollama --help查看所有可用的命令及其說明ollama --help

五、常見問題解決

  • 模型不存在?
    確認模型名稱正確,或訪問DeepSeek官網獲取最新模型名稱。
  • 網絡問題
    配置代理(Linux/macOS):
    export HTTP_PROXY=http://127.0.0.1:7890
    export HTTPS_PROXY=http://127.0.0.1:7890

附:DeepSeek模型資源

  • DeepSeek-R1:https://github.com/deepseek-ai/DeepSeek-R1
  • 官方模型庫:https://huggingface.co/deepseek-ai
  • Ollama文檔:https://github.com/ollama/ollama

本文來自互聯網用戶投稿,該文觀點僅代表作者本人,不代表本站立場。本站僅提供信息存儲空間服務,不擁有所有權,不承擔相關法律責任。
如若轉載,請注明出處:http://www.pswp.cn/web/67834.shtml
繁體地址,請注明出處:http://hk.pswp.cn/web/67834.shtml
英文地址,請注明出處:http://en.pswp.cn/web/67834.shtml

如若內容造成侵權/違法違規/事實不符,請聯系多彩編程網進行投訴反饋email:809451989@qq.com,一經查實,立即刪除!

相關文章

JVM運行時數據區域-附面試題

Java虛擬機在執行Java程序的過程中會把它所管理的內存劃分為若干個不同的數據區域。這些區域 有各自的用途,以及創建和銷毀的時間,有的區域隨著虛擬機進程的啟動而一直存在,有些區域則是 依賴用戶線程的啟動和結束而建立和銷毀。 1. 程序計…

什么是LPU?會打破全球算力市場格局嗎?

在生成式AI向垂直領域縱深發展的關鍵節點,一場靜默的芯片革命正在改寫算力規則。Groq研發的LPU(Language Processing Unit)憑借其顛覆性架構,不僅突破了傳統GPU的性能天花板,更通過與DeepSeek等國產大模型的深度協同&a…

如何構建ObjC語言編譯環境?構建無比簡潔的clang編譯ObjC環境?Windows搭建Swift語言編譯環境?

如何構建ObjC語言編譯環境? 除了在線ObjC編譯器,本地環境Windows/Mac/Linux均可以搭建ObjC編譯環境。 Mac自然不用多說,ObjC是親兒子。(WSL Ubuntu 22.04) Ubuntu可以安裝gobjc/gnustep和gnustep-devel構建編譯環境。 sudo apt-get install gobjc gnus…

2月3日星期一今日早報簡報微語報早讀

2月3日星期一,農歷正月初六,早報#微語早讀。 1、多個景區發布公告:售票數量已達上限,請游客合理安排行程; 2、2025春節檔總票房破70億,《哪吒之魔童鬧海》破31億; 3、美宣布對中國商品加征10…

DeepSeek 原理解析:與主流大模型的差異及低算力優勢

在人工智能大模型蓬勃發展的浪潮中,DeepSeek 以其獨特的技術路線和出色的性能表現脫穎而出。與主流大模型相比,DeepSeek 不僅在技術原理上有著顯著的差異,還展現出了在較低算力下達到 OpenAI API 水平的卓越能力。本文將深入剖析這些獨特之處…

C++ Primer 標準庫vector

歡迎閱讀我的 【CPrimer】專欄 專欄簡介:本專欄主要面向C初學者,解釋C的一些基本概念和基礎語言特性,涉及C標準庫的用法,面向對象特性,泛型特性高級用法。通過使用標準庫中定義的抽象設施,使你更加適應高級…

【Numpy核心編程攻略:Python數據處理、分析詳解與科學計算】2.6 廣播機制核心算法:維度擴展的數學建模

2.6 廣播機制核心算法:維度擴展的數學建模 目錄/提綱 #mermaid-svg-IfELXmhcsdH1tW69 {font-family:"trebuchet ms",verdana,arial,sans-serif;font-size:16px;fill:#333;}#mermaid-svg-IfELXmhcsdH1tW69 .error-icon{fill:#552222;}#mermaid-svg-IfELXm…

【Elasticsearch】硬件資源優化

🧑 博主簡介:CSDN博客專家,歷代文學網(PC端可以訪問:https://literature.sinhy.com/#/?__c1000,移動端可微信小程序搜索“歷代文學”)總架構師,15年工作經驗,精通Java編…

bootstrap.yml文件未自動加載問題解決方案

在添加bootstrap.yml文件后,程序未自動掃描到,即圖標是這樣的: 查了一些資料,是缺少bootstrap相關依賴,雖然已經添加了spring-cloud-context依賴,但是這個依賴并未引入bootstrap依賴,可能是版本問題,需要手動引入 <dependency><groupId>org.springframework.cloud&…

C++底層學習預備:模板初階

文章目錄 1.編程范式2.函數模板2.1 函數模板概念2.2 函數模板原理2.3 函數模板實例化2.3.1 隱式實例化2.3.2 顯式實例化 2.4 模板參數的匹配原則 3.類模板希望讀者們多多三連支持小編會繼續更新你們的鼓勵就是我前進的動力&#xff01; 進入STL庫學習之前我們要先了解有關模板的…

【玩轉 Postman 接口測試與開發2_015】第12章:模擬服務器(Mock servers)在 Postman 中的創建與用法(含完整實測效果圖)

《API Testing and Development with Postman》最新第二版封面 文章目錄 第十二章 模擬服務器&#xff08;Mock servers&#xff09;在 Postman 中的創建與用法1 模擬服務器的概念2 模擬服務器的創建2.1 開啟側邊欄2.2 模擬服務器的兩種創建方式2.3 私有模擬器的 API 秘鑰的用法…

【算法】回溯算法專題③ ——排列型回溯 python

目錄 前置小試牛刀回歸經典舉一反三總結 前置 【算法】回溯算法專題① ——子集型回溯 python 【算法】回溯算法專題② ——組合型回溯 剪枝 python 小試牛刀 全排列 https://leetcode.cn/problems/permutations/description/ 給定一個不含重復數字的數組 nums &#xff0c;返…

8.原型模式(Prototype)

動機 在軟件系統中&#xff0c;經常面臨著某些結構復雜的對象的創建工作&#xff1b;由于需求的變化&#xff0c;這些對象經常面臨著劇烈的變化&#xff0c;但是它們卻擁有比較穩定一致的接口。 之前的工廠方法和抽象工廠將抽象基類和具體的實現分開。原型模式也差不多&#…

LabVIEW如何高頻采集溫度數據?

在LabVIEW中進行高頻溫度數據采集時&#xff0c;選擇合適的傳感器&#xff08;如熱電偶或熱電阻&#xff09;和采集硬件是關鍵。下面是一些建議&#xff0c;幫助實現高效的溫度數據采集&#xff1a; 1. 傳感器選擇&#xff1a; 熱電偶&#xff08;Thermocouple&#xff09;&am…

Kotlin 委托詳解

Kotlin 委托詳解 引言 Kotlin 作為一種現代化的編程語言&#xff0c;在 Android 開發等領域得到了廣泛的應用。在 Kotlin 中&#xff0c;委托&#xff08;Delegation&#xff09;是一種強大的特性&#xff0c;它可以讓我們以更簡潔的方式實現代碼的復用和擴展。本文將詳細解析…

npm 和 pip 安裝中常見問題總結

安裝路徑的疑惑&#xff1a;NPM 和 PIP 的安裝機制 NPM 安裝路徑規則&#xff1a; 依賴安裝在項目目錄下&#xff1a; 當你運行 npm install --save-dev jest&#xff0c;它會在當前目錄&#xff08;例如 F:\&#xff09;下創建一個 node_modules 文件夾&#xff0c;把 jest 安…

人工智能:農業領域的變革力量

在當今科技飛速發展的時代&#xff0c;人工智能正以前所未有的態勢滲透進各個領域&#xff0c;農業也不例外。想象一下&#xff0c;未來的農田里&#xff0c;農民不再是彎腰勞作的形象&#xff0c;而是坐在高科技的“智能農場”里&#xff0c;悠閑地喝著咖啡&#xff0c;指揮著…

LLM的Deep Research功能:重構人類認知與創新的新范式

在人工智能迅速發展的今天&#xff0c;大語言模型&#xff08;LLM&#xff09;的deep research功能正在成為重構人類認知方式的關鍵力量。 這一突破性的技術進展不僅帶來了工具層面的革新&#xff0c;更深刻地觸及了人類認知能力的本質。 本文將從認知科學的視角出發&#xf…

【Cadence仿真技巧學習筆記】求解65nm庫晶體管參數un, e0, Cox

在設計放大器的第一步就是確定好晶體管參數和直流工作點的選取。通過閱讀文獻&#xff0c;我了解到L波段低噪聲放大器的mos器件最優寬度計算公式為 W o p t . p 3 2 1 ω L C o x R s Q s p W_{opt.p}\frac{3}{2}\frac{1}{\omega LC_{ox}R_{s}Q_{sp}} Wopt.p?23?ωLCox?Rs…

前端力扣刷題 | 6:hot100之 矩陣

73. 矩陣置零 給定一個 m x n 的矩陣&#xff0c;如果一個元素為 0 &#xff0c;則將其所在行和列的所有元素都設為 0 。請使用 原地 算法。 法一&#xff1a; var setZeroes function(matrix) {let setX new Set(); // 用于存儲需要置零的行索引let setY new Set(); //…