DeepSeek-R1本地化部署(Mac)

一、下載?Ollama

本地化部署需要用到?Ollama,它能支持很多大模型。官方網站:https://ollama.com/

點擊 Download 即可,支持macOS,Linux 和 Windows;我下載的是 mac 版本,要求macOS 11 Big Sur or later,Ollama是跳轉到github去下載的,如果下載不了可能要借助科學上網。

下載的是個壓縮包,直接雙擊就可以解壓出Ollama.app,點擊運行即可安裝

安裝成功之后,ollama會在后臺運行,啟動命令行,輸入ollama

出現以上頁面即表示安裝成功

二、下載DeepSeek-R1

還是進入ollama.com的頁面,點擊Models

下載deepseek-r1,

deepseek-r1有很多個版本,1.5b,7b,8b,14b,32b,70b,671b,分別代表模型不同的參數數量。

  • B = Billion(十億參數):表示模型的參數量級,直接影響計算復雜度和顯存占用。
    • DeepSeek 1.5B:15億參數(小型模型,適合輕量級任務)
    • DeepSeek 7B:70億參數(主流規模,平衡性能與資源)
    • DeepSeek 70B:700億參數(高性能需求場景)
    • DeepSeek 671B:6710億參數(超大規模,對標PaLM/GPT-4)

每個版本對應所需的內存大小都不一樣,如果你電腦運行內存為8G那可以下載1.5b,7b,8b的蒸餾后的模型;如果你電腦運行內存為16G那可以下載14b的蒸餾后的模型,我這里選擇14b的模型。

使用ollama run deepseek-r1:14b 進行下載,在命令行里面輸入:

ollama run deepseek-r1:14b

使用ollama list 查看是否成功下載了模型

輸入ollama run deepseek-r1:14b運行模型,啟動成功后,就可以輸入我們想問的問題,模型首先會進行深度思考(也就是think標簽包含的地方),思考結束后會反饋我們問題的結果。在>>>之后輸入想要咨詢的 問題,模型回答的速度取決電腦的性能。

使用快捷鍵Ctrl + d 或者在>>>之后輸入?/bye即可退出對話模式。

## 刪除模型
ollama rm deepseek-r1:14b
## 停止模型
ollama stop deepseek-r1:14b

三、web頁面的訪問

我們通過ollama下載模型后,可以在命令行使用deepseek了,但是命令行的形式還是有些不友好,我們可以借助chatBox,或者Open-WebUI,只要接入ollama的Api就可以使用了。

1、Open-WebUI

Open WebUI是一個可擴展、功能豐富、用戶友好的自托管AI平臺,旨在完全離線運行。它支持各種LLM運行程序,如Ollama和OpenAI兼容的API,內置RAG推理引擎,使其成為一個強大的AI部署解決方案,本地需要安裝Python3(版本3.11~3.13以下)。

安裝 Open-WebUI需要使用pip進行安裝,安裝需要一定時間

pip install open-webui
### 如網絡太差,可以使用國內的鏡像下載
pip install open-webui -i http://mirrors.aliyun.com/pypi/simple/ --trusted-host mirrors.aliyun.com

如果 pip 版本較低,可以更新下

python3 -m pip install --upgrade pip

使用如下命令啟動open-webui服務,啟動需要一定時間

open-webui serve

后使用瀏覽器輸入http://127.0.0.1:8080/登錄服務,注意端口的占用沖突,頁面如下:

點擊開始使用,第一次使用需要注冊用戶名、郵件以及密碼,這都是存在本地的,可以放心填寫。

注冊完畢后,如果本地已經運行了deepseek-r1,它可以自動識別本地已經安裝的deepseek r1大模型,

在對話框里面輸入內容,即可與deepseek-r1展開對話

2、ChatBox

Chatbox AI 是一款 AI 客戶端應用和智能助手,支持眾多先進的 AI 模型和 API,可在 Windows、MacOS、Android、iOS、Linux 和網頁版上使用。

我這里下載的mac版本,成功安裝啟動后,點擊左下角的設置

模型提供方選擇Ollama API

模型選擇本地部署好的deepseek-r1:14b,點擊保存,即可以開始對話

最后:蒸餾模型不同規格的選擇,需要結合自己電腦的配置來選擇,不合適的模型會導致電腦過載,對話回答的速度和效果問題都會很差。我電腦內存16GB,以為14b能扛得住,結果安裝之后,對話巨慢!后面安裝了8b,運行起來速度就快多了,但是通過頁面的返回速度會變慢。

本文來自互聯網用戶投稿,該文觀點僅代表作者本人,不代表本站立場。本站僅提供信息存儲空間服務,不擁有所有權,不承擔相關法律責任。
如若轉載,請注明出處:http://www.pswp.cn/web/71750.shtml
繁體地址,請注明出處:http://hk.pswp.cn/web/71750.shtml
英文地址,請注明出處:http://en.pswp.cn/web/71750.shtml

如若內容造成侵權/違法違規/事實不符,請聯系多彩編程網進行投訴反饋email:809451989@qq.com,一經查實,立即刪除!

相關文章

支持向量簡要理解

決策方程符合感知機區分理論,我們基于線性代數來看這滿足子空間理論,可以獲取得到超平面。 支持向量機的目標是尋找最與超平面最近的點的最大距離,而距離計算如上,符合數學上計算點到線(面)的距離公式。 …

使用OpenCV和MediaPipe庫——實現人體姿態檢測

目錄 準備工作如何在Windows系統中安裝OpenCV和MediaPipe庫? 安裝Python 安裝OpenCV 安裝MediaPipe 驗證安裝 代碼邏輯 整體代碼 效果展示 準備工作如何在Windows系統中安裝OpenCV和MediaPipe庫? 安裝Python 可以通過命令行運行python --versio…

5G學習筆記之BWP

我們只會經歷一種人生,我們選擇的人生。 參考:《5G NR標準》、《5G無線系統指南:如微見著,賦能數字化時代》 目錄 1. 概述2. BWP頻域位置3. 初始與專用BWP4. 默認BWP5. 切換BWP 1. 概述 在LTE的設計中,默認所有終端均能處理最大2…

創建Electron35 + vue3 + electron-builder項目,有很過坑,記錄過程

環境: node v20.18.0 npm 11.1.0 用到的所有依賴: "dependencies": {"core-js": "^3.8.3","vue": "^3.2.13","vue-router": "^4.5.0"},"devDependencies": {"ba…

Linux下安裝elasticsearch(Elasticsearch 7.17.23)

Elasticsearch 是一個分布式的搜索和分析引擎,能夠以近乎實時的速度存儲、搜索和分析大量數據。它被廣泛應用于日志分析、全文搜索、應用程序監控等場景。 本文將帶你一步步在 Linux 系統上安裝 Elasticsearch 7.17.23 版本,并完成基本的配置&#xff0…

NVIDIA顯卡驅動、CUDA、cuDNN 和 TensorRT 版本匹配指南

一、驅動安裝 1、下載驅動 前往NVIDIA驅動下載頁,輸入顯卡型號和操作系統類型,選擇≥目標CUDA版本要求的驅動版本?。 2、安裝驅動? ?Windows?:雙擊安裝包按向導操作。?Linux?:建議使用apt或官方.run文件安裝?。 3、驗證…

plt和cv2有不同的圖像表示方式和顏色通道順序

在處理圖像時,matplotlib.pyplot (簡稱 plt) 和 OpenCV (簡稱 cv2) 有不同的圖像表示方式和顏色通道順序。了解這些區別對于正確處理和顯示圖像非常重要。 1. 圖像形狀和顏色通道順序 matplotlib.pyplot (plt) 形狀:plt 通常使用 (height, width, cha…

基于PyTorch的深度學習5——神經網絡工具箱

可以學習如下內容: ? 介紹神經網絡核心組件。 ? 如何構建一個神經網絡。 ? 詳細介紹如何構建一個神經網絡。 ? 如何使用nn模塊中Module及functional。 ? 如何選擇優化器。 ? 動態修改學習率參數。 5.1 核心組件 神經網絡核心組件不多,把這些…

模擬調制技術詳解

內容摘要 本文系統講解模擬調制技術原理及Matlab實現,涵蓋幅度調制的四種主要類型:雙邊帶抑制載波調幅(DSB-SC)、含離散大載波調幅(AM)、單邊帶調幅(SSB)和殘留邊帶調幅(…

aws(學習筆記第三十一課) aws cdk深入學習(batch-arm64-instance-type)

aws(學習筆記第三十一課) aws cdk深入學習 學習內容: 深入練習aws cdk下部署batch-arm64-instance-type 1. 深入練習aws cdk下部署batch-arm64-instance-type 代碼鏈接 代碼鏈接 代碼鏈接 -> batch-arm64-instance-type之前代碼學習 之前學習代碼鏈接 -> aw…

讀書報告」網絡安全防御實戰--藍軍武器庫

一眨眼,20天過去了,刷完了這本書「網絡安全防御實戰--藍軍武器庫」,回味無窮,整理概覽如下,可共同交流讀書心得。在閱讀本書的過程中,我深刻感受到網絡安全防御是一個綜合性、復雜性極高的領域。藍軍需要掌…

生成任務,大模型

一個生成項目 輸入:文字描述(但是給的數據集是一串數字,id,ct描述,醫生描述) 輸出:診斷報告 一、數據處理 import pandas as pd #處理表格數據pre_train_file "data/train.csv"tr…

Spring Boot API 項目中 HAProxy 與 Nginx 的選擇與實踐

在開發 Spring Boot 構建的 RESTful API 項目時,負載均衡和反向代理是提升性能與可用性的關鍵環節。HAProxy 和 Nginx 作為兩種流行的工具,經常被用于流量分發,但它們各有側重。究竟哪一個更適合你的 Spring Boot API 項目?本文將…

Java常用集合與映射的線程安全問題深度解析

Java常用集合與映射的線程安全問題深度解析 一、線程安全基礎認知 在并發編程環境下,當多個線程同時操作同一集合對象時,若未采取同步措施,可能導致以下典型問題: 數據競爭:多個線程同時修改數據導致結果不可預測狀…

DeepLabv3+改進6:在主干網絡中添加SegNext_Attention|助力漲點

??【DeepLabv3+改進專欄!探索語義分割新高度】 ?? 你是否在為圖像分割的精度與效率發愁? ?? 本專欄重磅推出: ? 獨家改進策略:融合注意力機制、輕量化設計與多尺度優化 ? 即插即用模塊:ASPP+升級、解碼器 PS:訂閱專欄提供完整代碼 目錄 論文簡介 步驟一 步驟二…

使用 Elastic-Agent 或 Beats 將 Journald 中的 syslog 和 auth 日志導入 Elastic Stack

作者:來自 Elastic TiagoQueiroz 我們在 Elastic 一直努力將更多 Linux 發行版添加到我們的支持矩陣中,現在 Elastic-Agent 和 Beats 已正式支持 Debian 12! 本文演示了我們正在開發的功能,以支持使用 Journald 存儲系統和身份驗…

3.9[A]csd

在傳統CPU中心架構中,中央處理器通過內存訪問外部存儲器,而數據必須經過網絡接口卡才能到達外部存儲器。這種架構存在集中式計算、DRAM帶寬和容量挑戰、大量數據移動(服務器內和網絡)以及固定計算導致工作負載容量增長等問題。 而…

ESP32S3讀取數字麥克風INMP441的音頻數據

ESP32S3 與 INMP441 麥克風模塊的集成通常涉及使用 I2S 接口進行數字音頻數據的傳輸。INMP441 是一款高性能的數字麥克風,它通過 I2S 接口輸出音頻數據。在 Arduino 環境中,ESP32S3 的開發通常使用 ESP-IDF(Espressif IoT Development Framew…

DeepSeek大模型 —— 全維度技術解析

DeepSeek大模型 —— 全維度技術解析 前些天發現了一個巨牛的人工智能學習網站,通俗易懂,風趣幽默,可以分享一下給大家。點擊跳轉到網站。 https://www.captainbed.cn/ccc 文章目錄 DeepSeek大模型 —— 全維度技術解析一、模型架構全景解析1…

[Kubernetes] 7控制平面組件

1. 調度 kube- scheduler what 負責分配調度pod到集群節點監聽kube-apiserver,查詢未分配node的pod根據調度策略分配這些pod(更新pod的nodename)需要考慮的因素: 公平調度,資源有效利用,QoS,affinity, an…