Ollama本地部署deepseek-r1蒸餾版

Ollama本地部署deepseek-r1蒸餾版

news/2025/9/14 15:31:49/文章來源:https://blog.csdn.net/hbkybkzw/article/details/146216662

Docker安裝Ollama

拉取鏡像
```
docker pull ollama/ollama
```
?
啟動-使用GPU
```
docker run -d --gpus=all -p 11434:11434 --name ollama ollama/ollama
```
1. docker run : Docker 的核心命令，用于創建并啟動一個新的容器。
2. -d : 后臺模式（detached mode），容器將在后臺運行，不會阻塞當前終端。
3. --gpus=all : 啟用 NVIDIA GPU 支持，指定使用所有可用的 GPU。
  
  --gpus：啟用 GPU 支持。
  
  all：使用所有可用的 GPU。也可以指定特定的 GPU，例如 --gpus=gpu-0,gpu-1。
4. -p 11434:11434 ：端口映射，將容器內的端口映射到宿主機的端口。
  
  格式為 -p <宿主機端口>:<容器端口>。
  
  在此命令中，將容器的 11434 端口映射到宿主機的 11434 端口，可通過 localhost:11434 訪問容器內的服務。
5. --name ollama ：為容器指定名稱，此處將容器命名為 ollama。如果不指定，Docker 會自動生成一個隨機名稱。
6. ollama/ollama ：指定使用的 Docker 鏡像名稱，ollama/ollama 是 Ollama 的官方鏡像，從 Docker Hub 拉取，就是我們剛剛拉取的。

啟動-使用CPU

docker run -d  -p 11434:11434 --name ollama ollama/ollama

? 下面的是用GPU的

查看ollama是否啟動成功

在本機瀏覽器中輸入

http://127.0.0.1:11434

顯示 Ollama is running 則為啟動成功
查看ollama支持的模型

https://ollama.com/library

在這個里面可以看到所有支持的模型，比如搜索deepseek-r1, 如下圖，最后一個箭頭就是在ollama中運行deepseekr1-1.5b的命令。備注：deepseekr1-1.5b是deepseekr1在qwen2.5-1.5b的蒸餾版本。

?
進入ollama容器中
```
docker exec -it ollama /bin/bash
```
下載模型

使用剛剛復制的命令
```
ollama run deepseek-r1:1.5b
```
如果之前沒有，那么第一次使用會先下載模型，等待下載完畢即可使用

?
在本地可以使用chatbox，或者openwebui，或者cherrystudio等等接入ollama的模型，下面以cherrystudio為例子示范一下

?

點擊管理，會自動識別出已有的大模型（比如我們剛剛下載的deepseekr1-1.5b）

?

檢查

?

顯示連接成功

?

切換到聊天，新建聊天窗口，切換模型，開始聊天

?

可以看到正常返回了。

本文來自互聯網用戶投稿，該文觀點僅代表作者本人，不代表本站立場。本站僅提供信息存儲空間服務，不擁有所有權，不承擔相關法律責任。
如若轉載，請注明出處：http://www.pswp.cn/news/897597.shtml
繁體地址，請注明出處：http://hk.pswp.cn/news/897597.shtml
英文地址，請注明出處：http://en.pswp.cn/news/897597.shtml

如若內容造成侵權/違法違規/事實不符，請聯系多彩編程網進行投訴反饋email:809451989@qq.com，一經查實，立即刪除！

相關文章

41.HarmonyOS NEXT Layout布局組件系統詳解（八）：自定義樣式與類

41.HarmonyOS NEXT Layout布局組件系統詳解（八）：自定義樣式與類

溫馨提示：本篇博客的詳細代碼已發布到 git : https://gitcode.com/nutpi/HarmonyosNext 可以下載運行哦！ HarmonyOS NEXT Layout 布局組件系統詳解（八）：自定義樣式與類文章目錄 HarmonyOS NEXT Layout 布局組件系統詳…

閱讀更多...

【Go | 從0實現簡單分布式緩存】-7：增加etcd和gRPC功能

【Go | 從0實現簡單分布式緩存】-7：增加etcd和gRPC功能

本文目錄 1.序2.引入etcd緩存流程項目結構 3.gocachepb.proto4.服務注冊register.go5.服務發現discover.go6.gRPC客戶端client.gopeers.goclient.go 7.gRPC服務端實現server.go一些問題緩存獲取流程緩存設置流程為什么要帶超時的上下文？ 1.序 GeeCache項目并沒有引…

閱讀更多...

Pytorch系列教程：可視化Pytorch模型訓練過程

Pytorch系列教程：可視化Pytorch模型訓練過程

深度學習和理解訓練過程中的學習和進步機制對于優化性能、診斷欠擬合或過擬合等問題至關重要。將訓練過程可視化的過程為學習的動態提供了有價值的見解，使我們能夠做出合理的決策。訓練進度必須可視化的兩種方法是：使用Matplotlib和Tensor Board。在本文…

閱讀更多...

18 | 實現簡潔架構的 Handler 層

18 | 實現簡潔架構的 Handler 層

提示： 所有體系課見專欄：Go 項目開發極速入門實戰課；歡迎加入我的訓練營：云原生AI實戰營，一個助力 Go 開發者在 AI 時代建立技術競爭力的實戰營；本節課最終源碼位于 fastgo 項目的 feature/s14 分支&#x…

閱讀更多...

藍隊第三次

藍隊第三次

1.了解什么是盲注盲注（Blind SQL Injection）是SQL注入的一種形式，攻擊者無法直接通過頁面回顯或錯誤信息獲取數據，而是通過觀察頁面的布爾狀態（真/假）或時間延遲來間接推斷數據庫信息。例如，通…

閱讀更多...

sql server 2016 版本補丁說明

sql server 2016 版本補丁說明

包信息和發布類型 Microsoft為創建和分發的 SQL Server 的所有軟件更新包采用了標準化命名架構。軟件更新包是一個可執行文件（.exe 或 .msi）文件，其中包含一個或多個文件，這些文件可能應用于 SQL Server 安裝以更正特定問題。 …

閱讀更多...

STM32之I2C硬件外設

STM32之I2C硬件外設

注意：硬件I2C的引腳是固定的 SDA和SCL都是復用到外部引腳。 SDA發送時數據寄存器的數據在數據移位寄存器空閑的狀態下進入數據移位寄存器，此時會置狀態寄存器的TXE為1，表示發送寄存器為空，然后往數據控制寄存器中一位一位的移送數…

閱讀更多...

從青銅到王者：六大排序算法實戰解析

從青銅到王者：六大排序算法實戰解析

前言在編程的世界里，排序算法如同一顆璀璨的明珠，閃耀著智慧的光芒。它不僅是計算機科學的基礎知識點，更是每一位程序員必備的技能。今天，就讓我們一同走進排序算法的世界，深入探究冒泡排序、選擇排序、插入排序、快速排序、歸并排序、堆排序這六大經典算法的精髓所在，…

閱讀更多...

小程序配置webview

小程序配置webview

1.在微信公眾平臺配置業務域名 1）包括把校驗文件放在服務器根目錄 2）配置域名 2.在小程序中新建文件小程序新建頁面：web-view json配置：{ "pageOrientation": "landscape", "renderer":&qu…

閱讀更多...

不用 Tomcat？SpringBoot 項目用啥代替？

不用 Tomcat？SpringBoot 項目用啥代替？

在SpringBoot框架中，我們使用最多的是Tomcat，這是SpringBoot默認的容器技術，而且是內嵌式的Tomcat。同時，SpringBoot也支持Undertow容器，我們可以很方便的用Undertow替換Tomcat，而Undertow的性能和內存使…

閱讀更多...

線索二叉樹構造及遍歷算法

線索二叉樹構造及遍歷算法

線索二叉樹構造以及遍歷算法線索二叉樹（中序遍歷版）構造線索二叉樹構造雙向線索鏈表遍歷中序線索二叉樹線索二叉樹（中序遍歷版） 中序遍歷找到對應結點的前驅（土方法） #mermaid-svg-eunGO5d2GhjLxCn5 {fo…

閱讀更多...

基于SpringBoot的“體育購物商城”的設計與實現（源碼+數據庫+文檔+PPT)

基于SpringBoot的“體育購物商城”的設計與實現（源碼+數據庫+文檔+PPT)

基于SpringBoot的“體育購物商城”的設計與實現（源碼數據庫文檔PPT) 開發語言：Java 數據庫：MySQL 技術：SpringBoot 工具：IDEA/Ecilpse、Navicat、Maven 系統展示系統總體模塊設計前臺用戶登錄界面系統首頁界面…

閱讀更多...

數據篇| App爬蟲入門（一）

數據篇| App爬蟲入門（一）

App 的爬取相比 Web 端爬取更加容易，反爬蟲能力沒有那么強，而且數據大多是以 JSON 形式傳輸的，解析更加簡單。在 Web 端，我們可以通過瀏覽器的開發者工具監聽到各個網絡請求和響應過程，在 App 端如果想要查看這些內容就需要借助抓包軟件。常見抓包軟件有： ?工具名稱??…

閱讀更多...

go context學習

go context學習

1.Context接口2.emptyCtx3.Deadline()方法4.Done()方法5.Err方法6.Value方法（）7.contex應用場景8.其他context方法 1.Context接口 Context接口只有四個方法，以下是context源碼。 type Context interface {Deadline() (deadline time.Time, …

閱讀更多...

在VMware Workstation Pro上輕松部署CentOS7 Linux虛擬機

在VMware Workstation Pro上輕松部署CentOS7 Linux虛擬機

首先我們需要下載VM虛擬機和Centos7的鏡像下載并安裝VMware Workstation Pro 訪問VMware Workstation Pro官網下載 https://www.vmware.com/ 第二步：下載centos7鏡像訪問centos官網下載 https://www.centos.org/ 開始部署Centos7 點擊創建新的虛擬機這里是Cen…

閱讀更多...

Jsoup 解析商品信息時需要注意哪些細節？

Jsoup 解析商品信息時需要注意哪些細節？

在使用Jsoup解析商品信息時，需要注意以下細節和最佳實踐，以確保爬蟲的穩定性和數據的準確性： 1. 檢查HTML文檔的合法性在解析之前，需要確認所解析的文檔是否是一份合法正確的HTML文檔。如果HTML結構不完整或存在錯誤&#xff0…

閱讀更多...

Android AudioFlinger（五）—— 揭開AudioMixer面紗

Android AudioFlinger（五）—— 揭開AudioMixer面紗

前言： 在 Android 音頻系統中，AudioMixer 是音頻框架中一個關鍵的組件，用于處理多路音頻流的混音操作。它主要存在于音頻回放路徑中，是 AudioFlinger 服務的一部分。上一節我們講threadloop的時候，提到了一個函數pr…

閱讀更多...

go的”ambiguous import in multiple modules”

go的”ambiguous import in multiple modules”

執行“go mod tidy”報如下錯誤： go mod tidy -compat1.17 go: finding module for package github.com/gomooon/goredis go: found github.com/gomooon/goredis in github.com/gomooon/goredis v0.3.5 go: github.com/gomooon/core importsgithub.com/gomooon/gor…

閱讀更多...

從0開始的操作系統手搓教程27：下一步，實現我們的用戶進程

從0開始的操作系統手搓教程27：下一步，實現我們的用戶進程

目錄第一步：添加用戶進程虛擬空間準備沖向我們的特權級3（用戶特權級） 討論下我們創建用戶線程的基本步驟更加詳細的分析代碼用戶進程的視圖說一說BSS段繼續看process.c中的函數添加用戶線程激活現在，我們做好了TSS…

閱讀更多...

Java線程池深度解析，從源碼到面試熱點

Java線程池深度解析，從源碼到面試熱點

Java線程池深度解析，從源碼到面試熱點一、線程池的核心價值與設計哲學在開始討論多線程編程之前，可以先思考一個問題？多線程編程的原理是什么？ 我們知道，現在的CUP是多核CPU，假設你的機器是4核的&#x…

閱讀更多...

最新文章