DeepSeek-R1本地部署實踐

在這里插入圖片描述

一、下載安裝 --Ollama

Ollama是一個開源的 LLM(大型語言模型)服務工具,用于簡化在本地運行大語言模型,降低使用大語言模型的門檻,使得大模型的開發者、研究人員和愛好者能夠在本地環境快速實驗、管理和部署最新大語言模型,包括如Llama 3、Phi 3、Mistral、Gemma等開源的大型語言模型。

下載方式:

方式1:官網下載:
官網地址:https://ollama.com/download
如果官網地址一直卡住下載不下來,選用下面的方法

方式2:GitHub下載:
GitHub官方鏈接:https://github.com/ollama/ollama
點擊GitHub鏈接,relase 跳轉到要下載的資源文件,鼠標右擊點擊復制鏈接。如以下示例類型:

https://github.com/ollama/ollama/releases/download/v0.4.3/OllamaSetup.exe

替換如下域名加速:

https://github.xzc888.top/

替換之后示例為:

https://github.xzc888.top/ollama/ollama/releases/download/v0.4.3/OllamaSetup.exe

下載安裝,打開cmd執行ollama -h,回顯成功:

PS C:\Users\Administrator> ollama -h
Large language model runnerUsage:ollama [flags]ollama [command]Available Commands:serve       Start ollamacreate      Create a model from a Modelfileshow        Show information for a modelrun         Run a modelstop        Stop a running modelpull        Pull a model from a registrypush        Push a model to a registrylist        List modelsps          List running modelscp          Copy a modelrm          Remove a modelhelp        Help about any commandFlags:-h, --help      help for ollama-v, --version   Show version informationUse "ollama [command] --help" for more information about a command.

打開ollama的Models:https://ollama.com/search ,搜索deepseek-r1,復制命令行執行即可。
如果你的顯卡有8G以上顯存,可以嘗試7b的模型,如果沒有就直接選擇1.5b模型:

ollama run deepseek-r1

常用命令:

ollama list #獲得已安裝模型列表
ollama run llama3.1  #ollama run + 模型名 運行模型
ollama rm #ollama rm +模型名 刪除模型

二、可視化頁面 --Chatbox

下載Chatbox AI:https://chatboxai.app/zh

安裝完成后進行如下設置即可:
在這里插入圖片描述

參數說明:

Temperature(溫度值),是大語言模型生成文本時用于調節輸出隨機性和多樣性的參數。

  • 數值越高,模型選擇低概率詞語的可能性越大,輸出更加隨機且富有創意;
  • 數值越低,模型更傾向選擇高概率詞語,輸出更確定且保守。

通過調整溫度值,可在創造性和準確性之間進行平衡,以適應不同的應用場景。如創作者寫文案可以調到最大。

另外,在專屬對話設置中,還可以設置角色以及TopP:

在這里插入圖片描述
TopP(又稱核采樣)是一種調節語言模型生成隨機性的機制,通過對詞匯的累積概率進行截斷篩選,僅保留累積概率不超過閾值 p 的候選詞,并從中按概率分布采樣生成下一個詞。

  • 較高的 p 值(如 0.9 - 1.0):保留更多候選詞,生成結果更具多樣性,但也可能增加隨機性。
  • 較低的 p 值(如 0.1 - 0.3):保留更少的候選詞,生成結果更加集中和確定。

與溫度參數不同,TopP 動態地調整候選詞的數量,適用于控制生成文本的隨機性和連貫性。

提示詞筆記:

1.真誠對話
幫我整理這份報告,我需要把這個報告上交給我的領導看,希望文字更加的清晰整潔,每一段話都能在句首列出重點;

2.通用公式
我要XX,要給XX用,希望能夠達到XX效果,擔心出現XX問題,幫我達到XX效果最大化;
舉例:我要做一份旅游攻略,給我和女朋友旅游福建的時候用,希望能夠更加提高我們的互動效果,能夠達到更多的肢體接觸,擔心會不會出現太油膩太唐突的問題,幫我達到情侶感情升溫的最大化,

3.問完問題之后,直接加上“說人話”這三個字
比如問“流體力學”是什么,一般情況會很官方的回答,但是如果你加上說人話三個字,那么將會很普通話的給你解析這個問題,適合;

4.反方向提問法
直接提問如果你是老板,你怎么批評這個方案?;這個結果你滿意嗎?請幫我復盤

5.反復問同一個問題;
Deepseek具有深度思考模型,如果你反復提問同一個問題,它就會總結累計回答的問題,為什么回答不夠滿意等,以及把思考的小細節顯示出來,你會發現它的思考方式超級像一個邏輯能力超強的人類;

6.模仿思考
給一段誰誰的的語句,讓它模仿學習,以它的思想去思考問題,比如,幫我以愛因斯坦的思想去思考這個問題,是否能夠有什么解決方案

7.假設法
假設你是談過10000次戀愛的感情達人;假設你是硅谷資深投資人,投過上百家互聯網公司;假設你是健身教練,你應該怎么給你的學員準備增肌的一日三餐;

三、安裝自己的知識庫 --AnythingLLM

四、DeepSeek API使用

1,注冊deepseek并生成apikey

deepseek的api平臺:https://www.deepseek.com/
選中apikeys菜單 -》 創建API-KEY
官方文檔:https://api-docs.deepseek.com/zh-cn/

本地調用案例如下:

curl http://127.0.0.1:11434/v1/chat/completions \-H "Content-Type: application/json" \-H "Authorization: Bearer <DeepSeek API Key>" \-d '{"model": "deepseek-r1","messages": [{"role": "system", "content": "You are a helpful assistant."},{"role": "user", "content": "Hello!"}],"stream": false}'

其中model可以在本地cmd里查看:ollama list。測試結果:
在這里插入圖片描述

2,在idea插件codegpt中配置deepseek

打開idea的File->Settings->Tools->CodeGPT->Providers->Custom OpenAI

  • Preset Template 選擇 OpenAI
  • API key 填入第二步中生成的key
  • Chat Completions的URL填寫https://api.deepseek.com/v1/chat/completions
  • 切換到Body,model配置為deepseek-reasoner(r1)或deepseek-chat(v3)

本文來自互聯網用戶投稿,該文觀點僅代表作者本人,不代表本站立場。本站僅提供信息存儲空間服務,不擁有所有權,不承擔相關法律責任。
如若轉載,請注明出處:http://www.pswp.cn/news/894435.shtml
繁體地址,請注明出處:http://hk.pswp.cn/news/894435.shtml
英文地址,請注明出處:http://en.pswp.cn/news/894435.shtml

如若內容造成侵權/違法違規/事實不符,請聯系多彩編程網進行投訴反饋email:809451989@qq.com,一經查實,立即刪除!

相關文章

AI技術路線(marked)

人工智能&#xff08;AI&#xff09;是一個非常廣泛且充滿潛力的領域&#xff0c;它涉及了讓計算機能夠執行通常需要人類智能的任務&#xff0c;比如感知、推理、學習、決策等。人工智能的應用已經滲透到各行各業&#xff0c;從自動駕駛到醫療診斷&#xff0c;再到推薦系統和自…

【leetcode詳解】T598 區間加法

598. 區間加法 II - 力扣&#xff08;LeetCode&#xff09; 思路分析 核心在于將問題轉化&#xff0c; 題目不是要求最大整數本身&#xff0c;而是要求解最大整數的個數 結合矩陣元素的增加原理&#xff0c;我們將抽象問題轉為可操作的方法&#xff0c;其實就是再找每組ops中…

【最后203篇系列】004 -Smarklink

說明 這個用來替代nginx。 最初是希望用nginx進行故障檢測和負載均衡&#xff0c;花了很多時間&#xff0c;大致的結論是&#xff1a;nginx可以實現&#xff0c;但是是在商業版里。非得要找替代肯定可以搞出來&#xff0c;但是太麻煩了&#xff08;即使是nginx本身的配置也很煩…

完全卸載mysql server步驟

1. 在控制面板中卸載mysql 2. 打開注冊表&#xff0c;運行regedit, 刪除mysql信息 HKEY_LOCAL_MACHINE-> SYSTEM->CurrentContolSet->Services->EventLog->Application->Mysql HKEY_LOCAL_MACHINE-> SYSTEM->CurrentContolSet->Services->Mysql …

1. 【.NET Aspire 從入門到實戰】--理論入門與環境搭建--引言

在當前軟件開發領域&#xff0c;云原生和微服務架構已經成為主流趨勢&#xff0c;傳統的單體應用正逐步向分布式系統轉型。隨著業務需求的不斷變化與用戶規模的迅速擴大&#xff0c;如何在保證高可用、高擴展性的同時&#xff0c;還能提高開發效率與降低維護成本&#xff0c;成…

Ubuntu 22.04系統安裝部署Kubernetes v1.29.13集群

Ubuntu 22.04系統安裝部署Kubernetes v1.29.13集群 簡介Kubernetes 的工作流程概述Kubernetes v1.29.13 版本Ubuntu 22.04 系統安裝部署 Kubernetes v1.29.13 集群 1 環境準備1.1 集群IP規劃1.2 初始化步驟&#xff08;各個節點都需執行&#xff09;1.2.1 主機名與IP地址解析1.…

基于SpringBoot的新聞資訊系統的設計與實現(源碼+SQL腳本+LW+部署講解等)

專注于大學生項目實戰開發,講解,畢業答疑輔導&#xff0c;歡迎高校老師/同行前輩交流合作?。 技術范圍&#xff1a;SpringBoot、Vue、SSM、HLMT、小程序、Jsp、PHP、Nodejs、Python、爬蟲、數據可視化、安卓app、大數據、物聯網、機器學習等設計與開發。 主要內容&#xff1a;…

每日一題——包含min函數的棧

包含min函數的棧 題目數據范圍&#xff1a;示例C語言代碼實現解釋1. push(value)2. pop()3. top()4. min() 總結大小堆 題目 定義棧的數據結構&#xff0c;請在該類型中實現一個能夠得到棧中所含最小元素的 min 函數&#xff0c;輸入操作時保證 pop、top 和 min 函數操作時&am…

RDP協議詳解

以下內容包含對 RDP&#xff08;Remote Desktop Protocol&#xff0c;遠程桌面協議&#xff09;及其開源實現 FreeRDP 的較為系統、深入的講解&#xff0c;涵蓋協議概要、歷史沿革、核心原理、安全機制、安裝與使用方法、擴展與未來發展趨勢等方面&#xff0c; --- ## 一、引…

【Linux系統】計算機世界的基石:馮諾依曼架構與操作系統設計

文章目錄 一.馮諾依曼體系結構1.1 為什么體系結構中要存在內存&#xff1f;1.2 馮諾依曼瓶頸 二.操作系統2.1 設計目的2.2 系統調用與庫函數 一.馮諾依曼體系結構 馮諾依曼體系結構&#xff08;Von Neumann Architecture&#xff09;是計算機的基本設計理念之一&#xff0c;由…

消息隊列應用示例MessageQueues-STM32CubeMX-FreeRTOS《嵌入式系統設計》P343-P347

消息隊列 使用信號量、事件標志組和線標志進行任務同步時&#xff0c;只能提供同步的時刻信息&#xff0c;無法在任務之間進行數據傳輸。要實現任務間的數據傳輸&#xff0c;一般使用兩種方式&#xff1a; 1. 全局變量 在 RTOS 中使用全局變量時&#xff0c;必須保證每個任務…

【NLP251】Transformer精講 殘差鏈接與層歸一化

精講部分&#xff0c;主要是對Transformer的深度理解方便日后從底層邏輯進行創新&#xff0c;對于僅應用需求的小伙伴可以跳過這一部分&#xff0c;不影響正常學習。 1. 殘差模塊 何凱明在2015年提出的殘差網絡&#xff08;ResNet&#xff09;&#xff0c;Transformer在2016年…

Android學習制作app(ESP8266-01S連接-簡單制作)

一、理論 部分理論見arduino學習-CSDN博客和Android Studio安裝配置_android studio gradle 配置-CSDN博客 以下直接上代碼和效果視頻&#xff0c;esp01S的收發硬件代碼目前沒有分享&#xff0c;但是可以通過另一個手機網絡調試助手進行模擬。也可以直接根據我的代碼進行改動…

圖書管理系統 Axios 源碼__新增圖書

目錄 功能介紹 核心代碼解析 源碼&#xff1a;新增圖書功能 總結 本項目基于 HTML、Bootstrap、JavaScript 和 Axios 開發&#xff0c;實現了圖書的增刪改查功能。以下是新增圖書的功能實現&#xff0c;適合前端開發學習和項目實踐。 功能介紹 用戶可以通過 模態框&#xf…

DeepSeek Janus-Pro:多模態AI模型的突破與創新

近年來&#xff0c;人工智能領域取得了顯著的進展&#xff0c;尤其是在多模態模型&#xff08;Multimodal Models&#xff09;方面。多模態模型能夠同時處理和理解文本、圖像等多種類型的數據&#xff0c;極大地擴展了AI的應用場景。DeepSeek(DeepSeek-V3 深度剖析&#xff1a;…

AJAX XML

AJAX XML 引言 隨著互聯網技術的不斷發展,Web應用對用戶交互性和實時性的要求越來越高。AJAX(Asynchronous JavaScript and XML)技術的出現,為Web應用開發提供了強大的支持。AJAX技術允許Web應用在不重新加載整個頁面的情況下,與服務器進行異步通信。XML作為數據傳輸格式…

OpenGL學習筆記(五):Textures 紋理

文章目錄 紋理坐標紋理環繞方式紋理過濾——處理紋理分辨率低的情況多級漸遠紋理Mipmap——處理紋理分辨率高的情況加載與創建紋理 &#xff08; <stb_image.h> &#xff09;生成紋理應用紋理紋理單元練習1練習2練習3練習4 通過上一篇著色部分的學習&#xff0c;我們可以…

代理模式——C++實現

目錄 1. 代理模式簡介 2. 代碼示例 1. 代理模式簡介 代理模式是一種行為型模式。 代理模式的定義&#xff1a;由于某些原因需要給某對象提供一個代理以控制該對象的訪問。這時&#xff0c;訪問對象不適合或者不能直接訪問引用目標對象&#xff0c;代理對象作為訪問對象和目標…

Vue3 表單:全面解析與最佳實踐

Vue3 表單&#xff1a;全面解析與最佳實踐 引言 隨著前端技術的發展&#xff0c;Vue.js 已經成為最受歡迎的前端框架之一。Vue3 作為 Vue.js 的最新版本&#xff0c;帶來了許多改進和新的特性。其中&#xff0c;表單處理是 Vue 應用中不可或缺的一部分。本文將全面解析 Vue3 …

C++11新特性之范圍for循環

1.介紹 C11標準之前&#xff0c;使用for循環遍歷數組或容器&#xff0c;只能使用以下結構&#xff1a; for&#xff08;表達式1&#xff1b;表達式2&#xff1b;表達式3&#xff09;{ 循環體 } 那么在C11標準中&#xff0c;除了上面的方法外&#xff0c;又引入了一種全新的語…