本地基于Ollama部署的DeepSeek詳細接口文檔說明

????????前文,我們已經在本地基于Ollama部署好了DeepSeek大模型,并且已經告知過如何查看本地的API。為了避免網絡安全問題,我們希望已經在本地調優的模型,能夠嵌入到在本地的其他應用程序中,發揮本地DeepSeek的作用。因此需要知道本地DeepSeek的API結構,知道什么接口地址要輸入什么參數,以及如何使用。

?????? 前置文章:

????????(1)個人windows電腦上安裝DeepSeek大模型:https://lzm07.blog.csdn.net/article/details/145491693

????????(2)查看和使用本地Windows系統下通過Ollama部署的DeepSeek模型的API:https://lzm07.blog.csdn.net/article/details/145601121

????????先了解接口的詳細內容,再postman對接口進行驗證。

一、核心接口文檔說明

1. ?模型列表查詢?

?接口地址?:GET http://localhost:11434/api/tags

?功能?:獲取本地已部署的模型列表,包含模型名稱、版本及大小信息?

?響應示例?(json):

{"models": [{"name": "deepseek-r1:8b", "modified_at": "2025-03-20T12:00:00Z", "size": 8.2e9}]}

2. ?文本生成?

?接口地址?:POST http://localhost:11434/api/generate

?功能:根據輸入提示生成文本內容,支持代碼、文章、問答等場景?。

請求參數(json)?:

{"model": "deepseek-r1:8b",? // 必填,需與本地模型名稱一致?:ml-citation{ref="2,4" data="citationList"}"prompt": "輸入問題",??????? // 必填"stream": false,?????????? // 是否流式輸出(默認true)?:ml-citation{ref="4,7" data="citationList"}"temperature": 0.7,??????? // 隨機性控制(0-1,默認0.8)?:ml-citation{ref="4,7" data="citationList"}"max_tokens": 1000???????? // 最大輸出長度?:ml-citation{ref="4,7" data="citationList"}}

?響應示例?(json):

{"response": "生成內容","created_at": "2025-03-21T10:00:00Z","done": true}

3. ?對話交互?

?接口地址?:POST http://localhost:11434/api/chat

??功能?: 支持多輪對話交互,維護上下文語義

請求參數(json)?:

{"model": "deepseek-r1:8b","messages": [{"role": "user", "content": "你好"},{"role": "assistant", "content": "有什么可以幫助您?"}],"options": {"temperature": 0.7,????? // 可選參數?:ml-citation{ref="4,7" data="citationList"}"num_ctx": 4096????????? // 上下文窗口大小?:ml-citation{ref="7" data="citationList"}}}

?響應示例(json)?:

{"message": {"role": "assistant", "content": "回復內容"},"done": true}

二、模型管理接口

4. ?拉取模型?

?接口地址?:POST http://localhost:11434/api/pull

?功能?: 從倉庫下載指定模型到本地

請求參數(json)?:

{"name": "deepseek-r1:14b",? // 需與模型倉庫名稱一致?:ml-citation{ref="5,8" data="citationList"}"stream": false??????? ?????// 是否顯示下載進度流?:ml-citation{ref="5,8" data="citationList"}}

?響應示例?(json):

{"status": "success", "digest": "sha256:..."}

5. ?創建自定義模型?

?接口地址?:POST http://localhost:11434/api/create

?

請求參數?(json):

{"name": "custom-model",??? // 自定義模型名稱"modelfile": "FROM deepseek-r1:8b\nPARAMETER temperature 0.9"? // 模型配置文件?:ml-citation{ref="5,8" data="citationList"}}

6. ?刪除模型?

?接口地址?:DELETE http://localhost:11434/api/delete

?功能?: 移除本地已部署的模型

請求參數?(json):

{"name": "deepseek-r1:1.5b"}? // 需刪除的模型名稱?:ml-citation{ref="6,8" data="citationList"}

三、高級接口

7. ?查看模型信息?

?接口地址?:GET http://localhost:11434/api/show

?請求參數?(json):

{"name": "deepseek-r1:8b"}??? // 模型名稱?:ml-citation{ref="8" data="citationList"}

?響應示例(json)?:

{"license": "Apache-2.0","modelfile": "...","parameters": "temperature 0.8"}

?8. 流式響應處理?

?說明?: 在請求(文本生成/對話)中設置?"stream": true?時,響應將以數據流形式分塊返回?。

??數據格式?: 分塊返回SSE(Server-Sent Events)格式數據。

示例?(使用?curl)(CMD中執行):

curl http://localhost:11434/api/generate -d '{"model": "deepseek-r1:8b","prompt": "寫一首關于春天的詩","stream": true}'

四、Postman下載安裝

????????了解了以上接口之后,我們要先對接口進行驗證,看接口的地址、類型、以及請求的參數是否都正常,便于之后在其他程序中應用這些接口。當前我們使用來postman驗證接口。

????????先下載和安裝postman程序。

1. 下載postman

?????? 官方網址:https://www.postman.com/downloads/

2. postman安裝

?????? 點擊Postman-win64-Setup.exe。不用登錄,點擊下方的“Continue without an account”。

?????? 不用登錄,點擊“Open Lightweight API Client”。

?????? 進入postman主界面

五、Postman測試說明

?1.配置請求頭?

設置 Content-Type: application/json?。

?

2.發送請求示例(對話接口)?

?步驟?:

(1)選擇 POST 方法,輸入 http://localhost:11434/api/chat

(2)在 ?Body? 標簽中選擇 ?raw? 格式,粘貼以下內容(json):

?????? 模型名稱一定要寫對,根據自己本地安裝好的模型修改,如我們前面已經在本地部署好了deepseek模型,并將模型命名為my_model_name ,則此時,應該填寫:"model": "my_model_name"

{"model": "deepseek-r1:8b","messages": [{"role": "user", "content": "解釋機器學習中的過擬合"}]}

(3)點擊 ?Send? 獲取響應?。

?3.流式響應處理?

若設置 "stream": true,需在Postman中啟用 ?Stream? 模式,逐塊接收數據?。

(1)在 ?Body? 標簽選擇 ?raw? → ?JSON?,輸入以下內容(json):

{"model": "deepseek-chat",?"messages": [{"role": "user", "content": "你的問題"}],?"stream": true? // 關鍵參數,啟用流式輸出?:ml-citation{ref="7,8" data="citationList"}}

?

(2)關閉 SSL 驗證(可選)?

在 Postman 設置(Settings → General)中關閉 ?SSL certificate verification?,避免證書錯誤中斷流式傳輸?。

六、注意事項

??????? (1)模型名稱匹配?:確保接口中的 model 參數與通過 ollama list 查看到的名稱完全一致?。

??????? (2)顯存限制?:高參數版本(如14B)需至少32GB內存,低配置設備建議使用1.5B或8B版本?。

??????? (3)端口占用?:若端口11434被占用,可通過 OLLAMA_HOST 環境變量修改服務端口?。

??????? (4)跨域問題?: 若通過 Swagger 調用,需在Ollama服務端配置CORS頭(bash):

# 啟動服務時添加參數OLLAMA_ORIGINS=* ollama serve

通過以上接口,可全面管理本地部署的DeepSeek模型并實現交互式調用。

本文來自互聯網用戶投稿,該文觀點僅代表作者本人,不代表本站立場。本站僅提供信息存儲空間服務,不擁有所有權,不承擔相關法律責任。
如若轉載,請注明出處:http://www.pswp.cn/diannao/74122.shtml
繁體地址,請注明出處:http://hk.pswp.cn/diannao/74122.shtml
英文地址,請注明出處:http://en.pswp.cn/diannao/74122.shtml

如若內容造成侵權/違法違規/事實不符,請聯系多彩編程網進行投訴反饋email:809451989@qq.com,一經查實,立即刪除!

相關文章

基于ArcGIS和ETOPO-2022 DEM數據分層繪制全球海陸分布

第〇部分 前言 一幅帶有地理空間參考、且包含海陸分布的DEM圖像在研究區的繪制中非常常見,本文將實現以下圖像的繪制 關鍵步驟: (1)NOAA-NCEI官方下載最新的ETOPO-2022 DEM數據 (2)在ArcGIS(…

自動化測試框架pytest+requests+allure

Pytest requests Allure 這個框架基于python的的 Pytest 進行測試執行,并結合 Allure插件 生成測試報告的測試框架。采用 關鍵字驅動 方式,使測試用例更加清晰、模塊化,同時支持 YAML 文件來管理測試用例,方便維護和擴展。 測試…

Retrofit中scalars轉換html為字符串

簡介 在Retrofit中,如果你想直接獲取HTML或其他文本格式的響應內容而不是將其映射到一個模型類,ScalarsConverterFactory 就派上用場了。ScalarsConverterFactory 是一個轉換器工廠,它能夠將響應體轉換為Java基本類型如String、Integer或Byte…

Powershell WSL Windows系統復制數據到ubuntu子系統系統

從本地D盤下拷貝數據到ubuntu子系統下 Powershell 管理員打開執行 /mnt/d 此處是本地Windows系統的路徑表示/opt ubutu 子系統目錄 wsl -d Ubuntu-22.04 -u root -- bash -c cp -rf /mnt/d/nginx.conf /opt/從ubuntu子系統中拷貝數據到本地D盤下 Powershell 管理員打開執行…

【多線程】線程安全集合類,ConcurrentHashMap實現原理

文章目錄 線程安全集合類解決方案多線程環境使用順序表多線程環境使用隊列多線程環境使用哈希表ConcurrentHashMap1. 縮小鎖的粒度2. 充分使用 CAS3. 針對擴容操作 線程安全集合類 ArrayList、Queue、HsahMap… 都是線程不安全的 Vector、Stack、Hashtable 都是線程安全的&am…

spring-tx筆記

編程式事務與聲明式事務的理解 補充:什么是事務? 事務是一個重要概念,尤其在數據庫管理系統中。事務是指一組操作。,這些操作要么全部成功執行,要么全部不執行,確保數據的一致性和完整性 編程式事務 編…

Android第四次面試(Java基礎篇)

一、Java 中的 DCL 單例模式 單例模式是設計模式中最常用的模式之一,其核心目標是確保一個類在程序中僅有一個實例,并提供全局訪問點。在 Java 中,實現單例模式需要兼顧線程安全和性能優化。DCL(Double-Checked Locking&#xff0…

Java-SpringBootWeb入門、Spring官方腳手架連接不上解決方法

一. Spring 官網:Spring | Home Spring發展到今天已經形成了一種開發生態圈,Spring提供了若干個子項目,每個項目用于完成特定的功能(Spring全家桶) Spring Boot可以幫助我們非常快速的構建應用程序、簡化開發、提高效率 。 二. Spring Boot入…

1.7 無窮小的比較

1.定義 2.性質 3.無窮小的比較 3.1等價無窮小的性質 3.2 常見等價無窮小

StarRocks 升級注意事項

前段時間升級了生產環境的 StarRocks,從 3.3.3 升級到了 3.3.9,期間還是踩了不少坑所以在這里記錄下。 因為我們的集群使用的是存算分離的版本,也是使用官方提供的 operator 部署在 kubernetes 里的,所以沒法按照官方的流程進入虛…

深入探究 JVM 堆的垃圾回收機制(一)— 判活

垃圾回收分為兩步:1)判定對象是否存活。2)將“消亡”的對象進行內存回收。 1 判定對象存活 可達性分析算法:通過一系列“GC Roots”對象作為起始節點集,從這些節點開始,根據引用關系向下搜索,…

國產開發板—米爾全志T113-i如何實現ARM+RISC-V+DSP協同計算?

近年來,隨著半導體產業的快速發展和技術的不斷迭代,物聯網設備種類繁多(如智能家居、工業傳感器),對算力、功耗、實時性要求差異大,單一架構無法滿足所有需求。因此米爾推出MYD-YT113i開發板(基…

Tomcat虛擬主機配置詳解:Centos環境下多域名部署(詳細教程!)

🏡作者主頁:點擊! Tomcat服務器📝專欄:點擊! 🐧Linux高級管理防護和群集專欄:點擊! ??創作時間:2025年3月18日14點14分 最近在折騰 Tomcat 的時候&…

鴻蒙開發工程師簡歷項目撰寫全攻略

一、項目結構的黃金法則 建議采用「41」結構: 項目背景(業務價值)技術架構(鴻蒙特性)核心實現(技術難點)個人貢獻(量化成果)附加價值(延伸影響) …

dfs刷題排列問題 + 子集問題 + 組和問題總結

文章目錄 一、排列問題全排列II題解代碼 優美的排列題解代碼 二、子集問題字母大小寫全排列題解代碼 找出所有子集的異或總和再求和題解代碼 三、組合問題電話號碼的字母組合題解代碼 括號生成題解代碼 組合題解代碼 目標和題解代碼 組合總和題解代碼 總結 一、排列問題 全排列…

【Linux】VMware17 安裝 Ubuntu24.04 虛擬機

目錄 安裝教程 一、下載 Ubuntu 桌面版iso映像 二、安裝 VMware 三、安裝 Ubuntu 桌面版 VMware 創建虛擬機 掛載 Ubuntu ISO 安裝 Ubuntu 系統 安裝教程 一、下載 Ubuntu 桌面版iso映像 鏈接來自 清華大學開源軟件鏡像站 ISO文件地址:ubuntu-24.04.2-des…

CVPR2025 | 對抗樣本智能安全方向論文匯總 | 持續更新中~

匯總結果來源:CVPR 2025 Accepted Papers 若文中出現的 論文鏈接 和 GitHub鏈接 點不開,則說明還未公布,在公布后筆者會及時添加. 若筆者未及時添加,歡迎讀者告知. 文章根據題目關鍵詞搜索,可能會有遺漏. 若筆者出現…

PostgreSQL_數據回退,數據庫導出、導入

目錄 前置: 1 數據回退 1.1 代碼 1.2 pgAdmin4 中查看 1)t_daily 2) t_stock_daily 2 數據庫導出、導入 前置: 本博文是一個系列。在本人“數據庫專欄”-》“PostgreSQL_”開頭的博文。 1 數據回退 上一節“PostgreSQL_數據下載并…

golang單機鎖實現

1、鎖的概念引入 首先,為什么需要鎖? 在并發編程中,多個線程或進程可能同時訪問和修改同一個共享資源(例如變量、數據結構、文件)等,若不引入合適的同步機制,會引發以下問題: 數據競…

【HarmonyOS Next】鴻蒙應用實現彈框DialogHub詳解

【HarmonyOS Next】鴻蒙應用實現彈框DialogHub詳解 一、前言 鴻蒙中實現彈框目前官方提供openCustomDialog和CustomDialog兩種模式。推薦前者,詳情見下圖和官網文檔鏈接: https://developer.huawei.com/consumer/cn/doc/harmonyos-guides-V14/arkts-u…