Windows/Linux系統 Ollama部署deepseek 大模型

Ollama 是一個開源工具,專門用于在本地計算機上運行和操作大型語言模型(LLM)

官方下載網站(https://ollama.ai/)

Windows系統安裝方法

建議命令行安裝(默認安裝會直接安裝到C盤)

OllamaSetup.exe/DIR=D:\software\ollama

大模型下載地址 -- 按需求下載??libraryBrowse Ollama's library of models.https://ollama.com/library/命令行導入大模型:

# 導入大模型
ollama create deepseek8b -f Modelfile # 查看
ollama list# 運行
ollama run deepseek8b

Modelfile 文件包含目標大模型路徑

 FROM H:\2025-deepseek\llm_model\Deepseek8B\DeepSeek-R1-Distill-Llama-8B-Q4_K_M.gguf

?效果展示:

啟用遠程訪問

默認僅限本地訪問,如需遠程調用:

# 開放防火墻端口
New-NetFirewallRule -DisplayName "Ollama API" -Direction Inbound -Action Allow -Protocol TCP -LocalPort 11434# 啟動 Ollama 時綁定到所有網絡
ollama serve --host 0.0.0.0

?API接口 Python調用

import requestsresponse = requests.post("http://localhost:11434/api/generate",json={"model": "deepseek8b","prompt": "你運行的大模型是那個版本,簡潔回答","stream": True,}
)
print(response.json()['response'])

嗯,我現在需要分析一下這個用戶的問題。他們說:“你運行的大模型是那個版本,簡潔回答是最好的。”看起來用戶是在詢問我當前使用的模型版本,并且希望得到一個簡明扼要的回答。

.......

</think>

我是由深度求索公司獨立運行的DeepSeek-R1-Lite-Preview模型。

Linux系統安裝方法

直接下載二進制
# 下載最新版 Ollama
curl -L https://ollama.ai/download/ollama-linux-amd64 -o ollamatar -xf ollama-linux-amd64.tgz# 移動到系統路徑
sudo mv bin/ollama /usr/local/bin/# 賦予執行權限
chmod +x /usr/local/bin/ollama

啟動 Ollama 服務

# 啟動服務(前臺運行)
ollama serve# 或作為后臺服務(需 systemd)
cat <<EOF | sudo tee /etc/systemd/system/ollama.service
[Unit]
Description=Ollama Service
After=network-online.target[Service]
ExecStart=/usr/local/bin/ollama serve
User=root
Restart=always
RestartSec=3[Install]
WantedBy=default.target
EOF# 啟動并設置開機自啟
sudo systemctl daemon-reload
sudo systemctl enable ollama
sudo systemctl start ollama

測試可用性?

下載預訓練模型(例如 phi)
ollama pull phi

驗證模型運行

# 交互式測試
ollama run phi "How to check disk space in Red Hat?"

啟用本地 API 接口

Ollama 默認提供 REST API(端口 11434):

# 測試 API
curl http://localhost:11434/api/generate -d '{"model": "phi","prompt": "Hello"
}'
API 接口示例
  • 對話模式

curl http://localhost:11434/api/chat -d '{"model": "phi","messages": [{ "role": "user", "content": "Who are you?" }]
}'

使用 Python 調用 API

import requestsresponse = requests.post("http://localhost:11434/api/generate",json={"model": "phi", "prompt": "Explain RPM packages"}
)
print(response.json()["response"])

常見問題

  1. GPU 加速
    安裝 NVIDIA 驅動和 CUDA,添加 --gpus all 參數(需 Docker 運行)。

  2. 端口沖突
    修改啟動參數 ollama serve --host 0.0.0.0:11435

  3. 模型存儲路徑
    默認在 ~/.ollama/models,可通過環境變量 OLLAMA_MODELS 修改。

本文來自互聯網用戶投稿,該文觀點僅代表作者本人,不代表本站立場。本站僅提供信息存儲空間服務,不擁有所有權,不承擔相關法律責任。
如若轉載,請注明出處:http://www.pswp.cn/news/910196.shtml
繁體地址,請注明出處:http://hk.pswp.cn/news/910196.shtml
英文地址,請注明出處:http://en.pswp.cn/news/910196.shtml

如若內容造成侵權/違法違規/事實不符,請聯系多彩編程網進行投訴反饋email:809451989@qq.com,一經查實,立即刪除!

相關文章

用Tensorflow進行線性回歸和邏輯回歸(一)

這一章告訴你如何用TensorFlow構建簡單的機器學習系統。第一部分回顧構建機器學習系統的基礎特別是講函數&#xff0c;連續性&#xff0c;可微性。接著我們介紹損失函數&#xff0c;然后討論機器學習歸根于找到復雜的損失函數最小化的點的能力。我們然后講梯度下降&#xff0c;…

java/.net跨平臺UI瀏覽器SDK,瀏覽器控件開發包分析

在 Linux 系統中&#xff0c;雖然沒有完全等同于安卓 WebView 的內置瀏覽器 SDK&#xff0c;但存在多種基于開源瀏覽器引擎的解決方案&#xff0c;支持通過 Java 代碼控制網頁加載和執行 JavaScript。以下是具體實現方案和技術細節&#xff1a; 一、核心技術方案對比 方案名稱…

Taro 狀態管理全面指南:從本地狀態到全局方案

在跨端應用開發中&#xff0c;狀態管理是構建可維護、可擴展應用的核心環節。作為京東凹凸實驗室推出的多端統一開發框架&#xff0c;Taro 支持 React/Vue 等主流前端框架&#xff0c;自然也繼承了豐富的狀態管理生態。本文將全面剖析 Taro 中的各種狀態管理方案&#xff0c;從…

記錄一下jar做成windows服務問題

1、打包好jar 2、把jdk防止到和jar同一目錄下 3、下載winsw-x64.exe 和 sample-minimal.xml https://github.com/winsw/winsw/releases/download/v2.12.0/WinSW-x64.exehttps://github.com/winsw/winsw/releases/download/v2.12.0/WinSW-x64.exe sample-minimal.xmlhttps://…

【Dify 案例】【MCP實戰】【二】【超級助理】

我們創建一個工作流。你是一個超級助理,能夠根據輸入的指令,進行推理和自主調用工具,完成并輸出結果。 注意,需要判斷是否調用高德MCP來獲取對應工具協助你完成任務。 1.開始 2.策略大腦 2.1 AEGNT策略 2.2 工具列表 2.3 指令

Qt Quick 與 QML(二)qml中的頂級窗口

一、前言 在QML中&#xff0c;?頂級窗口不是絕對必需的?&#xff0c;但它在大多數應用場景中扮演著關鍵角色。 需要頂級窗口的典型場景&#xff1a; 1.獨立桌面/移動應用? 必須使用Window或ApplicationWindow作為根元素。 2.多窗口應用 每個獨立窗口都需要一個頂級窗口實例…

華為云Flexus+DeepSeek征文|DeepSeek-V3/R1 免費服務開通全流程與Rest API和OpenAI SDK調用詳解

華為云FlexusDeepSeek征文&#xff5c;DeepSeek-V3/R1 免費服務開通全流程與Rest API和OpenAI SDK調用詳解 前言 本文將詳細介紹DeepSeek-V3/R1 免費服務開通全流程&#xff0c;并且詳細講解通過本地方式Rest API和OpenAI SDK兩種方式調用DeepSeek-V3/R1 前提準備 1、訪問 Mod…

Qt 連接信號使用lambda表達式和槽函數的區別

1. 語法與代碼結構 成員函數 需在類中顯式聲明槽函數&#xff08;public slots: 或 Qt 5 后的任意成員函數&#xff09;&#xff0c;并在連接時指定接收對象。 class Receiver : public QObject {Q_OBJECT public slots:void handleSignal(int value) { /* ... */ } };// 連接…

學習筆記丨AR≠VR:透視沉浸式技術的“虛實象限”法則

AR&#xff08;增強現實&#xff09;和VR&#xff08;虛擬現實&#xff09;是沉浸式技術的兩大分支&#xff0c;核心區別在于虛擬與現實的融合程度。以下是兩者的詳細對比&#xff1a; 對比維度 AR&#xff08;增強現實&#xff09; VR&#xff08;虛擬現實&#xff09; 技術…

本地使用 modelscope 大模型 來進行文本生成視頻(Text-to-Video)

1. ? 創建并激活 Conda 環境&#xff08;Python 3.8&#xff09; conda create -n modelscope python3.8 -yconda activate modelscope 2.? 安裝了 PyTorch&#xff08;CPU 版本&#xff09; 如果你是 CPU-only 用戶&#xff08;沒有 NVIDIA 顯卡 或不想用 GPU&#xff0…

文生視頻(Text-to-Video)

&#x1f552; 生成時間&#xff1a;每張圖大概 10–60 秒&#xff08;取決于設備&#xff09; ? 二、文生視頻&#xff08;Text-to-Video&#xff09; 以下項目中&#xff0c;很多都基于 SD 模型擴展&#xff0c;但視頻生成復雜度高&#xff0c;生成時間一般 超過 30 秒&am…

CLion + STM32環境配置,親測有效(2025.06.19記)

CLion STM32環境配置 遇到的問題描述&#xff1a; > "moniton" command not supported by this target. > You cant do that when your target is exec > 上傳完成&#xff0c;但存在問題 > monitor reset > "monitor" command not …

借助ChatGPT快速開發圖片轉PDF的Python工具

一、開發背景與適用場景 隨著數字文檔處理需求的激增&#xff0c;圖片轉PDF的需求日益廣泛。從學生提交圖像化作業&#xff0c;到教師整合掃描試卷等資料&#xff0c;再到行政人員歸檔證件照片&#xff0c;工作中的方方面面都離不開圖片的處理。如何高效、批量地將多個圖片文件…

SuGAR代碼精簡解讀

目錄 一、全流程訓練腳本 train_full_pipeline.py 二、核心訓練邏輯 train.py 粗優化 (coarse_density_and_dn_consistency.py) 網格提取 (extract_mesh_from_coarse_sugar) 精優化 (refined_training) 兩次優化&#xff08;粗優化和精優化&#xff09;中使用的損失函數及…

大模型安全關鍵技術研究

? 引言 隨著人工智能技術的迅猛發展&#xff0c;大模型已成為推動各行業變革的核心力量。從智能客服、醫療影像識別到金融風險預測&#xff0c;大模型的應用場景不斷拓展&#xff0c;深刻改變著人們的生產生活方式。大模型已經轉變為AI領域的基礎設施&#xff0c;為解決各種…

java面試題04成員變量和局部變量的區別

成員變量(Member Variable)和局部變量(Local Variable)是面向對象編程中兩種作用域和生命周期不同的變量,主要區別體現在以下幾個方面: 1. 聲明位置 成員變量: 聲明在類內部、方法/構造器/代碼塊外部。 例如: public class Person {// 成員變量(實例變量)private Str…

升級到 .NET 9 分步指南

隨著激動人心的 .Net 9 更新正式發布&#xff0c;漫長的等待終于結束了。它帶來了一些令人驚嘆的特性&#xff0c;例如改進的 LINQ 功能、HybridCache 等等。此外&#xff0c;憑借其卓越的性能提升、更佳的安全性、更完善的協議和更易維護的特性&#xff0c;它必將吸引開發者和…

day30打卡

# 導入模塊 import math print("方式1&#xff1a;使用 import math") print(f"圓周率π的值&#xff1a;{math.pi}") print(f"2的平方根&#xff1a;{math.sqrt(2)}\n") # 導入特定項 from math import pi, sqrt print("方式2&#…

優化數據庫查詢

優化數據庫查詢 在實際開發中,數據庫查詢的性能直接關系到系統響應速度和用戶體驗。尤其在高并發環境下,低效的SQL語句會成為瓶頸,導致系統負載升高,甚至引發宕機。因此,查詢優化是數據庫性能優化中最為關鍵的一環。 為了系統性地理解數據庫查詢優化策略,本節將從SQL語…

【LeetCode#第198題】打家劫舍(一維dp)

198. 打家劫舍 - 力扣&#xff08;LeetCode&#xff09; 你是一個專業的小偷&#xff0c;計劃偷竊沿街的房屋。每間房內都藏有一定的現金&#xff0c;影響你偷竊的唯一制約因素就是相鄰的房屋裝有相互連通的防盜系統&#xff0c;如果兩間相鄰的房屋在同一晚上被小偷闖入&#…