Java+Ollama 本地部署 DeepSeek-R1 對話機器人：從 0 到 1 實戰指南

作為 Java 開發者，想在本地搭建一個能理解代碼、支持多輪對話的 AI 機器人？DeepSeek-R1 這款開源大模型絕對值得一試。今天就帶大家用 Ollama+Java 實現本地化部署，全程實操，新手也能跟著做！

一、先搞懂：為什么選 DeepSeek-R1？

這款模型有三個核心優勢，特別適合開發者：

代碼理解強：對 Java 語法、框架原理的解析準確率比同類模型高 15%+
對話不 "失憶"：支持 50 輪以上多輪對話，上下文連貫性遠超基礎模型
本地能跑：7B 參數版在 16GB 內存的普通電腦上就能流暢運行，不用高配顯卡

硬件要求放這里了，對照著看：

最低配置：CPU 8 核 +，16GB 內存（純 CPU 推理能跑，但響應稍慢）
推薦配置：NVIDIA 顯卡（8GB 顯存以上），支持 CUDA 加速，響應速度提升 3 倍

二、環境搭建：3 步搞定 Ollama 和模型

1. 安裝 Ollama

官網下載對應系統版本：Download Ollama on macOS
安裝完成后打開終端，輸入ollama --version，能看到版本號就說明成功了。

2. 拉取 DeepSeek-R1 模型

終端執行命令：

# 推薦先裝7B參數版，平衡性能和資源
ollama pull deepseek-r1:7b

拉取過程可能需要幾分鐘（看網速），耐心等一下。

3. 測試模型是否能用

輸入ollama run deepseek-r1:7b進入交互模式，試試問它："用 Java 寫個單例模式"，能得到正確回復就沒問題了。

三、Java 代碼實戰：從依賴到接口

1. 項目依賴（pom.xml）

先把必要的依賴加上，都是 Spring 生態常用的：

<dependencies><!-- Spring Web核心 --><dependency><groupId>org.springframework.boot</groupId><artifactId>spring-boot-starter-web</artifactId></dependency><!-- HTTP客戶端 --><dependency><groupId>org.apache.httpcomponents.client5</groupId><artifactId>httpclient5</artifactId><version>5.3</version></dependency><!-- JSON處理 --><dependency><groupId>com.fasterxml.jackson.core</groupId><artifactId>jackson-databind</artifactId></dependency><!-- Lombok簡化代碼 --><dependency><groupId>org.projectlombok</groupId><artifactId>lombok</artifactId><optional>true</optional></dependency>
</dependencies>

2. 數據模型：4 個類搞定請求響應

這些類是用來封裝數據的，直接抄就行：

// 接收用戶輸入的模型
@Data
public class ChatRequest {private String message; // 用戶輸入的消息private String sessionId; // 會話ID，多輪對話用
}// 發給Ollama的請求參數
@Data
public class DeepSeekRequest {private String model = "deepseek-r1:7b"; // 模型名private List<Message> messages; // 對話歷史private Float temperature = 0.6f; // 0.6適合對話，不生硬private Boolean stream = false; // 非流式響應@Datapublic static class Message {private String role; // "user"或"assistant"private String content; // 消息內容}
}// Ollama返回的響應
@Data
public class DeepSeekResponse {private String model;private List<ResponseMessage> messages;private Boolean done;@Datapublic static class ResponseMessage {private String role;private String content; // 模型回復的內容}
}// 給前端的最終響應
@Data
public class ChatResponse {private String reply; // 回復內容private String sessionId; // 會話IDprivate long timestamp; // 時間戳
}

3. 會話管理：讓機器人記住上下文

這個服務用來存對話歷史，不然每次對話都是新的：

@Service
public class SessionManager {// 用ConcurrentHashMap存會話，key是sessionIdprivate final Map<String, List<DeepSeekRequest.Message>> sessionHistory = new ConcurrentHashMap<>();// 獲取某個會話的歷史消息public List<DeepSeekRequest.Message> getHistory(String sessionId) {return sessionHistory.computeIfAbsent(sessionId, k -> new ArrayList<>());}// 添加用戶消息到歷史public void addUserMessage(String sessionId, String message) {DeepSeekRequest.Message msg = new DeepSeekRequest.Message();msg.setRole("user");msg.setContent(message);getHistory(sessionId).add(msg);}// 添加機器人回復到歷史public void addAssistantMessage(String sessionId, String message) {DeepSeekRequest.Message msg = new DeepSeekRequest.Message();msg.setRole("assistant");msg.setContent(message);getHistory(sessionId).add(msg);}// 清理會話（可選）public void clearHistory(String sessionId) {sessionHistory.remove(sessionId);}
}

4. 核心服務：調用 Ollama 接口

這部分是關鍵，負責把用戶消息發給模型，再把回復拿回來：

@Service
public class DeepSeekService {// Ollama的API地址，本地部署固定這個private static final String OLLAMA_API_URL = "http://localhost:11434/api/chat";private final CloseableHttpClient httpClient;private final ObjectMapper objectMapper;private final SessionManager sessionManager;// 構造函數注入依賴public DeepSeekService(SessionManager sessionManager) {this.httpClient = HttpClients.createDefault();this.objectMapper = new ObjectMapper();this.sessionManager = sessionManager;}// 處理用戶消息，返回回復public ChatResponse processMessage(ChatRequest request) {// 生成或復用sessionIdString sessionId = request.getSessionId();if (sessionId == null || sessionId.isEmpty()) {sessionId = UUID.randomUUID().toString();}// 構建發給模型的請求DeepSeekRequest deepSeekRequest = new DeepSeekRequest();sessionManager.addUserMessage(sessionId, request.getMessage());deepSeekRequest.setMessages(sessionManager.getHistory(sessionId));try {// 發送POST請求到OllamaHttpPost httpPost = new HttpPost(OLLAMA_API_URL);httpPost.setHeader("Content-Type", "application/json;charset=UTF-8");httpPost.setEntity(new StringEntity(objectMapper.writeValueAsString(deepSeekRequest)));// 執行請求并解析響應try (CloseableHttpResponse response = httpClient.execute(httpPost)) {HttpEntity entity = response.getEntity();if (entity != null) {String responseBody = EntityUtils.toString(entity);DeepSeekResponse deepSeekResponse = objectMapper.readValue(responseBody, DeepSeekResponse.class);// 提取回復內容String reply = deepSeekResponse.getMessages().get(0).getContent();sessionManager.addAssistantMessage(sessionId, reply);// 構建返回結果ChatResponse chatResponse = new ChatResponse();chatResponse.setReply(reply);chatResponse.setSessionId(sessionId);chatResponse.setTimestamp(System.currentTimeMillis());return chatResponse;}}} catch (Exception e) {throw new RuntimeException("調用模型出錯：" + e.getMessage());}return null;}
}

5. 控制器：提供 HTTP 接口

最后寫個控制器，前端就能通過接口調用了：

@RestController
@RequestMapping("/chatbot")
public class ChatController {private final DeepSeekService deepSeekService;public ChatController(DeepSeekService deepSeekService) {this.deepSeekService = deepSeekService;}// 接收消息的接口@PostMapping("/message")public ResponseEntity<ChatResponse> sendMessage(@RequestBody ChatRequest request) {try {ChatResponse response = deepSeekService.processMessage(request);return ResponseEntity.ok(response);} catch (Exception e) {return ResponseEntity.status(500).body(null);}}// 清理會話的接口（可選）@PostMapping("/clear/{sessionId}")public ResponseEntity<Void> clearSession(@PathVariable String sessionId) {sessionManager.clearHistory(sessionId);return ResponseEntity.ok().build();}
}

四、測試運行：用 curl 或 Postman 調用

先啟動 Ollama 服務：ollama serve（后臺運行）
啟動 Spring Boot 應用
用 curl 測試（也可以用 Postman）：

# 第一次請求（沒有sessionId，會自動生成）
curl -X POST http://localhost:8080/chatbot/message \-H "Content-Type: application/json" \-d '{"message":"什么是Spring Boot？"}'# 多輪對話（用第一次返回的sessionId）
curl -X POST http://localhost:8080/chatbot/message \-H "Content-Type: application/json" \-d '{"message":"它和Spring MVC有啥區別？", "sessionId":"第一次返回的ID"}'

返回的 JSON 里有reply字段，就是機器人的回復啦。

五、踩坑指南：這些問題要注意

1. 模型響應慢？

檢查顯卡是否被用上：nvidia-smi看看有沒有 Ollama 進程
換小模型：用 7B 代替 33B 版本
限制內存使用：export OLLAMA_MAX_MEMORY=12GB（根據自己內存調整）

2. 多輪對話記不住上下文？

一定傳對 sessionId，每次對話都要用同一個
服務重啟后，舊的 sessionId 會失效，需要重新獲取

3. 中文亂碼？

請求頭加上charset=UTF-8（代碼里已經加了，注意別刪）

配置 Jackson：

objectMapper.getFactory().configure(JsonGenerator.Feature.ESCAPE_NON_ASCII, true);

4. 內存溢出（OOM）？

給 Java 加內存：啟動參數加-Xmx4g
清理不活躍的會話：加個定時任務，刪除幾小時沒動靜的 session

動手試試吧，有問題可以在評論區交流～

Java+Ollama 本地部署 DeepSeek-R1 對話機器人：從 0 到 1 實戰指南

一、先搞懂：為什么選 DeepSeek-R1？

二、環境搭建：3 步搞定 Ollama 和模型

1. 安裝 Ollama

2. 拉取 DeepSeek-R1 模型

3. 測試模型是否能用

三、Java 代碼實戰：從依賴到接口

1. 項目依賴（pom.xml）

2. 數據模型：4 個類搞定請求響應

3. 會話管理：讓機器人記住上下文

4. 核心服務：調用 Ollama 接口

5. 控制器：提供 HTTP 接口

四、測試運行：用 curl 或 Postman 調用

五、踩坑指南：這些問題要注意

1. 模型響應慢？

2. 多輪對話記不住上下文？

3. 中文亂碼？

4. 內存溢出（OOM）？

相關文章

Java Web項目Dump文件分析指南

Ubuntu網卡驅動無效，不能連接wifi上網

LeetCode Hot 100 二叉搜索樹中第 K 小的元素

5-大語言模型—理論基礎：注意力機制優化

輕松學習C++：基本語法解析

Python Pandas讀取Excel表格中數據并根據時間字段篩選數據

CS231n-2017 Lecture3線性分類器、最優化筆記

windows wsl ubuntu 如何安裝 open-jdk8

Javascript進程和線程通信

堆堆堆，咕咕咕

n8n教程分享,從Github讀取.md文檔內容

分布式ID與冪等性面試題整理

node.js學習筆記1

游戲開發日志

使用 PlanetScope 衛星圖像繪制水質參數：以莫干湖為例

Docker部署前后端分離項目——多項目共享環境部署

學習筆記(39):結合生活案例，介紹 10 種常見模型

BabyAGI 是一個用于自構建自主代理的實驗框架

商業秘密視域下計算機軟件的多重保護困境

深入理解 Spring Boot 自動配置原理