【Springai】 2指定模型的三種方式(Ollama)

Springai 指定模型的三種方式(Ollama)

在實際開發中,Ollama 支持三種常用的模型指定方式:

1. 從 yml 配置讀取默認模型

注意: 這是最基礎、最推薦的方式,必須先配置好才能用自動注入的 OllamaChatModel。

spring:ai:ollama:base-url: http://localhost:11434chat:options:model: deepseek-r1:7b
@Autowired
private OllamaChatModel chatModel;
// 直接調用 chatModel.call(...) 即用默認模型

2. Prompt 臨時指定模型

通過 Prompt 構造時傳入 OllamaOptions,可臨時切換模型:

import org.springframework.ai.ollama.api.OllamaOptions;Prompt prompt = new Prompt(messageList,OllamaOptions.builder().model("qwen2.5-vl") // 臨時指定模型.build());return chatModel.stream(prompt);

3. 創建多個 OllamaChatModel 動態切換

可在配置類中為不同模型創建多個 Bean,或用工廠模式動態切換:

@Bean
public OllamaChatModel ollamaQwenModel() {OllamaApi ollamaApi = OllamaApi.builder().baseUrl("http://localhost:11434").build();// 解析參數OllamaOptions.Builder optionsBuilder = OllamaOptions.builder().model("qwen2.5-vl:3b");return OllamaChatModel.builder().ollamaApi(ollamaApi).defaultOptions(optionsBuilder.build()).build();
}@Bean
public OllamaChatModel ollamaLlamaModel() {OllamaApi ollamaApi = OllamaApi.builder().baseUrl("http://localhost:11434").build();// 解析參數OllamaOptions.Builder optionsBuilder = OllamaOptions.builder().model("llama2:7b");return OllamaChatModel.builder().ollamaApi(ollamaApi).defaultOptions(optionsBuilder.build()).build();
}

或通過自定義工廠類,根據參數動態返回不同模型實例:

public class DynamicModelFactory {public OllamaChatModel getModelByName(String modelName) {// ...根據modelName返回不同OllamaChatModel實例...}
}

接口調用時根據參數動態切換:

OllamaChatModel model = dynamicModelFactory.getModelByName(modelName);
return model.stream(prompt);

建議所有模型還是維護到數據庫,因為大部分模型特別是相同供應商的調用方式都一樣

CREATE TABLE `ai_model` (`id` bigint NOT NULL AUTO_INCREMENT,`vendor` varchar(64) NOT NULL COMMENT '供應商',`icon` varchar(255) DEFAULT NULL COMMENT '圖標URL',`name` varchar(128) NOT NULL COMMENT '模型名稱',`api_key` varchar(255) DEFAULT NULL COMMENT '密鑰',`api_url` varchar(255) NOT NULL COMMENT '模型API地址',`tags` varchar(255) DEFAULT NULL COMMENT '標簽(推理、對話、圖片、語音等,逗號分隔)',`type` varchar(32) NOT NULL COMMENT '類型(對話、圖片、音頻、視頻、量化)',`status` tinyint NOT NULL DEFAULT 1 COMMENT '模型可用狀態 1:可用 0:不可用',`description` text COMMENT '模型描述',`params` json DEFAULT NULL COMMENT '模型參數(如溫度等)',`create_time` timestamp NULL DEFAULT CURRENT_TIMESTAMP,`update_time` timestamp NULL DEFAULT CURRENT_TIMESTAMP ON UPDATE CURRENT_TIMESTAMP,PRIMARY KEY (`id`)
) ENGINE=InnoDB DEFAULT CHARSET=utf8mb4 COLLATE=utf8mb4_german2_ci;

DynamicModelFactory.java

/*** 動態模型工廠,項目啟動時緩存所有模型*/
@Component
public class DynamicModelFactory {@Autowiredprivate AiModelRepository aiModelRepository;private final HashMap<String, MyModel> modelHashMap = new HashMap<>();@PostConstructpublic void init() {List<AiModel> models = aiModelRepository.findAll();ObjectMapper objectMapper = new ObjectMapper();for (AiModel m : models) {MyModel myModel = new MyModel();myModel.vendor = m.getVendor();myModel.name = m.getName();myModel.apiKey = m.getApiKey();myModel.apiUrl = m.getApiUrl();myModel.type = m.getType();myModel.status = m.getStatus();myModel.params = m.getParams();// 這里只實現Ollama,后續可擴展其他供應商if ("ollama".equalsIgnoreCase(m.getVendor())) {OllamaApi ollamaApi = OllamaApi.builder().baseUrl(m.getApiUrl()).build();// 解析參數OllamaOptions.Builder optionsBuilder = OllamaOptions.builder().model(m.getName());if (m.getParams() != null && !m.getParams().isEmpty()) {try {Map<String, Object> paramMap = objectMapper.readValue(m.getParams(), Map.class);if (paramMap.containsKey("temperature")) {optionsBuilder.temperature(Double.parseDouble(paramMap.get("temperature").toString()));}// 可擴展更多參數} catch (Exception ignored) {}}myModel.chatModel = OllamaChatModel.builder().ollamaApi(ollamaApi).defaultOptions(optionsBuilder.build()).build();}// TODO: 其他供應商實現modelHashMap.put(m.getName(), myModel);}}public MyModel getModelByName(String name) {return modelHashMap.get(name);}public void refreshModel(String modelName) {AiModel m = aiModelRepository.findByName(modelName);if (m == null) return;MyModel myModel = new MyModel();myModel.vendor = m.getVendor();myModel.name = m.getName();myModel.apiKey = m.getApiKey();myModel.apiUrl = m.getApiUrl();myModel.type = m.getType();myModel.status = m.getStatus();myModel.params = m.getParams();if ("ollama".equalsIgnoreCase(m.getVendor())) {OllamaApi ollamaApi = OllamaApi.builder().baseUrl(m.getApiUrl()).build();OllamaOptions.Builder optionsBuilder = OllamaOptions.builder().model(m.getName());if (m.getParams() != null && !m.getParams().isEmpty()) {try {Map<String, Object> paramMap = new ObjectMapper().readValue(m.getParams(), Map.class);if (paramMap.containsKey("temperature")) {optionsBuilder.temperature(Double.parseDouble(paramMap.get("temperature").toString()));}} catch (Exception ignored) {}}myModel.chatModel = OllamaChatModel.builder().ollamaApi(ollamaApi).defaultOptions(optionsBuilder.build()).build();}// TODO: 其他供應商實現modelHashMap.put(m.getName(), myModel);}public static class MyModel {@Schema(description = "供應商")private String vendor;@Schema(description = "模型名稱")private String name;@Schema(description = "密鑰")private String apiKey;@Schema(description = "模型API地址")private String apiUrl;@Schema(description = "類型(對話、圖片、音頻、視頻、量化)")private String type;@Schema(description = "模型可用狀態 1:可用 0:不可用")private Integer status;@Schema(description = "模型參數(如溫度等,json格式)")private String params;@Schema(description = "ollama對應的會話對象")private OllamaChatModel chatModel;// TODO: 其他供應商的會話ChatModelpublic OllamaChatModel getChatModel() { return chatModel; }public String getVendor() { return vendor; }public String getName() { return name; }public String getApiKey() { return apiKey; }public String getApiUrl() { return apiUrl; }public String getType() { return type; }public Integer getStatus() { return status; }public String getParams() { return params; }}
} 

本文來自互聯網用戶投稿,該文觀點僅代表作者本人,不代表本站立場。本站僅提供信息存儲空間服務,不擁有所有權,不承擔相關法律責任。
如若轉載,請注明出處:http://www.pswp.cn/web/86874.shtml
繁體地址,請注明出處:http://hk.pswp.cn/web/86874.shtml
英文地址,請注明出處:http://en.pswp.cn/web/86874.shtml

如若內容造成侵權/違法違規/事實不符,請聯系多彩編程網進行投訴反饋email:809451989@qq.com,一經查實,立即刪除!

相關文章

python | numpy小記(四):理解 NumPy 中的 `np.round`:銀行家舍入策略

python | numpy小記&#xff08;四&#xff09;&#xff1a;理解 NumPy 中的 np.round&#xff1a;銀行家舍入策略 一、函數簽名與參數說明二、“銀行家舍入”策略三、基礎示例四、與 Python 內建 round 的異同五、使用注意事項六、擴展用法&#xff1a;自定義舍入策略七、總結…

shell腳本定時執行收集Oracle大表的日分區及創建分區本地索引

近期業務上了一張大表,每日新增分區,每日分區數據量為3千萬行。根據每日分區創建分區本地索引。同事添加定時收集前一日每日分區統計信息。 1、創建分區本地索引 (分區索引數量需要和分區name數量一致) create index nmld.add_event_occur_time on nmld.esa_event (occur…

使用 Spread.net將 Excel 中的文本拆分為多段

引言&#xff1a; 在 .NET 應用程序中處理 Excel 數據時&#xff0c;常常會碰到需要把文本拆分成多段的情況。例如在數據清洗、數據分析等場景下&#xff0c;將長文本按照特定規則拆分為多段能讓數據更便于處理和分析。Spread.NET作為一款強大的 .NET 電子表格組件&#xff0c…

QT實現一個三軸位移臺的控制界面

文章目錄 0 引入1、圓形轉盤2、其他3、引用 0 引入 本來想做一個酷炫的3D位移臺控制程序&#xff0c;要有一個類似遙控器手柄那種界面&#xff0c;在網上找了半天也沒有&#xff0c;想要有那種效果還要用異性按鈕做&#xff0c;迫在眉睫的情況下&#xff0c;使用了自己的方法&…

Java 案例 6 - 數組篇(基礎)

數組的平均值、最大&#xff08;小&#xff09;值。數組的反轉 需求&#xff1a;開發一個程序。假設班級有8名學生&#xff0c;用戶可以錄入8名學生的Java成績&#xff0c;成績類型是小數&#xff0c;并輸出平均分&#xff0c;最高分和最低分。 import java.util.Scanner; …

Java外觀模式實現方式與測試方法

一、外觀模式的實現方式 外觀模式的核心是通過封裝復雜子系統的調用邏輯&#xff0c;為客戶端提供一個統一的簡單接口。以下是實現步驟及示例&#xff1a; 定義子系統類 子系統類負責實現具體功能&#xff0c;與外觀類解耦。例如&#xff0c;家庭影院系統中的投影儀、音響等組…

《解鎖AudioSet:開啟音頻分析的無限可能》

音頻新時代的 “密鑰”&#xff1a;AudioSet 登場 在科技飛速發展的今天&#xff0c;音頻作為信息傳播與交互的關鍵媒介&#xff0c;早已滲透到現代科技的各個角落。從智能手機中的語音助手&#xff0c;讓我們通過簡單的語音指令就能查詢信息、發送消息&#xff0c;到智能家居系…

50天50個小項目 (Vue3 + Tailwindcss V4) ? | ThemeClock(主題時鐘)

&#x1f4c5; 我們繼續 50 個小項目挑戰&#xff01;—— ThemeClock組件 倉庫地址&#xff1a;https://github.com/SunACong/50-vue-projects 項目預覽地址&#xff1a;https://50-vue-projects.vercel.app/ 使用 Vue 3 的 Composition API 和 <script setup> 語法結…

直播預告丨聊聊Milvus 2.6新功能及背后的開發故事

7 月 1 日晚上 20:00-21:00&#xff0c;Zilliz 視頻號直播間&#xff0c;Zilliz 合伙人和研發VP 欒小凡將帶來《一步到位&#xff0c;詳解 Milvus 2.6 新功能》的分享&#xff0c;帶你拆解 Milvus 2.6 四大突破&#xff1a; 降本增效的底層架構開發者生產力拉滿的新功能性能不打…

pyenv-win 配置指南?

在 Python 開發過程中&#xff0c;經常會遇到需要使用不同版本 Python 的情況。比如&#xff0c;舊項目依賴某個特定的 Python 版本&#xff0c;而新項目則要求使用更新的版本。這時&#xff0c;版本管理工具就顯得尤為重要。pyenv-win就是一款專門為 Windows 系統設計的 Pytho…

MongoDB 常見查詢語法與命令詳解

MongoDB 作為文檔型數據庫&#xff0c;其查詢語言基于 BSON&#xff08;二進制 JSON&#xff09;格式&#xff0c;與傳統關系型數據庫的 SQL 語法有較大差異。 一、基本查詢命令 1. find()&#xff1a;查詢文檔 語法&#xff1a;db.collection.find(查詢條件, 投影)示例&…

AlpineLinux安裝docker

或許你在docker中使用 Alpine Linux 的鏡像使用得多,但是有沒有想過在 Alpine Linux 上安裝 Docker 來使用呢?默認情況下,Docker 包位于社區倉庫中,因此在使用包管理來安裝docker之前建議更換為國內源,并開啟社區倉庫的鏈接。 下面的操作是在root用戶下運行的,如果要使用…

docker安裝gitlab并配置ssl證書

本篇安裝環境 Docker版本&#xff1a;Docker version 28.3.0 域名&#xff1a;test.disallow.cn 自簽證書&#xff1a;/etc/gitlab/ssl&#xff08;已經存放在該目錄&#xff09; 一、拉取鏡像 docker run -itd \--privilegedtrue \--hostname gitlab.test.disallow.cn \--p…

Java開發者轉型AI時代的路徑

Java開發者轉型AI時代的路徑 引言 隨著人工智能技術的飛速發展&#xff0c;AI已不再是遙不可及的未來&#xff0c;而是深刻影響著各行各業的當下。對于Java開發者而言&#xff0c;面對AI浪潮&#xff0c;如何順勢而為&#xff0c;實現職業轉型與技能升級&#xff0c;成為擺在…

QT6 源(140)模型視圖架構里的視圖總基類 QAbstractItemView:

&#xff08;1&#xff09;先給出本類的繼承關系 &#xff1a; &#xff08;2&#xff09;Qt 已經預先為視圖定義了鍵盤功能&#xff0c;Qt 大師們通過編程&#xff0c;已經完善了視圖對鍵盤的響應操作 &#xff1a; &#xff08;3&#xff09;因為本類是抽象基類&#xff0c;無…

vue上傳各種文件,并預覽組件,(預覽,下載),下載resources目錄下文件

前端組件vue 最終效果 <template><div ><div class"file-list" v-if"existingFiles.length > 0"><div class"file-card" v-for"(file, index) in existingFiles" :key"file.id"><div clas…

【CS創世SD NAND征文】SD NAND賦能新一代兒童智能玩具

基于全志F1C100S的高可靠存儲方案 文章目錄 基于全志F1C100S的高可靠存儲方案[toc]前言 一、應用產品介紹&#xff1a;兒童智能玩具的需求演變二、技術方案介紹&#xff1a;構建智能玩具的"大腦"與"記憶庫"三、核心技術模塊分析3.1 主控芯片&#xff1a;全…

mac觸摸板設置右鍵

在 Mac 筆記本上&#xff0c;觸摸板默認沒有物理左右鍵分區&#xff0c;但可以通過以下方式實現“右鍵”功能&#xff08;稱為 輔助點按&#xff09;&#xff1a; 一、啟用與使用右鍵&#xff08;輔助點按&#xff09; 步驟1&#xff1a;檢查系統設置 點擊屏幕左上角 &#x…

穩定幣發行量創紀錄地超過 Visa 交易量

穩定幣發行量創紀錄地超過 Visa 交易量 穩定幣的崛起正在重塑全球金融格局&#xff0c;華夏基金首席執行官甘天&#xff08;Gan Tian&#xff09;強調了穩定幣的快速增長&#xff0c;并指出穩定幣的交易量在短短五年內就超過了Visa 40年的交易量。這凸顯了貨幣使用的轉變。 穩…

編程 IDE 混戰簡史:從 Copilot 到 Claude Code,一場重塑開發方式的戰爭

unsetunset引言&#xff1a;開發新紀元的序幕unsetunset 編程世界&#xff0c;從最初依賴打孔卡和簡陋的命令行工具&#xff0c;到如今功能琳瑯滿目的集成開發環境&#xff08;IDE&#xff09;&#xff0c;每一步都見證了效率與智能的飛躍。IDE作為開發者與代碼交互的核心界面&…