Spring AI Alibaba 對話記憶使用

一、對話記憶 (ChatMemory)簡介

1、對話記憶介紹

”大模型的對話記憶”這一概念,根植于人工智能與自然語言處理領域,特別是針對具有深度學習能力的大型語言模型而言,它指的是模型在與用戶進行交互式對話過程中,能夠追蹤、理解并利用先前對話上下文的能力。

此機制使得大模型不僅能夠響應即時的輸入請求,還能基于之前的交流內容能夠在對話中記住先前的對話內容,并根據這些信息進行后續的響應。

這種記憶機制使得模型能夠在對話中持續跟蹤和理解用戶的意圖和上下文,從而實現更自然和連貫的對話。

2、基于memory的對話記憶

spring-ai-alibaba支持基于chat memory的對話記憶,也就是不需要調用顯示的記錄每一輪的對話歷史。而是將對話的上下文內容進行存儲和記錄。

開發者可以自行實現ChatMemory基于類似于文件、內存,MySQL,Redis等方式進行上下文內容的存儲和記錄。

二、對話記憶 (ChatMemory)使用

Spring AI Alibaba 對話記憶 (ChatMemory):https://java2ai.com/docs/1.0.0-M6.1/tutorials/memory/

Spring AI Alibaba 支持以上 Model 抽象與通義系列模型的適配,并通過 spring-ai-alibaba-starter AutoConfiguration 自動初始化了默認實例,因此我們可以在應用程序中直接注入 ChatModel、ImageModel 等 bean,當然在需要的時候也可以自定義 Model 實例。

1、基于內存存儲的對話記憶實現

在普通 Controller Bean 中注入 ChatMemory 實例,實現下面幾個功能:

  • 簡單調用
  • 流式調用

由于 InMemoryChatMemory是內置支持,所以我們直接使用它。

編寫 Controller接口

/*** 基于內存的對話記憶*/
@Slf4j
@RestController
@RequestMapping("/dashscope/chat-memory/inMemory")
public class DashScopeMemoryInMemoryController {//初始化基于內存的對話記憶private ChatMemory chatMemory = new InMemoryChatMemory();private final ChatClient dashScopeChatClient;public DashScopeMemoryInMemoryController(ChatModel chatModel) {this.dashScopeChatClient = ChatClient.builder(chatModel).build();}/*** 獲取對話的唯一標識接口*/@GetMapping("/getChatId")public String getChatId() {//對話記憶的唯一標識String chatId = UuidUtils.generateUuid();return chatId;}/*** 簡單調用*/@GetMapping("/simple/chat")public String simpleChat(@RequestParam(defaultValue = "你好,介紹下你自己!") String userInputPrompt,@RequestParam("chatId") String chatId) {//對話記憶的唯一標識if (StringUtils.isBlank(chatId)) {return "chatId is null";}String aiOutput = dashScopeChatClient.prompt(userInputPrompt).advisors(new MessageChatMemoryAdvisor(chatMemory)).advisors(a -> a.param(CHAT_MEMORY_CONVERSATION_ID_KEY, chatId).param(CHAT_MEMORY_RETRIEVE_SIZE_KEY, 100)).call().content();log.info("simpleChat --> userInputPrompt = {}", userInputPrompt);return aiOutput;}/*** 流式調用。* 可以使大模型的輸出信息實現打字機效果。*/@GetMapping("/stream/chat")public Flux<String> streamChat(HttpServletResponse response,@RequestParam(defaultValue = "你好,介紹下你自己!") String userInputPrompt,@RequestParam("chatId") String chatId) {// 避免接口返回亂碼response.setCharacterEncoding("UTF-8");log.info("streamChat --> userInputPrompt ={}", userInputPrompt);Flux<String> aiOutput = dashScopeChatClient.prompt(userInputPrompt).advisors(new MessageChatMemoryAdvisor(chatMemory)).advisors(a -> a.param(CHAT_MEMORY_CONVERSATION_ID_KEY, chatId).param(CHAT_MEMORY_RETRIEVE_SIZE_KEY, 100)).stream().content();return aiOutput;}}

啟動項目,訪問接口與 AI 大模型智能對話。

我們獲取到對話id之后,進行下面多輪的對話,對話記憶機制生效。

  1. 你是一個旅游規劃師
  2. 我想去西安
  3. 能幫我推薦一些旅游景點嗎?
  4. 那里的美食如何?
  5. 那里有什么樣的歷史文化?

在這里插入圖片描述
在這里插入圖片描述

基于 MySQL,Redis等方式進行上下文內容的存儲和記錄,需要我們引入官方依賴,然后將 InMemoryChatMemory替換為對應的MySQL,Redis方式并配置連接信息。

– 求知若饑,虛心若愚。

本文來自互聯網用戶投稿,該文觀點僅代表作者本人,不代表本站立場。本站僅提供信息存儲空間服務,不擁有所有權,不承擔相關法律責任。
如若轉載,請注明出處:http://www.pswp.cn/news/899742.shtml
繁體地址,請注明出處:http://hk.pswp.cn/news/899742.shtml
英文地址,請注明出處:http://en.pswp.cn/news/899742.shtml

如若內容造成侵權/違法違規/事實不符,請聯系多彩編程網進行投訴反饋email:809451989@qq.com,一經查實,立即刪除!

相關文章

vdi模式是什么

?VDI模式&#xff08;Virtual Desktop Infrastructure&#xff09;是一種基于服務器的計算模型&#xff0c;其核心思想是將所有計算和存儲資源集中在服務器上&#xff0c;用戶通過前端設備&#xff08;如瘦客戶機&#xff09;訪問服務器上的虛擬桌面?? VDI模式的工作原理 在…

【分布式】深入剖析 Sentinel 限流:原理、實現

在當今分布式系統盛行的時代&#xff0c;流量的劇增給系統穩定性帶來了巨大挑戰。Sentinel 作為一款強大的流量控制組件&#xff0c;在保障系統平穩運行方面發揮著關鍵作用。本文將深入探討 Sentinel 限流的原理、實現方案以及其優缺點&#xff0c;助力開發者更好地運用這一工具…

c#winform,倒鴨子字幕效果,typemonkey字幕效果,抖音瀑布流字幕效果

不廢話 直接上效果圖 C# winform 開發抖音的瀑布流字幕。 也是typemonkey插件字幕效果 或者咱再網上常說的倒鴨子字幕效果 主要功能 1&#xff0c;軟件可以自定義添加字幕內容 2&#xff0c;軟件可以添加字幕顯示的時間區間 3&#xff0c;可以自定義字幕顏色&#xff0c;可以隨…

Pycharm(八):字符串切片

一、字符串分片介紹 對操作的對象截取其中一部分的操作&#xff0c;比如想要獲取字符串“888666qq.com前面的qq號的時候就可以用切片。 字符串、列表、元組都支持切片操作。 語法&#xff1a;字符串變量名 [起始:結束:步長] 口訣&#xff1a;切片其實很簡單&#xff0c;只顧頭來…

圖片解釋git的底層工作原理

&#xff08;圖片來源&#xff1a;自己畫的&#xff09; 基于同一個commit創建新分支 &#xff08;圖片來源&#xff1a;書籍《Linux運維之道》 ISBN 9787121461811&#xff09; 在新分支上修改然后commit一次 &#xff08;圖片來源&#xff1a;書籍《Linux運維之道》 ISBN 978…

leetcode994.腐爛的橘子

思路源自 【力扣hot100】【LeetCode 994】腐爛的橘子&#xff5c;多源BFS 這里圖中的腐爛的的橘子是同時對周圍進行腐化&#xff0c;所以采用多源bfs就能解決 多源bfs與單源bfs的區別就在于隊列取出時一輪是取出隊列當中的全部元素 class Solution {public int orangesRotti…

【華為OD技術面試真題 - 技術面】- Java面試題(15)

華為OD面試真題精選 專欄:華為OD面試真題精選 目錄: 2024華為OD面試手撕代碼真題目錄以及八股文真題目錄 介紹下TCP/UDP TCP(傳輸控制協議)和 UDP(用戶數據報協議) TCP(Transmission Control Protocol)和 UDP(User Datagram Protocol)是兩種常見的傳輸層協議,主要…

?在 Fedora 系統下備份遠程 Windows SQL Server 數據庫的完整方案

?一、環境準備與工具安裝? ?1. 安裝 Microsoft SQL Server 命令行工具? Fedora 需安裝 mssql-tools 和 ODBC 驅動&#xff1a; # 添加 Microsoft 倉庫 sudo curl -o /etc/yum.repos.d/msprod.repo https://packages.microsoft.com/config/rhel/8/prod.repo# 安裝工具包 …

DeepSeek:巧用前沿AI技術,開啟智能未來新篇章

引言 近年來&#xff0c;人工智能&#xff08;AI&#xff09;技術迅猛發展&#xff0c;大模型成為全球科技競爭的核心賽道。在這場AI革命中&#xff0c;DeepSeek作為中國領先的大模型研發團隊&#xff0c;憑借其創新的技術架構、高效的訓練方法和廣泛的應用場景&#xff0c;迅…

R語言實現軌跡分析--traj和lcmm包體會

R語言實現軌跡分析–traj和lcmm包體會 軌跡分析是對重復測量數據的一種歸納&#xff0c;轉化為一種分類變量&#xff0c;比如手術后1&#xff5e;7天內的疼痛評分&#xff0c;可以形成術后急性痛軌跡。形成的軌跡作為一個分類變量&#xff0c;可以用于預測疾病的預后&#xff…

Vue 3 事件總線詳解:構建組件間高效通信的橋梁

Vue 3 事件總線詳解&#xff1a;構建組件間高效通信的橋梁 為什么需要事件總線&#xff1f;使用 mitt 實現事件總線1. 安裝 mitt2. 創建事件總線3. 在組件中使用事件總線發送端組件&#xff08;例如 ComponentA.vue&#xff09;接收端組件&#xff08;例如 ComponentB.vue&…

MySQL的基礎語法1(增刪改查、DDL、DML、DQL和DCL)

目錄 一、基本介紹 二、SQL通用語法 三、SQL分類(DDL、DML、DQL、DCL) 1.DDL 1.1數據庫操作 1.2表操作 1.2.1表操作-查詢創建 1.2.2表操作-數據類型 1&#xff09;數值類型 2&#xff09;字符串類型 3&#xff09;日期時間類型?編輯 4&#xff09;表操作-案例 1.2.3…

【NLP】15. NLP推理方法詳解 --- 動態規劃:序列標注,語法解析,共同指代

動態規劃 (Dynamic Programming) 動態規劃&#xff08;Dynamic Programming&#xff0c;簡稱 DP&#xff09;是一種通過將問題分解為較小子問題來優化計算效率的技術。它特別適用于優化最優解問題&#xff0c;比如序列標注&#xff08;sequence tagging&#xff09;這類任務。…

JavaScript中的NaN、undefined和null 的區別

NaN代表"Not a Number",它是一種特殊的數值,用于表示非數字值。當一個操作無法返回有效的數值時,通常會得到NaN作為結果。 let result = 10 / abc; console.log(result); // 輸出 NaN需要注意的是,NaN與自身不相等,我們無法通過簡單的比較操作符(如==或===)來…

Turtle事件處理(鍵盤與鼠標交互)

Turtle 提供了 事件驅動編程,允許我們使用 鍵盤 和 鼠標 控制 Turtle,從而實現交互式繪圖。例如,我們可以讓 Turtle 響應 按鍵、鼠標點擊 和 拖動 事件,使其根據用戶的輸入進行移動、旋轉或繪制圖形。 1. 事件機制概述 Turtle 的事件處理主要依賴 turtle.Screen() 提供的 …

【Keepalived】Keepalived-2.3.3明確結束對CentOS 7的支持

2025年3月30日&#xff0c;官方發布了Keepalived的最新版&#xff0c;版本號&#xff1a;2.3.3 而2024年11月3日發布的2.3.2版本&#xff0c;在CentOS 7.9上編譯的時候&#xff0c;就出現了報錯&#xff0c;但是在Alma Linux 8.10上&#xff0c;則可以成功編譯安裝&#xff0c…

PyTorch --torch.cat張量拼接原理

在 PyTorch 的 torch.cat 函數中&#xff0c;out 參數用于指定輸出張量的存儲位置。是否使用 out 參數直接影響結果的存儲方式和張量的內存行為。以下是詳細解釋&#xff1a; 不使用 out 參數&#xff08;默認行為&#xff09; 含義&#xff1a;不提供 out 參數時&#xff0c;…

人工智能之數學基礎:矩陣對角化的本質

本文重點 前面的課程中,我們學習了矩陣的對角化,基于對角化可以將矩陣A轉變為對角矩陣D,但是你有沒有想過,為什么要進行矩陣對角化,矩陣對角化究竟做了一件什么事情呢? 矩陣對角化的本質 幾何解釋: 從幾何變換的角度看,矩陣對角化意味著我們找到了一組基,使得線性變…

ubuntu的ubuntu--vg-ubuntu--lv磁盤擴容

在我們安裝ubuntu時&#xff0c;如果選擇的是自動分區&#xff0c;就會按照邏輯卷的形式來分區&#xff0c;并且只分配100G其余的并不會被分配&#xff0c;這對我們大多數情況來說都是不合理的&#xff0c;所以&#xff0c;如何擴充呢 下面以一個小的案例來說明如何擴充 問題…

Redis BitMap 實現簽到及連續簽到統計

一、引言 用戶簽到功能是很多應用都離不開的一個板塊&#xff0c;單詞打開、QQ達人等等為我們所熟知&#xff0c;這項功能該如何實現呢&#xff0c;一些朋友可能想當然的覺得無非將每日的簽到數據記錄下來不就好了&#xff0c;不會去細想用誰記錄&#xff0c;如何記錄才合適。 …