SpringAI框架中的RAG知識庫檢索與增強生成模型詳解

SpringAI框架中的RAG知識庫檢索與增強生成模型詳解

一、RAG簡介

RAG(Retrieval-Augmented Generation)可以通過檢索知識庫,克服大模型訓練完成后參數凍結的局限性,攜帶知識讓大模型根據知識進行回答。

二、SpringAI框架支持的RAG模塊

SpringAI框架提供了模塊化的API來支持RAG,主要包括:

  • QuestionAnswerAdvisor
  • RetrievalArgumentAdvisor

1. QuestionAnswerAdvisor

提供簡單便捷的RAG流功能,只需指定簡單參數即可進行知識庫檢索。 示例代碼:

QuestionAnswerAdvisor questionAnswerAdvisor = QuestionAnswerAdvisor.builder(vectorStore).searchRequest(SearchRequest.builder().similarityThreshold(0.5)  // 只返回相似度高于0.5的結果.topK(3)                  // 只返回前三個結果.filterExpression(newFilterExpressionBuilder().eq("a","b").build())  // 只檢索a==b的文檔.build()).build();ChatClient chatClient = ChatClient.builder(openAiChatModel).defaultOptions(OpenAiChatOptions.builder().model("gpt-3.5-turbo").build()).build();ChatResponse response = chatClient.prompt().advisors(questionAnswerAdvisor).user(u -> u.text("你好")).call().chatResponse();

動態添加過濾條件示例:

chatClient.prompt().user(u -> u.text("hello")).advisors(a -> a.param(QuestionAnswerAdvisor.FILTER_EXPRESSION, "a==b")).call().chatResponse();

這里的lambda表達式中的aAdvisorContext.Builder實例,param()用于共享參數,advisor自動完成檢索和拼接。

2. RetrievalArgumentAdvisor

提供更豐富功能,支持自定義檢索前預處理、檢索、檢索后處理及生成。

簡單RAG實現示例:
Advisor retrievalAugmentationAdvisor = RetrievalAugmentationAdvisor.builder().documentRetriever(VectorStoreDocumentRetriever.builder().similarityThreshold(0.50).vectorStore(vectorStore).build()).build();String answer = chatClient.prompt().advisors(retrievalAugmentationAdvisor).user(question).call().content();
檢索前預處理
  • CompressionQueryTransformer:壓縮用戶提問,適合長對話上下文。

    Query query = Query.builder().text("And what is its second largest city?").history(newUserMessage("What is the capital of Denmark?"),newAssistantMessage("Copenhagen is the capital of Denmark.")).build();QueryTransformer transformer = CompressionQueryTransformer.builder().chatClientBuilder(chatClientBuilder).build();Query transformedQuery = transformer.transform(query);
    

    也可讓advisor自動完成:

    CompressionQueryTransformer compressionQueryTransformer = CompressionQueryTransformer.builder().chatClientBuilder(ChatClient.builder(openAiChatModel)).build();RetrievalAugmentationAdvisor retrievalAugmentationAdvisor = RetrievalAugmentationAdvisor.builder().documentRetriever(VectorStoreDocumentRetriever.builder().build()).queryTransformers(compressionQueryTransformer).build();ChatClient.builder(openAiChatModel).build().prompt().user(u -> u.text("中國第二大的城市是哪里")).messages(newUserMessage("中國首都城市是哪里")).messages(newAssistantMessage("北京")).advisors(retrievalAugmentationAdvisor).call().chatResponse();
    
  • RewriteQueryTransformer:重寫用戶輸入以優化檢索。

    QueryTransformer queryTransformer = RewriteQueryTransformer.builder().chatClientBuilder(chatClientBuilder).build();
    
  • TranslationQueryTransformer:翻譯查詢為目標語言。

    QueryTransformer transformer = TranslationQueryTransformer.builder().chatClientBuilder(chatClientBuilder).targetLanguage("english").build();
    
  • MultiQueryExpander:生成多個查詢拓展以獲取更多相關結果。

    MultiQueryExpander expander = MultiQueryExpander.builder().chatClientBuilder(chatClientBuilder).numberOfQueries(3).includeOriginal(false).build();
    
檢索階段
  • VectorStoreDocumentRetriever:向量庫檢索相似文檔。
    VectorStoreDocumentRetriever vectorStoreDocumentRetriever = VectorStoreDocumentRetriever.builder().vectorStore(vectorStore).topK(4).filterExpression(newFilterExpressionBuilder().eq("a","b").build()).similarityThreshold(0.4).build();List<Document> documents = vectorStoreDocumentRetriever.retrieve(newQuery("What is the main character of the story?"));
    

    也可以交給advisor自動完成。

檢索后處理
  • 重新排序文檔
  • 刪除無關或重復文檔
  • 壓縮文檔內容減少干擾
生成階段
  • ContextualQueryAugmenter:將檢索到的內容拼接到用戶提問中。
    ContextualQueryAugmenter contextualQueryAugmenter = ContextualQueryAugmenter.builder().allowEmptyContext(false) // 不允許空內容.build();
    

    主要功能:

    • 檢查檢索結果是否為空
    • 非空時拼接檢索結果注入提示模板
    • 空且不允許空上下文時,設置空變量并指示模型不根據知識回答
    • 允許空上下文時直接放行

以上即為SpringAI框架中RAG功能的詳細介紹及示例代碼,涵蓋了從簡單到復雜的知識庫檢索與增強生成流程。

本文來自互聯網用戶投稿,該文觀點僅代表作者本人,不代表本站立場。本站僅提供信息存儲空間服務,不擁有所有權,不承擔相關法律責任。
如若轉載,請注明出處:http://www.pswp.cn/bicheng/80370.shtml
繁體地址,請注明出處:http://hk.pswp.cn/bicheng/80370.shtml
英文地址,請注明出處:http://en.pswp.cn/bicheng/80370.shtml

如若內容造成侵權/違法違規/事實不符,請聯系多彩編程網進行投訴反饋email:809451989@qq.com,一經查實,立即刪除!

相關文章

Delphi12安裝Android開發的配置

Delphi12如果要開發android和Linux系統,需要在安裝的時候安裝這兩個選項,否則,就找不到開發平臺。 1、Adroid開發三劍客必須是指: JDK,SDK,NDK三洋,其中JDK是必須要安裝的,最好使用Installer安裝,否則自解壓的免安裝版在安裝過程中會退出。 2、開始安裝Delphi12. …

OpenHarmony launcher開發——刪除dock欄

開發環境 OpenHarmony 5.0.0 代碼修改 效果

FreeRTOS如何實現100%的硬實時性?

實時系統在嵌入式應用中至關重要&#xff0c;其核心在于確保任務在指定時間內完成。根據截止時間滿足的嚴格程度&#xff0c;實時系統分為硬實時和軟實時。硬實時系統要求任務100%滿足截止時間&#xff0c;否則可能導致災難性后果&#xff0c;例如汽車安全系統或醫療設備。軟實…

微軟推動智能體協同運作:支持 A2A、MCP 協議

今日凌晨&#xff0c;微軟宣布 Azure AI Foundry 和 Microsoft Copilot Studio 兩大開發平臺支持最新 Agent 開發協議 A2A&#xff0c;并與谷歌合作開發擴大該協議&#xff0c;這一舉措對智能體賽道意義重大。 現狀與變革意義 當前智能體領域類似戰國時代&#xff0c;各家技術…

從“山谷論壇”看AI七劍下天山

始于2023年的美國山谷論壇(Hill and Valley Forum)峰會,以“國會山與硅谷”命名,寓意連接科技界與國家安全戰略。以人工智能為代表的高科技,在逆全球化時代已成為大國的致勝高點。 論壇創辦者Jacob Helberg,現在是華府的副國務卿,具體負責經濟、環境和能源事務。早先曾任…

Docker封裝深度學習模型

1.安裝Docker Desktop 從官網下載DockerDesktop&#xff0c;安裝。&#xff08;默認安裝位置在C盤&#xff0c;可進行修改&#xff09; "D:\Program Files (x86)\Docker\Docker Desktop Installer.exe" install --installation-dir"D:\Program Files (x86)\Do…

Linux 內核中的 security_sk_free:安全模塊與 Socket 釋放機制解析

引言 在 Linux 內核中,網絡通信和進程間交互(IPC)的核心數據結構之一是 struct sock(即 socket)。其生命周期管理涉及復雜的資源分配與釋放邏輯。本文聚焦于 security_sk_free 這一函數,探討其作用、調用場景以及與安全模塊的交互機制,并解答一個常見疑問:在單機間 TC…

工業與協議融合篇:如何將多個協議集成進一個系統?

?? 本文為《嵌入式通信協議全解析》第六篇,深入探討如何在工業或物聯網系統中同時集成 BLE、CAN、LoRa、MQTT、RS485 等多種通信協議,實現一個高效、可控、穩定運行的嵌入式通信架構。 ?? 一、為什么需要多協議融合? 在真實產品中,單一通信協議往往無法滿足所有業務需…

手撕紅黑樹的 左旋 與 右旋

一、為什么需要旋轉&#xff1f; 在紅黑樹中&#xff0c;插入或刪除節點可能會破壞其五條性質&#xff0c;比如高度不平衡或連續紅節點。 為了恢復紅黑性質&#xff0c;我們采用局部旋轉來“調整樹形結構”&#xff0c;保持平衡。 二、旋轉本質是“局部變形” 左旋和右旋不會…

不用官方EDA怎么開發FPGA?

目前FPGA的開發和官方的EDA工具是高度綁定的&#xff0c;用哪家的芯片只能用其配套的EDA工具進行開發&#xff08;綜合可選工具&#xff0c;布局布線沒有可選的工具&#xff09;&#xff0c;那么有沒有其他的開發方式呢&#xff1f;今天就介紹一個使用開源工具鏈來開發FPGA的方…

QuecPython+Aws:快速連接亞馬遜 IoT 平臺

提供一個可接入亞馬遜 Iot 平臺的客戶端&#xff0c;用于管理亞馬遜 MQTT 連接和影子設備。 初始化客戶端 Aws class Aws(client_id,server,port,keep_alive,ssl,ssl_params)參數&#xff1a; client_id (str) - 客戶端唯一標識。server (str) - 亞馬遜 Iot 平臺服務器地址…

44.輻射發射整改簡易摸底測試方法

輻射發射整改簡易摸底測試方法 1. 正式摸底預測試2. 簡易方法預測試3. 分析頻譜4. 探查傳播路徑5. 施加措施6. 與簡易方法預測試效果對比 1. 正式摸底預測試 去正式實驗室做一次預測試&#xff0c;取得頻譜圖&#xff1b;確定超標頻點和超標量&#xff08;備用&#xff09;。 …

OpenCV中適用華為昇騰(Ascend)后端的逐元素操作(Per-element Operations)

操作系統&#xff1a;ubuntu22.04 OpenCV版本&#xff1a;OpenCV4.9 IDE:Visual Studio Code 編程語言&#xff1a;C11 算法描述 針對華為昇騰&#xff08;Ascend&#xff09;后端的逐元素操作&#xff08;Per-element Operations&#xff09;&#xff0c;這些操作通常用于圖…

Web前端VSCode如何解決打開html頁面中文亂碼的問題(方法2)

Web前端—VSCode如何解決打開html頁面中文亂碼的問題&#xff08;方法2&#xff09; 1.打開VScode后&#xff0c;依次點擊 文件 >> 首選項 >> 設置 2.打開設置后&#xff0c;依次點擊 文本編輯器 >> 文件&#xff08;或在搜索框直接搜索“files.autoGuessEnc…

【UltralyticsYolo11圖像分類完整項目-04】代碼重構

經過上一篇博客,我們實現 了一個cpp文件,可以預測單個圖像和多個圖像。為了更加簡化代碼,方便部署,我們需要對代碼進行重構:將功能模塊化到頭文件中。 完整代碼下載鏈接:點擊這里 重構的優點 模塊化設計:將不同功能分離到不同的類中,每個類有明確的職責更好的可維護性:…

Debezium RelationalSnapshotChangeEventSource詳解

Debezium RelationalSnapshotChangeEventSource詳解 1. 類的作用與功能 1.1 核心功能 RelationalSnapshotChangeEventSource是Debezium中用于關系型數據庫快照的核心抽象類,主要負責: 數據快照:對數據庫表進行全量數據快照模式捕獲:捕獲數據庫表結構事務管理:確保快照過…

DeepInjectSQL - 基于 AI 生成對抗網絡(GAN)的下一代 SQL 注入自動化漏洞獵手

概述 SQLMap本身是一個成熟的自動化SQL注入工具&#xff0c;可以與GAN結合起來&#xff0c;讓GAN生成的Payload替代傳統的手工或規則生成的測試用例&#xff0c;從而提高檢測的覆蓋率和效率。 分析可行性 GAN通常用于生成類似真實數據分布的數據&#xff0c;例如圖片、文本等。…

Python 爬蟲之 XPath 元素定位

XPath 簡介 XPath (XML Path Language) 最初是為了在 XML 文檔中進行導航而設計的語言&#xff0c;后來被廣泛應用于 HTML 文檔的解析。與 BeautifulSoup 相比&#xff0c;XPath 有以下特點&#xff1a; 語法強大&#xff1a;可以通過簡潔的表達式精確定位元素跨平臺性&#…

聊聊自動化辦公未來趨勢

1. 自動化辦公未來趨勢 1.1 智能化與AI融合加深 隨著人工智能技術的不斷成熟&#xff0c;其在自動化辦公中的應用將更加廣泛和深入。未來&#xff0c;辦公軟件將具備更強的智能交互能力&#xff0c;能夠理解自然語言指令&#xff0c;自動完成復雜的任務&#xff0c;如文檔編輯…

智慧工會服務平臺建設方案Word(23頁)

1. 引言 隨著信息技術的快速發展&#xff0c;傳統工會服務模式面臨挑戰&#xff0c;智慧工會服務平臺應運而生。該平臺旨在通過數字化手段&#xff0c;整合工會資源&#xff0c;優化服務流程&#xff0c;提高工作效率&#xff0c;為會員提供更加便捷、高效、個性化的服務體驗。…