CAG緩存增強生成與RAG檢索增強生成對比

CAG緩存增強生成與RAG檢索增強生成對比

diannao/2025/8/19 9:36:11/文章來源:https://blog.csdn.net/zhf6751134/article/details/150485528

深度定制 LLM 知識,除了 RAC ，現在又有新技術

假設有一份200頁的產品手冊,你想讓 LLM 準確回答里面的相關問題,要實現這個目標,除了常用的檢索增強生成技術 rep ,現在有了新思路,緩存增強生成 CAG ，它是什么,何時使用.

在這里插入圖片描述

RAG檢索增強是常規套路,CAG緩存增強是后起之秀讓我們來對比一下他們的優缺點. 我們先來了解一下,檢索增強生成 RAG 的工作流程

RAG檢索增強流程

在這里插入圖片描述

第一步索引階段這個步驟在提前處理的情況下也允許動態加入

就像煮飯備料一樣

RAG 會將文檔切成小塊
再轉換成向量
存入向量數據庫

第二步查詢階段

用戶提問后

系統將問題轉為向量
在向量數據庫中檢索相似內容

第三步增強階段

將檢索到的相關內容添加到提示詞中

第四步生成階段

LLM 基于增強后的提示詞生成回答

RAG工作流程缺點

了解過 RAG的工作流程,它的局限性大家可能也都猜到了

檢索存在延遲
檢索的質量和內容影響回答準確性
架構復雜,需要費心維護向量數據庫

CAG檢索增強流程

在 RAG 基礎上,CAG 提供了另一種解題思路, 它比 RAG 工作流程更短主要包括兩個階段
在這里插入圖片描述

第一階段預處理流程

對知識源進行處理,提取關鍵信息
接著將信息結構化
利用 LLM 將文檔轉化為鍵值對緩存

以一本書為例, 就是把它的關鍵內容, 組成對應關系進行緩存. 像
章節標題對應章節摘要、人物名稱對應人物描述、核心概對應概念解釋、常見問題對應答案

第二階段查詢流程

初始階段,所有鍵值對都加載到緩存當中
把緩存加載到 LLM 的上下文窗口中
與用戶提問一起發送給 LLM
LLM 直接從上下文的知識緩存中檢索, 并生成回答

CAG檢索增強流優勢

省略了檢索步驟使 CAG 擁有了明顯的優勢,

無檢索延遲,響應自然更快,
LLM 直接加載所有緩存知識回答一致性更高,
無檢索系統架構更簡單,降低了維護的復雜性

最后我們來總結一 RAG 和 CAG 到底何時用

何時使用 RAG的場景

有規模龐大的知識庫, 如超出 LLM 上下文窗口容量的,
更新頻繁的資料
面向開放領域的多樣化問題
需要精準引用原文出處的

何時使用 CAG 的場景

知識領域固定且規模適中的: 如書籍
看重響應速度用 CAG 能快幾秒
需要全局理解和一致性: 如財務報表分析,
可以被有效提煉和結構化的知識

總結

RAG 和 CAG ,它們代表了兩種不同的知識增強范式一個動態檢索、一個預加載緩存
選擇哪種技術取決于你的具體需求,知識規模和性能要求
在這里插入圖片描述

文章:
https://blog.csdn.net/simoncool23/article/details/145224445

本文來自互聯網用戶投稿，該文觀點僅代表作者本人，不代表本站立場。本站僅提供信息存儲空間服務，不擁有所有權，不承擔相關法律責任。
如若轉載，請注明出處：http://www.pswp.cn/diannao/95984.shtml
繁體地址，請注明出處：http://hk.pswp.cn/diannao/95984.shtml
英文地址，請注明出處：http://en.pswp.cn/diannao/95984.shtml

如若內容造成侵權/違法違規/事實不符，請聯系多彩編程網進行投訴反饋email:809451989@qq.com，一經查實，立即刪除！

相關文章

基于vue、node.js、express的網絡教學系統設計與實現/基于vue、node.js、express的在線學習系統設計與實現

基于vue、node.js、express的網絡教學系統設計與實現/基于vue、node.js、express的在線學習系統設計與實現

基于vue、node.js、express的網絡教學系統設計與實現/基于vue、node.js、express的在線學習系統設計與實現

閱讀更多...

享元模式引發的關于ECS和對象池的思考記錄

享元模式引發的關于ECS和對象池的思考記錄

文章目錄概念概述解決了什么區別與聯系享元模式的某個例子的細節分析概念概述 ECS（Entity-Component-System） 1、Entity（實體）：唯一標識符。 2、Component（組件）：純數據容器&#x…

閱讀更多...

STM32驅動SG90舵機全解析：從PWM原理到多舵機協同控制

STM32驅動SG90舵機全解析：從PWM原理到多舵機協同控制

一、SG90舵機核心特性 1.1 基本參數與選型 SG90作為??微型舵機的代表??，憑借其??輕量化設計??（僅9g）和??高性價比??，在機器人、智能小車和云臺系統中廣泛應用： ??關鍵參數對比??： ??參數?? 180定位舵機 360連續旋轉舵機 ??控制目標?? 精確…

閱讀更多...

goland怎么取消自動刪除未使用的包

goland怎么取消自動刪除未使用的包

1.settings-Go-Imports-取消勾選Optimize imports on the fly2.settings-Tools-取消勾選Optimize imports

閱讀更多...

halcon基于透視的可變形模型匹配

halcon基于透視的可變形模型匹配

算子1，create_planar_uncalib_deformable_model_xld***基于平面未校準的輪廓模型算子2，find_planar_uncalib_deformable_model***查找平面未校準可變形模型算子3，projective_trans_contour_xld***將輪廓進行透視變換附加算子算子4read_conto…

閱讀更多...

Flink Stream API - 源碼開發需求描述

Flink Stream API - 源碼開發需求描述

概述本文介紹如何基于Flink源碼進行二次開發，實現一個動態規則引擎系統。通過自定義算子和算子協調器，實現數據流的動態規則計算和協調管理。以此更好理解前面介紹的源碼相關文章項目需求核心功能實現一個動態規則引擎，具備以下特性&…

閱讀更多...

「 CentOS7 安裝部署k8s」

「 CentOS7 安裝部署k8s」

一、Linux系統部署K8s還是非常便利的，只需要掌握Linux常用命令，便可以迅速部署，一起來學習一下吧1、運行以下命令更新系統并安裝必要工具：yum update -y yum install -y yum-utils device-mapper-persistent-data lvm22、安裝Dock…

閱讀更多...

Disbursement on Quarantine Policy（概率、逆元計算期望）

Disbursement on Quarantine Policy（概率、逆元計算期望）

題目描述There is a train with n rows, and there are m seats per row. All seats are occupied. For some passengers, we know they are being infected with COVID-19 or not. However, for other passengers, we are not sure about their status, and we assume each of…

閱讀更多...

AI 在金融領域的落地案例

AI 在金融領域的落地案例

目錄引言一、信貸風控：基于 LoRA 的 Qwen-7B 模型微調（適配城商行審批場景） 場景背景核心代碼 1. 環境依賴安裝 2. 金融數據集加載與預處理（城商行信貸數據） 3. LoRA 微調 Qwen-7B 模型 4. 模型推理&#xf…

閱讀更多...

平衡二叉樹的調整

平衡二叉樹的調整

平衡二叉樹的定義平衡二叉樹（balanced binary tree），又稱AVL樹(Adelson-Velskii and Landis)。一棵平衡二叉樹或者是空樹，或者是具有下列性質的二叉排序樹：① 左子樹與右子樹的高度之差的絕對值小于等于1；…

閱讀更多...

深入解析：如何設計靈活且可維護的自定義消息機制

深入解析：如何設計靈活且可維護的自定義消息機制

深入解析：如何設計靈活且可維護的自定義消息機制引言在現代軟件開發中，組件間的通信機制至關重要。無論是前端框架中的組件交互，還是后端服務間的消息傳遞，一個良好的消息機制能顯著提升代碼的可維護性和擴展性。本文將深入探討…

閱讀更多...

PostgreSQL——用戶管理

PostgreSQL——用戶管理

PostgreSQL用戶管理一、組角色管理1.1、創建組角色1.2、查看和修改組角色1.3、刪除組角色二、角色的各種權限2.1、LOGIN（登錄）2.2、SUPERUSER（超級用戶）3.3、CREATEDB（創建數據庫）3.4、CREATEROLE&#xff…

閱讀更多...

東軟8位MCU使用問題總結

東軟8位MCU使用問題總結

簡介用的單片機為ES7P7021，采用8位RISC內核，2KB的FLASH，128bit的RAM。編譯器使用東軟提供的iDesigner，開發過程中編譯器和單片機有一些地方使用時需要注意下。1.RAMclear()函數注意問題/****************************************…

閱讀更多...

深度學習在訂單簿分析與短期價格預測中的應用探索

深度學習在訂單簿分析與短期價格預測中的應用探索

一、訂單簿數據特性及預處理 1.1 訂單簿數據結構解析在金融交易領域，訂單簿是市場微觀結構的集中體現，它記錄了不同價格水平的買賣訂單信息。一個典型的訂單簿由多個層級組成，每個層級包含特定價格上的買單和賣單數量。例如，在某…

閱讀更多...

Hashmap源碼

Hashmap源碼

目錄 HashMap底層原理 JDK1.8及以后底層結構為：數組鏈表紅黑樹默認參數擴容機制數組鏈表紅黑樹 HashMap為什么用紅黑樹不用B樹 HashMap什么時候擴容 HashMap的長度為什么是 2的 N 次方 HashMap底層原理 JDK1.8及以后底層結構為：數組鏈表紅…

閱讀更多...

【JAVA 字符串常量池、new String的存儲機制、==與equals的區別，以及字符串重新賦值時的指向變化】

【JAVA 字符串常量池、new String的存儲機制、==與equals的區別，以及字符串重新賦值時的指向變化】

系列文章目錄提示：這里可以添加系列文章的所有文章的目錄，目錄需要自己手動添加提示：寫完文章后，目錄可以自動生成，如何生成可參考右邊的幫助文檔文章目錄系列文章目錄代碼原理解錯誤邏輯理解理解與修正&#xff1a…

閱讀更多...

博客項目 Spring + Redis + Mysql

博客項目 Spring + Redis + Mysql

基礎模塊1. 郵箱發送功能最初設計的接口 （雛形）public interface EmailService {/*** 發送驗證碼郵件** param email 目標郵箱* return 發送的code* throws RuntimeException 如果發送郵件失敗，將拋出異常*/String sendVerificationCode(Stri…

閱讀更多...

前端處理導出PDF。Vue導出pdf

前端處理導出PDF。Vue導出pdf

前言：該篇主要是解決一些簡單的頁面內容導出為PDF1.安裝依賴使用到兩個依賴，項目目錄下運行這兩個//頁面轉換成圖片 npm install --save html2canvas //圖片轉換成pdf npm install jspdf --save 2.創建通用工具類exportPdf.js文件可以保存在工具類目錄下…

閱讀更多...

【GM3568JHF】FPGA+ARM異構開發板燒錄指南

【GM3568JHF】FPGA+ARM異構開發板燒錄指南

1. Windows燒錄說明 SDK 提供 Windows 燒寫工具(工具版本需要 V3.31或以上)，工具位于工程根目錄： tools/ ├── windows/RKDevTool 如下圖，編譯生成相應的固件后，設備燒寫需要進入 MASKROM 或 LOADER 燒寫模式，準備…

閱讀更多...

C++ 多進程編程深度解析【C++進階每日一學】

C++ 多進程編程深度解析【C++進階每日一學】

文章目錄一、引言二、核心概念：進程 (Process)功能與作用三、C 多進程的實現方式四、核心函數詳解1. fork() - 創建子進程函數原型功能說明返回值完整使用格式2. wait() 和 waitpid() - 等待子進程結束函數原型參數與返回值詳解3. exec 系列函數 - 執行新程序函數族…

閱讀更多...

最新文章