綜述速讀|086.04.24.Retrieval-Augmented Generation for AI-Generated Content A Survey

論文題目:Retrieval-Augmented Generation for AI-Generated Content: A Survey
論文地址:https://arxiv.org/abs/2402.19473
bib引用:

@misc{zhao2024retrievalaugmentedgenerationaigeneratedcontent,title={Retrieval-Augmented Generation for AI-Generated Content: A Survey}, author={Penghao Zhao and Hailin Zhang and Qinhan Yu and Zhengren Wang and Yunteng Geng and Fangcheng Fu and Ling Yang and Wentao Zhang and Jie Jiang and Bin Cui},year={2024},eprint={2402.19473},archivePrefix={arXiv},primaryClass={cs.CV},url={https://arxiv.org/abs/2402.19473}, 
}

InShort

在這里插入圖片描述
本文對RAG進行了全面綜述,涵蓋其基礎、增強方法、應用、基準測試、局限與未來方向。

  1. RAG概述
    • 背景:AIGC借助模型算法創新、基礎模型擴展和優質數據實現發展,但面臨知識更新、長尾數據處理等問題。RAG通過引入檢索過程,利用可檢索知識作為非參數化記憶,解決這些問題,其應用已拓展到多種模態。
    • 貢獻:系統梳理RAG基礎范式,探究增強方法,展示其在多模態和任務中的應用,討論局限并提出未來方向,為研究和實踐提供參考。
    • 相關工作:已有相關研究存在局限,本文旨在提供全面系統的RAG綜述,涵蓋基礎、增強和應用等方面。
  2. RAG基礎
    • 生成器:常用生成器包括Transformer模型、LSTM、擴散模型和GAN,不同模型適用于不同生成場景。
    • 檢索器:檢索方法分為稀疏檢索、密集檢索和其他方法。稀疏檢索基于詞項匹配,密集檢索使用密集嵌入向量,其他方法如基于編輯距離、知識圖搜索和命名實體識別等。
    • 基礎范式:分為查詢式RAG(如REALM、SELF - RAG)、潛在表示式RAG(如FiD、RETRO)、基于logit的RAG(如kNN - LM、TRIME)和推測式RAG(如REST、GPTCache),每種范式在不同模態和任務中各有應用。
  3. RAG增強方法
    • 輸入增強:通過查詢變換(如Query2doc、HyDE)和數據增強(如Make - An - Audio、LESS)提升檢索效果。
    • 檢索器增強:采用遞歸檢索(如ReACT、RATP)、塊優化(如LlamaIndex、RAPTOR)、檢索器微調(如REPLUG、APICoder)、混合檢索(如RAP - Gen、BlendedRAG)、重排序(如Re2G、AceCoder)和檢索變換(如FILCO、FiD - Light)等方法。
    • 生成器增強:運用提示工程(如LLMLingua、ReMoDiffuse)、解碼調整(如InferFix、SYNCHROMESH)和生成器微調(如RETRO、APICoder)提升生成質量。
    • 結果增強:通過輸出重寫(如SARGAM、Ring)改進生成結果,使其更符合下游任務需求。
    • 流程增強:包括自適應檢索(如FLARE、Self - RAG)和迭代RAG(如RepoCoder、ITER - RETGEN),優化RAG整體流程。
  4. RAG應用
    • 文本領域:在問答、事實驗證、常識推理、人機對話、神經機器翻譯、事件提取和文本摘要等任務中廣泛應用,如FiD、REALM用于問答,CONCRETE用于事實驗證。
    • 代碼領域:涵蓋代碼生成、總結、補全、自動程序修復、文本到SQL和代碼語義解析等任務,不同任務采用不同的RAG范式和方法,如SKCODER用于代碼生成,Re2Com用于代碼總結。
    • 多模態領域:在知識、圖像、視頻、音頻、3D和科學等領域均有應用,如在知識領域用于知識庫問答和知識增強開放域問答;在圖像領域用于圖像生成和圖像字幕;在視頻領域用于視頻字幕和視頻問答對話等。
  5. RAG基準測試:多個基準測試從不同維度評估RAG系統,如噪聲魯棒性、負樣本拒絕、信息整合、反事實魯棒性、忠實度、答案相關性和上下文相關性等。
  6. RAG局限與展望
    • 現存局限:存在檢索結果有噪聲、額外開銷大、檢索器與生成器存在差距、系統復雜度增加和上下文過長等問題。
    • 未來方向:包括設計新的增強方法、構建靈活的RAG管道、拓展應用領域、實現高效部署和處理、整合長尾和實時知識以及與其他技術結合等。
評估維度評估指標評估基準測試示例
噪聲魯棒性測試LLMs能否從噪聲文檔中提取必要信息Chen等人提出的RAG基準測試
負樣本拒絕評估LLMs在檢索內容不足時能否拒絕響應Chen等人提出的RAG基準測試
信息整合檢查LLMs能否整合多個檢索內容獲取知識并響應Chen等人提出的RAG基準測試
反事實魯棒性判斷LLMs能否識別檢索內容中的反事實錯誤Chen等人提出的RAG基準測試
忠實度基于檢索內容評估事實準確性RAGAS、ARES、TruLens
答案相關性確定結果是否回答了查詢RAGAS、ARES、TruLens
上下文相關性評估檢索內容的相關性和簡潔性RAGAS、ARES、TruLens

關鍵問題

  1. RAG的基礎范式有哪些,它們是如何增強生成過程的?
    • RAG的基礎范式有查詢式RAG、潛在表示式RAG、基于logit的RAG和推測式RAG。查詢式RAG將檢索信息與用戶查詢整合作為生成器輸入;潛在表示式RAG把檢索對象作為潛在表示融入生成模型;基于logit的RAG在解碼過程中通過logits整合檢索信息;推測式RAG利用檢索替代部分生成過程以節省資源和加速響應。這些范式從不同角度增強生成過程,提升生成內容的質量和效率。
  2. RAG在不同模態中的應用有何特點?
    • 在文本模態中,廣泛應用于多種自然語言處理任務,通過檢索相關文本信息輔助生成;代碼模態結合檢索和生成技術,提升代碼相關任務的性能;知識模態利用結構化知識(如知識圖譜和表格)進行檢索增強;圖像模態借助檢索提高圖像生成和描述的質量;視頻模態用于視頻字幕生成和視頻問答對話等,增強對視頻內容的理解和描述;音頻模態在音頻生成和字幕任務中發揮作用;3D模態應用于3D資產生成;科學領域用于藥物發現、生物醫學信息增強和數學應用等。不同模態根據自身特點和需求,采用不同的RAG方法和技術,以實現更好的效果。
  3. RAG目前面臨哪些挑戰,未來有哪些發展方向?
    • RAG目前面臨檢索結果有噪聲、額外開銷大、檢索器與生成器存在差距、系統復雜度增加和上下文過長等挑戰。未來發展方向包括設計新的增強方法,以更好地發揮RAG的潛力;構建靈活的RAG管道,適應復雜任務;拓展應用領域,設計領域特定的RAG技術;實現高效部署和處理,降低檢索開銷和系統復雜度;整合長尾和實時知識,使RAG能夠處理動態信息;與其他技術結合,如微調、強化學習等,進一步提升AIGC的效果 。

本文來自互聯網用戶投稿,該文觀點僅代表作者本人,不代表本站立場。本站僅提供信息存儲空間服務,不擁有所有權,不承擔相關法律責任。
如若轉載,請注明出處:http://www.pswp.cn/web/73919.shtml
繁體地址,請注明出處:http://hk.pswp.cn/web/73919.shtml
英文地址,請注明出處:http://en.pswp.cn/web/73919.shtml

如若內容造成侵權/違法違規/事實不符,請聯系多彩編程網進行投訴反饋email:809451989@qq.com,一經查實,立即刪除!

相關文章

Spring Cache:簡化緩存管理的抽象框架

Spring Cache Spring Cache是Spring框架提供的緩存抽象層,通過注解和自動化配置,簡化應用中對緩存的操作,支持多種緩存實現(如Redis、Ehcache、Caffeine)。 1. 核心特性 聲明式緩存:通過注解(…

求矩陣某列的和

設計函數sum_column( int A[E1(n)][E2(n)], int j ),E1(n)和E2(n)分別為用宏定義的行數和列數,j為列號。在該函數中,設計指針ptr&A[0][j],通過*ptr及ptrptrE2(n)訪問第j列元素,從而求得第j列元素的和。在主函數中定…

IM騰訊Trtc與vod云點播:實現合流錄制并上傳,根據參數返回視頻地址

全文目錄,一步到位 1.前言簡介1.1 專欄傳送門1.1.1 文檔傳送門 2. java基礎使用2.1 準備工作2.1.1 云控制臺獲取(密鑰和密鑰secret)2.1.2 找到trtc控制臺2.1.3 vod云點播控制臺 2.2 使用準備的數據進行操作2.2.0 引入依賴2.2.1 創建TrtcUtils工具類2.2.2 TrtcReqDTO 錄制請求dt…

藍橋杯 數三角

問題描述 小明在二維坐標系中放置了 n 個點,他想從中選出一個包含三個點的子集,使得這三個點能夠組成一個三角形。 由于這樣的方案太多了,他決定只選擇那些可以組成等腰三角形的方案。 請幫他計算出一共有多少種選法可以組成等腰三角形。 …

【Kafka】從理論到實踐的深度解析

在當今數字化轉型的時代,企業面臨著數據量呈指數級增長、業務系統愈發復雜的挑戰。在這樣的背景下,高效的數據傳輸與處理技術成為了關鍵。Kafka,作為一款分布式消息隊列系統,憑借其卓越的性能和豐富的特性,在眾多企業的…

Linux課程學習一

一.fopen與fclose函數 linux中fopen函數直接用man fopen 去查看 函數原型 FILE * fopen(constchar *path , cost char *mode) /* * description : 打開一個文件 * param ‐ path : 指定文件路徑,如:"./test.txt",也可以直接由文件名 * param …

【區塊鏈安全 | 第十篇】智能合約概述

部分內容與前文互補。 文章目錄 一個簡單的智能合約子貨幣(Subcurrency)示例區塊鏈基礎交易區塊預編譯合約 一個簡單的智能合約 我們從一個基礎示例開始,該示例用于設置變量的值,并允許其他合約訪問它。 // SPDX-License-Identi…

XML標簽格式轉換為YOLO TXT格式

針對的是多邊形&#xff08;<polygon>&#xff09;來描述對象的邊界&#xff0c;而不是傳統的矩形框&#xff08;<bndbox>&#xff09; import xml.etree.ElementTree as ET import os from pathlib import Path# 解析VOC格式的XML文件&#xff0c;提取目標框的標…

大唐杯02 DTM.PX4.016

01 5G關鍵技術概述 回傳壓力大&#xff1a;核心網向基站回傳壓力大 02 5G關鍵技術介紹01

CSS3學習教程,從入門到精通, CSS3 盒子模型的詳細語法知識點及案例代碼(23)

CSS3 盒子模型的詳細語法知識點及案例代碼 CSS3 盒子模型完整指南 一、盒子模型基礎 每個 HTML 元素都被視為一個矩形盒子&#xff0c;由以下部分組成&#xff1a; 內容區 (Content)內邊距 (Padding)邊框 (Border)外邊距 (Margin) 二、語法知識點詳解 1. 盒子的寬和高 sel…

《Linux運維實戰:Ubuntu 22.04修改root用戶默認名并禁止登錄》

總結&#xff1a;整理不易&#xff0c;如果對你有幫助&#xff0c;可否點贊關注一下&#xff1f; 更多詳細內容請參考&#xff1a;Linux運維實戰總結 一、背景信息 由于安全方面的考慮&#xff0c;先要求Ubuntu 22.04系統重的root用戶禁止登錄&#xff0c;并修改用戶名root為ad…

docker-compose自定義網絡,解決docker-compose網段路由沖突

問題排查 先route一波查看一下路由表 容器路由19和堡壘機路由沖突 解決方案 更改docker網段更改docker生成容器的網段 > 基本操作 docker network ls &#xff1a;查看docker網絡列表 docker network inspect <network id/name>&#xff1a;查看某個docker網絡詳情…

前端 - ts - - declare聲明類型

在使用typeScript的項目中 需要聲明屬性類型 單獨的局部屬性 可以直接在當前文件中聲明 全局屬性需要在項目根目錄下新建.d.ts文件 vite會自動識別.d.ts類型文件 在該文件中使用declare聲明類型有三種寫法 1、在某種類型的文件中聲明 2、聲明window上的屬性類型 3、全局聲明…

[Mac]利用Hexo+Github Pages搭建個人博客

由于我這臺Mac基本沒啥環境&#xff0c;因此需要從零開始配置&#xff0c;供各位參考。 注意??&#xff1a;MacBook (M4)使用/bin/zsh作為默認Shell&#xff0c;其對應的配置文件為~/.zshrc 參考文檔&#xff1a; HEXO系列教程 | 使用GitHub部署靜態博客HEXO | 小白向教程 文…

運維面試題(十一)

1.如果一個硬盤 IO 時阻塞了&#xff0c;會發生什么情況&#xff1f; 進程/線程掛起&#xff1a;發起I/O操作的進程或線程會被操作系統置為阻塞狀態&#xff08;等待狀態&#xff09;&#xff0c;直到I/O完成。CPU資源釋放&#xff1a;阻塞的線程會讓出CPU&#xff0c;操作系統…

sql2022 復制 事務級別發布后無法刪除

Cannot execute as the database principal because the principal "dbo" does not exist, this type of principal cannot be impersonated, or you do not have permission. 用SA用戶登錄執行下列語句 USE [xxxxx] GO EXEC dbo.sp_changedbowner loginame Nsa, …

合規+增效 正也科技攜智能營銷產品出席中睿論壇

正也科技作為醫藥數字化領域的標桿企業&#xff0c;受邀參展第二屆中睿醫健產業企業家年會暨第十三屆中睿醫藥新春論壇&#xff0c;本次論壇以“合力啟新程”為主題&#xff0c;吸引了800多位醫藥健康企業的董事長、總經理參與&#xff0c;并通過主論壇、分論壇、路演等形式探討…

ubuntu 安裝 postgresql

在 Ubuntu 系統中安裝 PostgreSQL 的步驟如下&#xff1a; 步驟 1&#xff1a;更新軟件包列表 sudo apt update步驟 2&#xff1a;安裝 PostgreSQL Ubuntu 默認倉庫包含 PostgreSQL&#xff0c;直接安裝&#xff1a; sudo apt install postgresql postgresql-contrib -ypost…

智能巡檢機器人:2025年企業安全運維的“數字哨兵“

文章目錄 一、2025年&#xff0c;為什么企業需要智能巡檢機器人&#xff1f;二、2025年智能巡檢機器人的六大核心價值三、2025行業落地實景1. 電網系統——"巡線鷹"集群作戰2. 化工園區——"防爆衛士"全天候守護3. 數據中心——"冷血偵探"精準運…

K8S學習之基礎五十一:k8s部署jenkins

k8s部署jenkins 創建nfs共享目錄&#xff0c; mkdir -p /data/v2 echo /data/v2 *(rw,no_root_squash) > /etc/exports exportfs -arv創建pv、pvc vi pv.yaml apiVersion: v1 kind: PersistentVolume metadata:name: jenkins-k8s-pv spec:capacity:storage: 1GiaccessMod…