綜述速讀|086.04.24.Retrieval-Augmented Generation for AI-Generated Content A Survey

論文題目：Retrieval-Augmented Generation for AI-Generated Content: A Survey
論文地址：https://arxiv.org/abs/2402.19473
bib引用：

@misc{zhao2024retrievalaugmentedgenerationaigeneratedcontent,title={Retrieval-Augmented Generation for AI-Generated Content: A Survey}, author={Penghao Zhao and Hailin Zhang and Qinhan Yu and Zhengren Wang and Yunteng Geng and Fangcheng Fu and Ling Yang and Wentao Zhang and Jie Jiang and Bin Cui},year={2024},eprint={2402.19473},archivePrefix={arXiv},primaryClass={cs.CV},url={https://arxiv.org/abs/2402.19473}, 
}

InShort

在這里插入圖片描述
本文對RAG進行了全面綜述，涵蓋其基礎、增強方法、應用、基準測試、局限與未來方向。

RAG概述
- 背景：AIGC借助模型算法創新、基礎模型擴展和優質數據實現發展，但面臨知識更新、長尾數據處理等問題。RAG通過引入檢索過程，利用可檢索知識作為非參數化記憶，解決這些問題，其應用已拓展到多種模態。
- 貢獻：系統梳理RAG基礎范式，探究增強方法，展示其在多模態和任務中的應用，討論局限并提出未來方向，為研究和實踐提供參考。
- 相關工作：已有相關研究存在局限，本文旨在提供全面系統的RAG綜述，涵蓋基礎、增強和應用等方面。
RAG基礎
- 生成器：常用生成器包括Transformer模型、LSTM、擴散模型和GAN，不同模型適用于不同生成場景。
- 檢索器：檢索方法分為稀疏檢索、密集檢索和其他方法。稀疏檢索基于詞項匹配，密集檢索使用密集嵌入向量，其他方法如基于編輯距離、知識圖搜索和命名實體識別等。
- 基礎范式：分為查詢式RAG（如REALM、SELF - RAG）、潛在表示式RAG（如FiD、RETRO）、基于logit的RAG（如kNN - LM、TRIME）和推測式RAG（如REST、GPTCache），每種范式在不同模態和任務中各有應用。
RAG增強方法
- 輸入增強：通過查詢變換（如Query2doc、HyDE）和數據增強（如Make - An - Audio、LESS）提升檢索效果。
- 檢索器增強：采用遞歸檢索（如ReACT、RATP）、塊優化（如LlamaIndex、RAPTOR）、檢索器微調（如REPLUG、APICoder）、混合檢索（如RAP - Gen、BlendedRAG）、重排序（如Re2G、AceCoder）和檢索變換（如FILCO、FiD - Light）等方法。
- 生成器增強：運用提示工程（如LLMLingua、ReMoDiffuse）、解碼調整（如InferFix、SYNCHROMESH）和生成器微調（如RETRO、APICoder）提升生成質量。
- 結果增強：通過輸出重寫（如SARGAM、Ring）改進生成結果，使其更符合下游任務需求。
- 流程增強：包括自適應檢索（如FLARE、Self - RAG）和迭代RAG（如RepoCoder、ITER - RETGEN），優化RAG整體流程。
RAG應用
- 文本領域：在問答、事實驗證、常識推理、人機對話、神經機器翻譯、事件提取和文本摘要等任務中廣泛應用，如FiD、REALM用于問答，CONCRETE用于事實驗證。
- 代碼領域：涵蓋代碼生成、總結、補全、自動程序修復、文本到SQL和代碼語義解析等任務，不同任務采用不同的RAG范式和方法，如SKCODER用于代碼生成，Re2Com用于代碼總結。
- 多模態領域：在知識、圖像、視頻、音頻、3D和科學等領域均有應用，如在知識領域用于知識庫問答和知識增強開放域問答；在圖像領域用于圖像生成和圖像字幕；在視頻領域用于視頻字幕和視頻問答對話等。
RAG基準測試：多個基準測試從不同維度評估RAG系統，如噪聲魯棒性、負樣本拒絕、信息整合、反事實魯棒性、忠實度、答案相關性和上下文相關性等。
RAG局限與展望
- 現存局限：存在檢索結果有噪聲、額外開銷大、檢索器與生成器存在差距、系統復雜度增加和上下文過長等問題。
- 未來方向：包括設計新的增強方法、構建靈活的RAG管道、拓展應用領域、實現高效部署和處理、整合長尾和實時知識以及與其他技術結合等。

評估維度	評估指標	評估基準測試示例
噪聲魯棒性	測試LLMs能否從噪聲文檔中提取必要信息	Chen等人提出的RAG基準測試
負樣本拒絕	評估LLMs在檢索內容不足時能否拒絕響應	Chen等人提出的RAG基準測試
信息整合	檢查LLMs能否整合多個檢索內容獲取知識并響應	Chen等人提出的RAG基準測試
反事實魯棒性	判斷LLMs能否識別檢索內容中的反事實錯誤	Chen等人提出的RAG基準測試
忠實度	基于檢索內容評估事實準確性	RAGAS、ARES、TruLens
答案相關性	確定結果是否回答了查詢	RAGAS、ARES、TruLens
上下文相關性	評估檢索內容的相關性和簡潔性	RAGAS、ARES、TruLens

關鍵問題

RAG的基礎范式有哪些，它們是如何增強生成過程的？
- RAG的基礎范式有查詢式RAG、潛在表示式RAG、基于logit的RAG和推測式RAG。查詢式RAG將檢索信息與用戶查詢整合作為生成器輸入；潛在表示式RAG把檢索對象作為潛在表示融入生成模型；基于logit的RAG在解碼過程中通過logits整合檢索信息；推測式RAG利用檢索替代部分生成過程以節省資源和加速響應。這些范式從不同角度增強生成過程，提升生成內容的質量和效率。
RAG在不同模態中的應用有何特點？
- 在文本模態中，廣泛應用于多種自然語言處理任務，通過檢索相關文本信息輔助生成；代碼模態結合檢索和生成技術，提升代碼相關任務的性能；知識模態利用結構化知識（如知識圖譜和表格）進行檢索增強；圖像模態借助檢索提高圖像生成和描述的質量；視頻模態用于視頻字幕生成和視頻問答對話等，增強對視頻內容的理解和描述；音頻模態在音頻生成和字幕任務中發揮作用；3D模態應用于3D資產生成；科學領域用于藥物發現、生物醫學信息增強和數學應用等。不同模態根據自身特點和需求，采用不同的RAG方法和技術，以實現更好的效果。
RAG目前面臨哪些挑戰，未來有哪些發展方向？
- RAG目前面臨檢索結果有噪聲、額外開銷大、檢索器與生成器存在差距、系統復雜度增加和上下文過長等挑戰。未來發展方向包括設計新的增強方法，以更好地發揮RAG的潛力；構建靈活的RAG管道，適應復雜任務；拓展應用領域，設計領域特定的RAG技術；實現高效部署和處理，降低檢索開銷和系統復雜度；整合長尾和實時知識，使RAG能夠處理動態信息；與其他技術結合，如微調、強化學習等，進一步提升AIGC的效果。

本文來自互聯網用戶投稿，該文觀點僅代表作者本人，不代表本站立場。本站僅提供信息存儲空間服務，不擁有所有權，不承擔相關法律責任。
如若轉載，請注明出處：http://www.pswp.cn/web/73919.shtml
繁體地址，請注明出處：http://hk.pswp.cn/web/73919.shtml
英文地址，請注明出處：http://en.pswp.cn/web/73919.shtml

如若內容造成侵權/違法違規/事實不符，請聯系多彩編程網進行投訴反饋email:809451989@qq.com，一經查實，立即刪除！