RAG 的完整流程是怎么樣的？

RAG（檢索增強生成）的完整流程可分為5個核心階段：

也可以從三個階段來回答：

在 RAG 索引階段，首先對原始文檔進行解析，并將其拆分成多個較小的文本塊。隨后，這些文本塊會通過嵌入模型進行向量化處理，生成的向量將被存儲在向量數據庫中，供后續檢索使用。
在 RAG 檢索階段，RAG 系統會將用戶的查詢同樣進行向量化，并在向量數據庫中執行語義相似度匹配，篩選出與查詢最相關的一組文本塊。
最后在生成階段，系統將用戶查詢與檢索到的相關文本塊進行組合，通過提示工程（Prompt Engineering）設計適當的輸入格式，然后交由大語言模型生成最終的回答，至此完成整個 RAG 的流程。

文檔分塊策略：

多階段檢索：

混合檢索：同時使用向量和關鍵詞結果，通過RRF（倒數排名融合）合并。

生成階段的Prompt設計示例

▼

python

復制代碼

# 示例Prompt模板（網頁2） prompt = "用戶問題: {query}\n相關文檔: {doc1}\n{doc2}\n請結合以上信息回答。"

可以進行上下文壓縮：對檢索結果摘要（如RAPTOR樹狀摘要）減少冗余輸入。

本文來自互聯網用戶投稿，該文觀點僅代表作者本人，不代表本站立場。本站僅提供信息存儲空間服務，不擁有所有權，不承擔相關法律責任。
如若轉載，請注明出處：http://www.pswp.cn/web/95388.shtml
繁體地址，請注明出處：http://hk.pswp.cn/web/95388.shtml
英文地址，請注明出處：http://en.pswp.cn/web/95388.shtml

如若內容造成侵權/違法違規/事實不符，請聯系多彩編程網進行投訴反饋email:809451989@qq.com，一經查實，立即刪除！