檢索增強型生成(RAG)將語言模型與外部知識檢索相結合,讓模型的回答基于最新的事實,而不僅僅是其訓練數據呢。
RAG(高級別)
在 RAG 流程中,用戶查詢用于搜索知識庫(通常通過向量數據庫中的嵌入來實現),并將檢索到的最相關文檔“增強”到模型的提示中,以幫助生成事實性的回答呢。
這減少了幻覺現象,并且允許在回答中使用特定領域的或私有的數據呢。
然而,傳統的 RAG 存在局限性呢:它通常只查詢單一數據源,并且只進行一次檢索,所以如果初始結果不佳或者查詢措辭奇怪,答案就會受影響呢。
系統并沒有內置的機制來推理如何檢索到更好的信息,或者在需要時使用額外的工具呢。
代理型 RAG
代理型 RAG 彌補了這些不足,通過在 RAG 循環中引入一個 AI 代理 呢。在一個代理型 RAG 系統中,檢索和生成組件由一個智能代理來協調,這個代理能夠規劃多步驟查詢,使用各種工具,并且根據查詢和中間結果調整其策略呢。換句話說,“