在RAG系統中,檢索器(Retriever)與生成器(Generator)的解耦架構是實現靈活高效的關鍵設計。所謂解耦,即將檢索相關文檔和生成答案兩個步驟分開,由不同的模塊或模型負責。這種架構帶來的直接好處是模塊獨立優化:我們可以針對檢索任務微調或更換檢索模型,而不必影響生成模型;反之亦然。例如,如果知識庫更新了內容,只需要更新索引或更換檢索模塊,生成模型無需重新訓練就能使用最新知識。這種松耦合增加了系統的可維護性和可擴展性。
典型的解耦架構工作流程是:用戶查詢首先發送給檢索器,檢索器從知識庫(往往已向量化索引)中獲取若干相關文檔片段,然后將查詢及這些檢索結果一并提供給生成器模型進行答案生成。生成器通常是一個大型語言模型,通過prompt模板將檢索到的信息融入上下文來生成最終回答。Facebook AI在2020年的開創性論文中將這種模式稱為“檢索增強的生成”,并驗證了其在知識密集型NLP任務上的