讓大模型“看得見”自己的推理 —— KnowTrace 結構化知識追蹤式 RAG 全解析
一句話概括:把檢索-推理“改造”成 動態知識圖構建任務,再讓 LLM 只關注這張不斷精煉的小圖 —— 這就是顯式知識追蹤的核心價值。
1. 背景:為什么 RAG 仍難以搞定多跳推理?
- 長上下文負擔
傳統 Iterative RAG 每輪都把新檢索文本拼到 prompt,導致上下文越滾越大,模型難以在海量片段里找到關鍵關聯。 - 無結構信息過載
文本粒度檢索缺乏實體-關系顯式連接,LLM 需要在隱式語義里“猜”鏈路,容易走彎路。 - 訓練監督稀缺
僅有最終答案監督,無法告訴模型“哪些檢索-生成步驟有貢獻”,難以自我迭代。
2. 核心思路:結構化知識追蹤(Structured Knowledge Tracing)
角色 | 目標 | 輸出 |
---|---|---|
Knowledge Exploration | 把問題拆解成 實體-關系 查詢 | (e?1 , r?) |
Knowledge Completion | 讀取檢索文本& |