RAG現有技術方案
一、現有技術方案的核心問題
-
檢索質量不足
- 挑戰:傳統RAG系統依賴單輪檢索,難以應對智能電網的海量異構數據(如傳感器讀數、控制參數),導致檢索結果相關性低、覆蓋不全。
- 案例:BM25稀疏檢索在處理長文本或專業術語時,易遺漏語義關聯;BGE等稠密檢索模型對新興詞匯的表征能力有限。
-
響應可靠性差
- 問題:LLM可能受無關上下文誤導,或因參數記憶與非參數記憶混淆產生“幻覺”(如虛構電網故障處理流程)。
- 數據:傳統RAG在智能電網場景中的答案準確率僅56.46%,上下文召回率59.73%。
-
計算效率與擴展性
- 矛盾:HyDE、ITRG等方案通過迭代檢索提升性能,但顯著增加token消耗(如Self-RAG單輪問答消耗769 tokens),難以滿足實時性要求。