系統性排查框架:
-
數據層檢查
- 索引覆蓋率:檢查文檔是否全部正確索引
- 數據新鮮度:確認索引更新頻率和延遲
- 文檔質量:分析被索引內容的質量和完整性
-
查詢理解層
- 分詞分析:檢查查詢分詞是否正確
- 意圖識別:驗證意圖分類準確性
- 查詢改寫:分析改寫規則是否合理
-
召回層診斷
- 召回率:測量相關文檔被檢索的比例
- 檢索算法:驗證 embedding 質量/倒排索引效果
- 參數調優:調整k值、相似度閾值等參數
-
排序層分析
- 特征分析:檢查排序特征的有效性
- 模型評估:通過A/B測試評估不同模型效果
- 錯誤分析:人工標注bad case進行分析
-
端到端評估
- 制定評估指標:DCG@K、MRR、Precision@K等
- 建立測試集:包含典型查詢和預期結果
- 監控面板:實時監控關鍵指標變化
工具鏈:
- Elasticsearch:使用Explain API分析評分
- 自定義診斷工具:記錄檢索全過程日志
- 可視化工具:展示查詢-文檔相關性矩陣