本篇仍然是不依賴于LangChain等專用庫,利用python基本庫實現了三種查詢轉換技術
- 查詢重寫:使查詢更加具體和詳細,以提高搜索精度。
- 回退提示:生成更廣泛的查詢以檢索有用的上下文信息。
- 子查詢分解:將復雜查詢分解為更簡單的組件,以實現全面檢索。
圖 1:RAG 中的查詢重寫(紅色虛線框)
查詢轉換技術通過優化輸入查詢的精準性、豐富性和適應性,使RAG系統能夠:
5. 更高效地定位相關文檔;
6. 覆蓋更全面的信息維度;
7. 生成更符合用戶意圖的高質量回答。
這一技術是RAG系統實現“智能增強”的關鍵環節,尤其在處理開放域、多模態或高專業性的場景時不可或缺。
注意:
- 1 大家可以提前https://studio.nebius.com/注冊一個api,然后獲取一個api key,免費1刀,
其他平臺薅羊毛也可以,很多可以免費薅羊毛!下文的結果是基于"BAAI/bge-en-icl"
- 2 請提前下載數據
- 3 提前準備好你的環境
- 4 本地嵌入模型搭建 基于本地的模型進行語義嵌入,可以利用FlagEmbedding,可以好好學習下,量大的話api的嵌入還是比較貴的哦!
文章目錄
- 背景說明
- 1. **彌補用戶查詢與文檔內容的語義鴻溝**
- 2. **應對復雜問題的多維度需求**
- 3. **提升檢索效率與相關性**
- 4. **適應文檔庫的異構性**
- 5. **解決歧義與多義性問題**
- 實際案例