查詢改寫和查詢增強是兩種提升檢索效果的技術,目標是在不改變用戶意圖的前提下,使檢索器收到的查詢更全面或明確,從而找到更多相關信息。
- 查詢改寫通常指將原始查詢轉換成語義等價但更明晰的形式。上一節談到的對話查詢改寫是一個典型場景。在一般情況下,查詢改寫也適用于澄清歧義或補全信息。例如,用戶輸入簡短查詢“Python 內存”,我們可以自動改寫為“Python 內存管理機制是什么?”以便檢索器獲取更相關的技術文章,而不是與動物蟒蛇相關的內容。改寫可以利用規則(比如替換同義表達)或深度學習模型。現代大模型擅長根據上下文對問題重述,Few-shot 提示可以引導GPT-4類模型將用戶查詢擴展成一個自包含的問題。Microsoft的研究將查詢改寫視為