RAG實戰指南 Day 24：上下文構建與提示工程

【RAG實戰指南 Day 24】上下文構建與提示工程

文章內容

開篇

歡迎來到"RAG實戰指南"系列的第24天！今天我們將深入探討RAG系統中至關重要的上下文構建與提示工程技術。在檢索增強生成系統中，如何有效地組織檢索到的文檔片段，并將其轉化為適合大語言模型(LLM)處理的提示，直接決定了最終生成結果的質量。本文將系統講解上下文構建的最佳實踐和高級提示工程技術，幫助您構建更精準、更可靠的RAG應用。

理論基礎

關鍵概念：

上下文窗口：LLM能夠同時處理的最大文本長度，不同模型有不同限制
提示工程：設計輸入提示以引導模型產生期望輸出的技術
上下文相關性：檢索內容與用戶查詢的語義匹配程度
信息密度：單位文本中包含的有價值信息量

核心挑戰：

如何從檢索結果中選擇最具信息量的片段
如何組織多個文檔片段以避免信息沖突
如何設計提示模板使LLM充分利用上下文
如何平衡上下文長度和信息密度

技術解析

1. 上下文構建策略

策略名稱	核心思想	適用場景
截斷法	保留最相關的前N個token	簡單查詢，上下文有限
滑動窗口	重疊分塊保留邊界信息	長文檔連續信息提取
層次聚合	先提取關鍵句再擴展上下文	需要保持文檔結構
動態融合	根據查詢動態重組片段	復雜多文檔查詢

2. 提示工程設計模式

from typing import List, Dict
from pydantic import BaseModelclass Document(BaseModel):content: strmetadata: Dict[str, str]relevance_score: floatclass PromptBuilder:def __init__(self, system_prompt: str):self.system_prompt = system_promptself.context_token_limit = 4000  # 假設模型上下文窗口為4kdef build_prompt(self, query: str, documents: List[Document]) -> str:"""構建RAG提示的核心方法"""# 1. 上下文選擇與截斷selected_context = self._select_context(documents)# 2. 構建結構化提示prompt = f"""{self.system_prompt}### 背景知識:{selected_context}### 用戶問題:{query}### 回答要求:- 僅基于提供的背景知識回答- 如果信息不足請回答"根據現有信息無法確定"- 保持專業、準確的語氣"""return promptdef _select_context(self, documents: List[Document]) -> str:"""選擇最相關的上下文片段"""# 按相關性排序sorted_docs = sorted(documents, key=lambda x: x.relevance_score, reverse=True)selected_texts = []current_length = 0for doc in sorted_docs:doc_length = len(doc.content.split())  # 簡單以詞數計算if current_length + doc_length <= self.context_token_limit:selected_texts.append(f"來源: {doc.metadata.get('source', '未知')}\n內容: {doc.content}")current_length += doc_lengthelse:breakreturn "\n\n".join(selected_texts)

3. 高級提示技術

多輪提示：將復雜問題分解為多個子問題
自洽性檢查：要求模型驗證自己的回答
思維鏈：引導模型展示推理過程
模板變量：動態插入上下文片段

class AdvancedPromptBuilder(PromptBuilder):def build_analytic_prompt(self, query: str, documents: List[Document]) -> str:"""構建帶有分析過程的提示"""context = self._select_context(documents)prompt = f"""{self.system_prompt}請按照以下步驟分析問題:1. 理解問題: "{query}"2. 分析相關背景知識: {context}3. 逐步推理得出結論4. 驗證結論的合理性請按上述步驟給出最終答案，并標注每個步驟的思考過程。"""return promptdef build_multi_turn_prompt(self, conversation: List[Dict], documents: List[Document]) -> str:"""構建多輪對話提示"""context = self._select_context(documents)# 構建對話歷史history = "\n".join([f"{msg['role']}: {msg['content']}" for msg in conversation[:-1]])current_query = conversation[-1]['content']prompt = f"""{self.system_prompt}對話歷史:{history}當前問題: {current_query}相關背景:{context}請基于以上信息繼續對話。"""return prompt

代碼實現

完整實現一個支持多種提示策略的RAG上下文處理器：

import re
from typing import List, Optional
from rank_bm25 import BM25Okapiclass ContextProcessor:def __init__(self, chunk_size: int = 500, chunk_overlap: int = 50):self.chunk_size = chunk_sizeself.chunk_overlap = chunk_overlapdef split_text(self, text: str) -> List[str]:"""基礎文本分塊"""words = text.split()chunks = []start = 0while start < len(words):end = min(start + self.chunk_size, len(words))chunk = " ".join(words[start:end])chunks.append(chunk)start = end - self.chunk_overlapreturn chunksdef rerank_by_query(self, query: str, documents: List[str]) -> List[float]:"""基于查詢對文檔片段重新排序"""tokenized_docs = [doc.split() for doc in documents]tokenized_query = query.split()bm25 = BM25Okapi(tokenized_docs)scores = bm25.get_scores(tokenized_query)return scoresdef build_context(self,query: str,documents: List[str],strategy: str = "simple",max_length: int = 4000) -> str:"""根據策略構建上下文"""if strategy == "simple":return self._simple_context(query, documents, max_length)elif strategy == "analytical":return self._analytical_context(query, documents, max_length)else:raise ValueError(f"未知策略: {strategy}")def _simple_context(self, query: str, documents: List[str], max_length: int) -> str:"""簡單拼接策略"""current_length = 0selected = []for doc in documents:doc_length = len(doc.split())if current_length + doc_length <= max_length:selected.append(doc)current_length += doc_lengthelse:remaining = max_length - current_lengthif remaining > 100:  # 至少保留有意義的片段selected.append(" ".join(doc.split()[:remaining]))breakreturn "\n".join(selected)def _analytical_context(self, query: str, documents: List[str], max_length: int) -> str:"""分析型上下文構建"""# 1. 提取關鍵句key_sentences = []for doc in documents:sentences = re.split(r'(?<!\w\.\w.)(?<![A-Z][a-z]\.)(?<=\.|\?)\s', doc)for sent in sentences:if len(sent.split()) > 10:  # 忽略過短句子key_sentences.append(sent)# 2. 重排序scores = self.rerank_by_query(query, key_sentences)scored_sents = sorted(zip(key_sentences, scores), key=lambda x: x[1], reverse=True)# 3. 構建上下文selected = []current_length = 0for sent, score in scored_sents:sent_length = len(sent.split())if current_length + sent_length <= max_length:selected.append(f"[相關性: {score:.2f}] {sent}")current_length += sent_lengthreturn "\n".join(selected)# 單元測試
if __name__ == "__main__":processor = ContextProcessor()# 測試數據docs = ["深度學習是機器學習的分支，專注于使用深度神經網絡。","Transformer模型是當前最先進的NLP架構，基于自注意力機制。","BERT是一種預訓練的Transformer模型，廣泛用于各種NLP任務。","RAG系統結合了檢索和生成技術，提升大語言模型的準確性。"]query = "什么是BERT模型？"print("=== 簡單上下文 ===")print(processor.build_context(query, docs, "simple", 100))print("\n=== 分析型上下文 ===")print(processor.build_context(query, docs, "analytical", 150))

案例分析：法律咨詢RAG系統

業務場景：
為律師事務所構建智能法律咨詢系統，需要從大量法律文檔中檢索相關信息并生成準確回答。

挑戰：

法律文本復雜冗長
需要精確引用相關法條
回答必須嚴謹無歧義

解決方案：

使用分析型上下文構建策略
設計專業法律提示模板
實現引用溯源功能

class LegalPromptBuilder:def __init__(self):self.system_prompt = """你是一位專業法律AI助手，請嚴格按照以下要求回答問題:1. 只基于提供的法律條文和判例回答2. 明確標注引用來源(條款號/判例編號)3. 如無明確依據，應回答"需要進一步法律分析"4. 避免任何主觀解釋或推測"""def build_legal_prompt(self, query: str, contexts: List[Dict]) -> str:"""構建法律專業提示"""context_str = ""for ctx in contexts:context_str += f"【{ctx['source']}】{ctx['content']}\n\n"return f"""{self.system_prompt}### 相關法律依據:{context_str}### 咨詢問題:{query}### 回答格式要求:1. 法律定性2. 適用條款3. 相關判例(如有)4. 結論"""# 使用示例
if __name__ == "__main__":builder = LegalPromptBuilder()legal_contexts = [{"source": "民法典第584條","content": "當事人一方不履行合同義務或者履行合同義務不符合約定，給對方造成損失的...",},{"source": "(2022)最高法民終123號","content": "關于合同違約金的計算標準，應當綜合考慮實際損失和合同履行情況...",}]query = "合同違約后如何計算賠償金額？"prompt = builder.build_legal_prompt(query, legal_contexts)print(prompt)

優缺點分析

優勢：

顯著提升生成結果的相關性和準確性
減少LLM的幻覺問題
支持復雜問題的分步解答
可適應不同領域的專業要求

局限性：

提示設計需要領域專業知識
復雜提示可能增加計算成本
對上下文質量高度依賴
需要針對不同模型調整策略

總結

今天我們深入探討了RAG系統中的上下文構建與提示工程技術：

學習了多種上下文構建策略及其適用場景
實現了完整的提示構建器類，支持多種高級技術
分析了法律咨詢系統的實際案例
討論了不同技術的優缺點

核心技術要點：

上下文選擇比數量更重要
結構化提示顯著提升生成質量
領域特定的提示設計是關鍵
多輪和分步提示適合復雜問題

實踐建議：

從簡單策略開始逐步優化
針對領域特點定制提示模板
建立提示版本控制系統
持續監控生成質量

明天我們將探討【Day 25: 響應生成策略與幻覺減少】，學習如何優化RAG系統的最終輸出質量，減少錯誤信息生成。

參考資料

Prompt Engineering Guide
Advanced RAG Techniques
LegalAI Applications
Context Management in LLMs

文章標簽

RAG, Retrieval-Augmented Generation, Prompt Engineering, Context Management, NLP

文章簡述

本文是"RAG實戰指南"系列的第24篇，深入講解檢索增強生成系統中的上下文構建與提示工程技術。文章系統介紹了多種上下文組織策略、高級提示設計模式，并提供了完整的Python實現代碼。通過法律咨詢系統的實際案例，展示了如何將這些技術應用于專業領域。讀者將學習到如何優化RAG系統的上下文利用率、設計有效的提示模板，以及平衡信息密度與生成質量。本文內容既有理論深度又有實踐價值，提供的代碼可直接集成到現有RAG系統中。