以下內容整理自AI,進行一個概念掃盲:
-
Prompt(提示詞)
Prompt是用戶提供給AI模型的指令或問題,用于引導模型生成特定輸出。良好的Prompt設計能顯著提升模型的任務理解能力和響應質量,例如通過結構化提示(Few-shot Prompting)讓模型學習上下文中的示例,或使用思維鏈(Chain-of-Thought)提示引導模型分步推理。在Agent開發中,Prompt是控制行為的第一環,直接影響任務拆解、工具調用和結果生成的準確性。 -
RAG(檢索增強生成)
RAG通過結合實時檢索和文本生成技術,讓模型在回答時參考外部知識庫的最新信息,解決靜態模型的知識局限性。其核心流程包括:將用戶查詢轉換為向量,從向量數據庫中檢索相關文檔片段,再基于檢索內容生成回答。這種技術廣泛應用于客服、醫療問答等需要實時數據的場景,能有效減少模型幻覺。 -
Embedding(嵌入向量)
Embedding是將文本、圖像等數據映射為高維向量的技術,這些向量能捕捉語義特征(如“貓”和“狗”的向量相似度高于“貓”和“汽車”)。通過對比向量距離,可實現語義搜索、聚類和推薦。常用模型如OpenAI的text-embedding-ada-002或開源的Sentence-BERT,它們是構建RAG、記憶系統的基礎工具。 -
向量數據庫
向量數據庫(如Pinecone、Milvus)專為存儲和檢索高維向量優化,支持高效的相似度搜索。與傳統數據庫不同,它通過近似最近鄰(ANN)算法快速找到語義相似的條目,適合處理非結構化數據。在Agent中,向量數據庫用于存儲知識庫Embedding或用戶交互歷史,實現快速上下文檢索。 -
召回率
召回率衡量檢索系統覆蓋相關結果的能力,計算為“正確檢索到的相關項/所有相關項”。高召回率意味著系統遺漏較少,適用于需全面性的場景(如法律條文查詢)。實際應用中需與精確率(Precision)平衡,例如通過調整檢索閾值或結合重排序(Re-ranking)技術提升效果。 -
Top_K與Top_p
Top_K限制生成時僅從概率最高的K個候選詞中采樣,適合需要確定性的任務;Top_p(核采樣)動態選擇累積概率超過p的最小詞集,增強多樣性。兩者共同控制生成結果的創造性,例如客服場景用低Top_p保證嚴謹性,而創意寫作可用高Top_p激發靈感。 -
溫度(Temperature)
溫度參數調節生成隨機性:高溫(如1.0)增加多樣性但可能偏離事實,低溫(如0.2)使輸出更確定但缺乏新意。在Agent中,需根據任務調整——事實查詢用低溫,詩歌生成用高溫,而對話系統可能選擇中間值(0.7)平衡流暢性與準確性。 -
Memory(記憶)
Memory使Agent能存儲和利用歷史信息,分為短期記憶(如對話上下文緩存)和長期記憶(如向量化的用戶偏好)。實現方式包括:數據庫存儲結構化數據、向量庫保存語義記憶,或通過遞歸摘要(Recursive Summarization)壓縮長上下文。記憶機制是個性化服務的核心。 -
MCP(Model Context Protocol)
MCP是一種系統性管理AI模型交互上下文的框架協議,旨在通過結構化上下文傳遞和狀態維護來增強復雜任務中模型的連貫性與可控性。其核心是通過標準化接口(如JSON Schema)定義對話歷史、環境狀態、工具調用結果等上下文要素,使模型能動態跟蹤多輪交互的完整信息流。例如,在客服Agent場景中,MCP會記錄用戶歷史問題、已嘗試的解決方案、系統反饋等元數據,形成可追溯的任務圖譜;在自動化流程中,它可協調多個子模型間的上下文傳遞,確保鏈式調用(如檢索→分析→執行)的信息一致性。該協議通常與記憶模塊(Memory)、函數調用(Function Call)深度集成,既能解決長上下文窗口的容量限制問題(通過分層存儲關鍵信息),也能減少因上下文丟失導致的模型幻覺或邏輯斷層,是構建企業級Agent系統的底層支撐技術之一。 -
Function Call(函數調用)
Function Call允許模型調用外部工具(如API、數據庫)擴展能力,例如查詢天氣或執行數學計算。OpenAI等平臺提供結構化函數描述,模型根據需求自動觸發調用。這是Agent實現復雜任務(如訂機票、數據分析)的關鍵技術。 -
模型幻覺
模型幻覺指生成內容與事實或邏輯不符,成因包括訓練數據偏差、過度依賴參數化知識。緩解方法包括:RAG提供真實依據、設置低溫/低Top_p限制隨機性、添加事后驗證(如事實性檢查API)以及多步推理(Self-Consistency)。 -
模型微調
微調是在領域數據上繼續訓練預訓練模型,使其適應特定任務(如法律文本分析)。相比Prompt工程,微調能更深度調整模型行為,但需標注數據和算力支持。輕量級方法如LoRA(低秩適應)可降低資源消耗。 -
鏈式調用
鏈式調用將多個步驟串聯成工作流,例如“檢索→生成→驗證→執行”。框架如LangChain提供標準化接口,支持靈活組合工具和模型。復雜Agent可能嵌套多條鏈,如先規劃任務步驟,再逐步調用子鏈完成。 -
Agent(智能代理)
Agent是整合感知、決策與執行的自主系統,核心能力包括:通過Prompt和Memory理解上下文,利用Function Call調用工具,基于RAG獲取實時知識,并通過鏈式調用協調多步驟任務。高級Agent還能通過強化學習(RLHF)從反饋中持續優化行為。
總的來說,在人工智能領域,Prompt是指用戶輸入給模型的指令或問題,它直接影響模型的輸出質量和方向,好的Prompt設計能顯著提升任務完成效果。RAG(檢索增強生成)是一種結合信息檢索和文本生成的技術,通過從外部知識庫實時獲取相關信息來增強生成內容的準確性,特別適合需要實時數據的場景。Embedding技術將文本、圖像等數據轉化為高維向量,這些向量能夠捕捉語義信息,為相似性搜索和推薦系統提供基礎。向量數據庫是專門為存儲和檢索這些嵌入向量優化的數據庫,支持高效的相似度計算和大規模數據查詢,是構建智能檢索系統的核心組件。召回率衡量的是檢索系統找到所有相關項目的能力,高召回率意味著系統很少遺漏重要信息,這在信息檢索和推薦系統中尤為重要。Top_K和Top_p是控制文本生成多樣性的參數,前者限制候選詞范圍,后者通過概率累積動態調整候選詞集合,兩者共同影響生成結果的創造性和準確性。溫度參數調節生成過程中的隨機性,較高的溫度會產生更多樣化的輸出,而較低的溫度則使結果更加確定和保守。Memory使AI系統能夠記住歷史交互信息,分為短期記憶(如當前會話上下文)和長期記憶(如用戶偏好存儲),是實現個性化服務的關鍵。MCP(多選提示)通過提供候選答案讓模型選擇最佳響應,能有效減少模型幻覺問題。Function Call允許模型調用外部工具或API來擴展能力,比如查詢天氣或執行計算,極大提升了Agent的功能范圍。模型幻覺是指AI生成與事實不符的內容,通過RAG、參數調優和事實校驗可以有效緩解。模型微調通過在特定領域數據上繼續訓練預訓練模型,使其適應專業任務,如醫療或法律問答。鏈式調用將多個處理步驟串聯起來,形成連貫的工作流程,常用于復雜任務的自動化處理。Agent作為智能代理,整合了上述所有技術,具備自主決策、工具調用和持續學習能力,能夠完成從簡單問答到復雜問題解決的全方位任務。構建高效Agent需要合理設計工作流程,選擇適當的技術棧,并通過持續優化參數和評估指標來提升系統性能。