AI大模型各類概念掃盲

以下內容整理自AI,進行一個概念掃盲:

  • Prompt(提示詞)
    Prompt是用戶提供給AI模型的指令或問題,用于引導模型生成特定輸出。良好的Prompt設計能顯著提升模型的任務理解能力和響應質量,例如通過結構化提示(Few-shot Prompting)讓模型學習上下文中的示例,或使用思維鏈(Chain-of-Thought)提示引導模型分步推理。在Agent開發中,Prompt是控制行為的第一環,直接影響任務拆解、工具調用和結果生成的準確性。

  • RAG(檢索增強生成)
    RAG通過結合實時檢索和文本生成技術,讓模型在回答時參考外部知識庫的最新信息,解決靜態模型的知識局限性。其核心流程包括:將用戶查詢轉換為向量,從向量數據庫中檢索相關文檔片段,再基于檢索內容生成回答。這種技術廣泛應用于客服、醫療問答等需要實時數據的場景,能有效減少模型幻覺。

  • Embedding(嵌入向量)
    Embedding是將文本、圖像等數據映射為高維向量的技術,這些向量能捕捉語義特征(如“貓”和“狗”的向量相似度高于“貓”和“汽車”)。通過對比向量距離,可實現語義搜索、聚類和推薦。常用模型如OpenAI的text-embedding-ada-002或開源的Sentence-BERT,它們是構建RAG、記憶系統的基礎工具。

  • 向量數據庫
    向量數據庫(如Pinecone、Milvus)專為存儲和檢索高維向量優化,支持高效的相似度搜索。與傳統數據庫不同,它通過近似最近鄰(ANN)算法快速找到語義相似的條目,適合處理非結構化數據。在Agent中,向量數據庫用于存儲知識庫Embedding或用戶交互歷史,實現快速上下文檢索。

  • 召回率
    召回率衡量檢索系統覆蓋相關結果的能力,計算為“正確檢索到的相關項/所有相關項”。高召回率意味著系統遺漏較少,適用于需全面性的場景(如法律條文查詢)。實際應用中需與精確率(Precision)平衡,例如通過調整檢索閾值或結合重排序(Re-ranking)技術提升效果。

  • Top_K與Top_p
    Top_K限制生成時僅從概率最高的K個候選詞中采樣,適合需要確定性的任務;Top_p(核采樣)動態選擇累積概率超過p的最小詞集,增強多樣性。兩者共同控制生成結果的創造性,例如客服場景用低Top_p保證嚴謹性,而創意寫作可用高Top_p激發靈感。

  • 溫度(Temperature)
    溫度參數調節生成隨機性:高溫(如1.0)增加多樣性但可能偏離事實,低溫(如0.2)使輸出更確定但缺乏新意。在Agent中,需根據任務調整——事實查詢用低溫,詩歌生成用高溫,而對話系統可能選擇中間值(0.7)平衡流暢性與準確性。

  • Memory(記憶)
    Memory使Agent能存儲和利用歷史信息,分為短期記憶(如對話上下文緩存)和長期記憶(如向量化的用戶偏好)。實現方式包括:數據庫存儲結構化數據、向量庫保存語義記憶,或通過遞歸摘要(Recursive Summarization)壓縮長上下文。記憶機制是個性化服務的核心。

  • MCP(Model Context Protocol)
    MCP是一種系統性管理AI模型交互上下文的框架協議,旨在通過結構化上下文傳遞和狀態維護來增強復雜任務中模型的連貫性與可控性。其核心是通過標準化接口(如JSON Schema)定義對話歷史、環境狀態、工具調用結果等上下文要素,使模型能動態跟蹤多輪交互的完整信息流。例如,在客服Agent場景中,MCP會記錄用戶歷史問題、已嘗試的解決方案、系統反饋等元數據,形成可追溯的任務圖譜;在自動化流程中,它可協調多個子模型間的上下文傳遞,確保鏈式調用(如檢索→分析→執行)的信息一致性。該協議通常與記憶模塊(Memory)、函數調用(Function Call)深度集成,既能解決長上下文窗口的容量限制問題(通過分層存儲關鍵信息),也能減少因上下文丟失導致的模型幻覺或邏輯斷層,是構建企業級Agent系統的底層支撐技術之一。

  • Function Call(函數調用)
    Function Call允許模型調用外部工具(如API、數據庫)擴展能力,例如查詢天氣或執行數學計算。OpenAI等平臺提供結構化函數描述,模型根據需求自動觸發調用。這是Agent實現復雜任務(如訂機票、數據分析)的關鍵技術。

  • 模型幻覺
    模型幻覺指生成內容與事實或邏輯不符,成因包括訓練數據偏差、過度依賴參數化知識。緩解方法包括:RAG提供真實依據、設置低溫/低Top_p限制隨機性、添加事后驗證(如事實性檢查API)以及多步推理(Self-Consistency)。

  • 模型微調
    微調是在領域數據上繼續訓練預訓練模型,使其適應特定任務(如法律文本分析)。相比Prompt工程,微調能更深度調整模型行為,但需標注數據和算力支持。輕量級方法如LoRA(低秩適應)可降低資源消耗。

  • 鏈式調用
    鏈式調用將多個步驟串聯成工作流,例如“檢索→生成→驗證→執行”。框架如LangChain提供標準化接口,支持靈活組合工具和模型。復雜Agent可能嵌套多條鏈,如先規劃任務步驟,再逐步調用子鏈完成。

  • Agent(智能代理)
    Agent是整合感知、決策與執行的自主系統,核心能力包括:通過Prompt和Memory理解上下文,利用Function Call調用工具,基于RAG獲取實時知識,并通過鏈式調用協調多步驟任務。高級Agent還能通過強化學習(RLHF)從反饋中持續優化行為。

總的來說,在人工智能領域,Prompt是指用戶輸入給模型的指令或問題,它直接影響模型的輸出質量和方向,好的Prompt設計能顯著提升任務完成效果。RAG(檢索增強生成)是一種結合信息檢索和文本生成的技術,通過從外部知識庫實時獲取相關信息來增強生成內容的準確性,特別適合需要實時數據的場景。Embedding技術將文本、圖像等數據轉化為高維向量,這些向量能夠捕捉語義信息,為相似性搜索和推薦系統提供基礎。向量數據庫是專門為存儲和檢索這些嵌入向量優化的數據庫,支持高效的相似度計算和大規模數據查詢,是構建智能檢索系統的核心組件。召回率衡量的是檢索系統找到所有相關項目的能力,高召回率意味著系統很少遺漏重要信息,這在信息檢索和推薦系統中尤為重要。Top_K和Top_p是控制文本生成多樣性的參數,前者限制候選詞范圍,后者通過概率累積動態調整候選詞集合,兩者共同影響生成結果的創造性和準確性。溫度參數調節生成過程中的隨機性,較高的溫度會產生更多樣化的輸出,而較低的溫度則使結果更加確定和保守。Memory使AI系統能夠記住歷史交互信息,分為短期記憶(如當前會話上下文)和長期記憶(如用戶偏好存儲),是實現個性化服務的關鍵。MCP(多選提示)通過提供候選答案讓模型選擇最佳響應,能有效減少模型幻覺問題。Function Call允許模型調用外部工具或API來擴展能力,比如查詢天氣或執行計算,極大提升了Agent的功能范圍。模型幻覺是指AI生成與事實不符的內容,通過RAG、參數調優和事實校驗可以有效緩解。模型微調通過在特定領域數據上繼續訓練預訓練模型,使其適應專業任務,如醫療或法律問答。鏈式調用將多個處理步驟串聯起來,形成連貫的工作流程,常用于復雜任務的自動化處理。Agent作為智能代理,整合了上述所有技術,具備自主決策、工具調用和持續學習能力,能夠完成從簡單問答到復雜問題解決的全方位任務。構建高效Agent需要合理設計工作流程,選擇適當的技術棧,并通過持續優化參數和評估指標來提升系統性能。

本文來自互聯網用戶投稿,該文觀點僅代表作者本人,不代表本站立場。本站僅提供信息存儲空間服務,不擁有所有權,不承擔相關法律責任。
如若轉載,請注明出處:http://www.pswp.cn/bicheng/90497.shtml
繁體地址,請注明出處:http://hk.pswp.cn/bicheng/90497.shtml
英文地址,請注明出處:http://en.pswp.cn/bicheng/90497.shtml

如若內容造成侵權/違法違規/事實不符,請聯系多彩編程網進行投訴反饋email:809451989@qq.com,一經查實,立即刪除!

相關文章

Linux系統編程——網絡

一、TCP/UDP 1、osi模型 物理層、數據鏈路層、網絡層、傳輸層、會話層、表示層、應用層(下層為上層提供服務) 2、TCP/IP模型(TCP/IP協議棧) 應用層: HTTP(超文本傳輸協議)、FTP(文件…

taro+pinia+小程序存儲配置持久化

主要通過taro的getStorageSync,setStorageSync實現配置持久化 // https://pinia.esm.dev/introduction.html import { defineStore } from pinia; import { CreditCardDateUtils } from /untils/compute; import { getStorageSync, setStorageSync } from "tarojs/taro&qu…

抖音小游戲好做嗎?

從0到1,教你打造爆款抖音小游戲隨著移動互聯網的發展,抖音小游戲憑借便捷即玩、流量龐大等優勢,成為游戲開發者的熱門選擇。想知道如何開發出一款吸睛又好玩的抖音小游戲嗎?下面就為你詳細介紹開發流程。一、前期規劃明確游戲類型…

Spring Boot 3核心技術面試指南:從遷移升級到云原生實戰,9輪技術攻防(含架構解析)

面試官:cc程序員,聊聊Spring Boot 3的那些事兒? 場景背景 互聯網大廠云原生架構部面試官老王,與自稱"Spring Boot骨灰粉"的cc程序員展開技術對決。 面試過程 第一輪:遷移升級 面試官:Spring Boot…

技術演進中的開發沉思-42 MFC系列:Components 與 ActiveX Controls

點擊程序啟動時,是不是看過有加載的畫面。在VC開發時,可使用 VC 的 Component Gallery,找到 Splash screen 組件,當時覺得組件就是給程序員的暖手寶。一、Component GalleryComponent Gallery 在 VC 里的位置很特別 —— 它藏在 “…

抽象類、接口、枚舉

第八天(堅持)抽象類1.什么是抽象類,作用特點。抽象類是面向對象編程中一種特殊的類,它不能被實例化,主要用于作為其他類的基類(父類)。抽象類的主要作用是定義公共結構和行為規范,同…

在Ubuntu上使用QEMU仿真運行ARM匯編

ARM匯編一般無法在PC上直接運行,因為ARM和x86架構是不一樣的。但是很多時候用ARM開發板是很不方便的,所以能不能直接在PC上仿真運行ARM匯編來練習呢?當然可以,那就是:使用QEMU來仿真。這篇文章我們就來演示下如何在Ubu…

【趣味解讀】淘寶登錄的前后端交互機制:Cookie-Session 如何保障你的賬戶安全?

在現代Web應用中,前后端交互是核心功能之一,而用戶認證又是其中最關鍵的部分。本文將以淘寶登錄為例,詳細解析基于Cookie-Session的前后端交互流程,幫助開發者理解這一常見的安全認證機制。生動理解一下什么是cookie和seesion我們…

貪心算法(基礎算法)

1.引言 ok啊,拖更這么長時間也是沒有壓力(doge) 不說啥,直接進入正題。 2.概念 這個貪心算法呢,看名字就知道,不就是每個步驟都挑最好的嘛,有啥難的。 這么說的話......其實確實&#xff0c…

簡單的mcp 服務示例

參考:https://www.bilibili.com/video/BV1nyVDzaE1x 編寫自己的tools.py #### tools.py from pathlib import Path import osbase_dir Path("./test")def read_file(name: str) -> str:"""Return file content. If not exist, return …

DeepSeek-R1+豆包迭代一次完成中國象棋游戲

DeepSeeek- R1生成的棋盤符合中國象棋風&#xff0c;單獨豆包無法畫好象棋棋盤。提示詞&#xff1a;使用html實現中國象棋游戲&#xff0c;要求支持人機對弈。等等&#xff0c;你需要實現完整版本。代碼如下&#xff08;電腦走棋不對&#xff09;&#xff1a;<!DOCTYPE html…

阿里通義千問Qwen3深夜升級:架構革新+性能碾壓

&#xff08;以下借助 DeepSeek-R1 & Grok3 輔助整理&#xff09; 北京時間2025年7月22日凌晨&#xff0c;阿里云通義千問團隊發布了Qwen3旗艦模型的最新更新——Qwen3-235B-A22B-Instruct-2507-FP8。這一更新不僅在性能上實現了突破&#xff0c;還標志著開源大模型技術架…

pip關于緩存的用法

pip cache info查看 pip 緩存的大小&#xff0c;運行示例 Package index page cache location (pip v23.3): c:\users\xxx\appdata\local\pip\cache\http-v2 Package index page cache location (older pips): c:\users\xxx\appdata\local\pip\cache\http Package index page c…

嵌入式學習-(李宏毅)機器學習(2)-day29

十五個作業不同類型的Functions兩大類任務一個是Regression&#xff08;回歸&#xff09; 一個是 Classification&#xff08;分類&#xff09;一個是給出一個數值&#xff0c;一個是從類別中選擇一個還有一類任務 Structured Learning 機器要學會創造文件 機器學習預測頻道第…

【C++11】哈希表與無序容器:從概念到應用

文章目錄一、前言二、哈希表&#xff08;Hash Table&#xff09;1. 基本概念2. 哈希函數3. 沖突解決方法鏈地址法&#xff08;Separate Chaining&#xff09;開放尋址法&#xff08;Open Addressing&#xff09;4. 性能分析5. 動態擴容6. 應用場景7. 優缺點二. 無序容器的介紹1…

【智能大數據分析 | 實驗二】Spark實驗:部署Spark集群

【作者主頁】Francek Chen 【專欄介紹】???智能大數據分析??? 智能大數據分析是指利用先進的技術和算法對大規模數據進行深入分析和挖掘&#xff0c;以提取有價值的信息和洞察。它結合了大數據技術、人工智能&#xff08;AI&#xff09;、機器學習&#xff08;ML&#xf…

使用pymongo進行MongoDB的回收

在 PyMongo 中使用 compact 命令進行 MongoDB 碎片回收的完整操作指南如下&#xff1a; 一、核心執行方法 from pymongo import MongoClient import time# 1. 連接到 MongoDB 實例 client MongoClient("mongodb://username:passwordhost:27017/dbname?authSourceadmin&q…

Azure DevOps 使用服務主體配置自托管代理 (Self-hosted Agent) 配置指南

Azure DevOps 使用服務主體配置自托管代理配置指南1. 概述2. 在 Azure AD 中創建服務主體 (SP)3. 授予 Azure DevOps 權限3.1. 組織層級&#xff1a;用戶身份與訪問級別3.2. 組織層級&#xff1a;Agent pools管理員3.3. 在 Linux VM 上安裝和配置代理3.4. 啟動并設置為系統服務…

Java學習第六十四部分——Nginx

目錄 一、前言提要 二、核心特點 三、核心作用 四、架構優勢 五、應用場景 六、常用命令 七、性能對比——Nginx vs Apache 八、典型用戶 九、配置示例 十、Java應用需配合的配置 十一、性能優化策略 十二、常見問題排查 十三、文件結構配置 十四、總結歸納概述 …

幾個常用的Oxygen編輯器插件

Oxygen XML Editor是羅馬尼亞的SyncroSoft公司開發的結構化文檔編輯和發布軟件。 除了Oxygen編輯器帶的功能&#xff0c;它還提供了豐富的插件來提供額外的功能來輔助資料開發人員更高效率、更低成本地開發結構化資料。 本文介紹幾個比較常用和有用的插件。 - 1 - Git Clie…