檢索增強生成(RAG):強化 AI 智能體的知識 “武裝”

技術點目錄

    • 第一章、智能體(Agent)入門
    • 第二章、基于字節Coze 構建智能體(Agent)
    • 第三章、基于其他平臺構建智能體(Agent)
    • 第四章、國內外智能體(Agent)經典案例詳解
    • 第五章、大語言模型應用開發框架LangChain入門
    • 第六章、基于LangChain的大模型API接入
    • 第七章、基于LangChain的智能體(Agent)開發
    • 第八章、開源大語言模型及本地部署
    • 第九章、從0到1搭建第一個大語言模型
    • 第十章、大語言模型優化
    • 了解更多

———————————————————————————————————————
在 AI 智能體的開發與應用中,如何讓智能體獲取準確且最新的知識是一個關鍵問題。檢索增強生成(RAG)技術的出現,為解決這一難題提供了有效途徑,它通過結合大語言模型和外部知識檢索,極大地強化了 AI 智能體的知識儲備和回答能力。

在這里插入圖片描述
RAG 技術核心機制

RAG 技術的核心之一是知識檢索。它利用向量數據庫等技術,將文本數據轉化為向量形式存儲,當智能體接收到問題時,通過計算向量相似度,從知識庫中快速檢索出相關信息。例如,使用 FAISS 向量數據庫,將大量的新聞文章存儲為向量,當用戶詢問關于某一事件的信息時,能迅速找到相關文章。信息融合是 RAG 的另一個關鍵環節,將檢索到的信息與大語言模型的生成能力相結合。智能體不再單純依賴模型的預訓練知識,而是根據檢索結果生成更準確、更有針對性的回答。知識庫構建也至關重要,需要收集、整理和更新知識數據,確保知識庫的完整性和準確性。比如,構建一個醫療知識庫,包含疾病癥狀、治療方法等信息。

RAG 在智能體中的應用實現

在智能體架構中集成 RAG 模塊,首先要選擇合適的 RAG 框架或工具,如 LangChain 就提供了方便的 RAG 集成功能。通過配置相關參數,將知識庫與大語言模型連接起來。優化檢索策略可以提高檢索的準確性和效率,比如采用語義檢索、多關鍵詞檢索等方式,結合關鍵詞權重調整,使檢索結果更符合用戶需求。在生成結果優化方面,根據檢索到的信息,對大語言模型的輸入進行調整,引導模型生成更優質的回答。例如,在問答系統中,將檢索到的文本作為上下文提供給模型,讓模型基于這些信息生成答案。

RAG 對智能體的價值體現

RAG 技術顯著提升了智能體知識的準確性。由于引入了外部知識庫的檢索,智能體能夠獲取更精確的信息,避免了單純依賴模型預訓練知識可能出現的錯誤。時效性方面,RAG 使智能體可以實時獲取最新知識。比如在金融領域,智能體可以及時檢索到最新的股票行情、財經新聞等信息,為用戶提供最新的市場動態。在可解釋性上,RAG 也有很大改善,因為智能體的回答是基于檢索到的具體信息,能夠清晰地解釋回答的依據,增強用戶對智能體的信任。
檢索增強生成(RAG)技術通過獨特的核心機制,在智能體中的有效應用,為 AI 智能體帶來了知識準確性、時效性和可解釋性等多方面的提升,使其在各種應用場景中更具優勢。

第一章、智能體(Agent)入門

1、智能體(Agent)概述(什么是智能體?智能體的類型和應用場景、典型的智能體應用,如:Google Data Science Agent等)

2、智能體(Agent)與大語言模型(LLM)的關系

3、智能體(Agent)的五種能力(記憶、規劃、工具、自主決策、推理)

4、多智能體(Multi-Agent)協作

5、智能體(Agent)構建的基本步驟

6、案例

第二章、基于字節Coze 構建智能體(Agent)

1、Coze平臺概述

2、(實操)從0到1搭建第一個智能體(Agent)

3、(實操)智能體(Agent)基礎設置(多Agent模式、對話流模式、LLM模型設置、提示詞撰寫等)

4、(實操)為智能體(Agent)添加技能(插件、工作流、觸發器、卡片等)

5、(實操)為智能體(Agent)添加知識(知識庫介紹、添加知識庫、知識庫檢索與召回等)

6、(實操)為智能體(Agent)添加記憶(創建和使用變量、數據庫、長期記憶的開啟、修改和刪除等)

7、(實操)提升智能體(Agent)的對話體驗(設置開場白、快捷指令等)

8、(實操)智能體(Agent)的預覽、調試與發布

9、案例

第三章、基于其他平臺構建智能體(Agent)

1、(實操)基于百度平臺構建智能體

2、(實操)基于智譜清言平臺構建智能體

3、(實操)基于通義千問平臺構建智能體

4、(實操)基于豆包平臺構建智能體

5、案例

第四章、國內外智能體(Agent)經典案例詳解

1、斯坦福小鎮:生成式智能體(Generative Agents)

2、ByteDance Research推出的論文檢索智能體

3、Google Data Science Agent

4、AutoGPT:通過自然語言的需求描述執行自動化任務

5、OpenAI推出的首個智能體(Agent):Operator

6、案例

第五章、大語言模型應用開發框架LangChain入門

1、LangChain平臺概述(LangChain框架的核心功能與特點)

2、(實操)LangChain安裝與使用

3、(實操)LangChain的核心組件:Models(模型)、Prompts(提示詞)、Indexes(索引)、Chains(鏈)、Agents(智能體)、Memory(記憶)

4、案例

第六章、基于LangChain的大模型API接入

1、(實操)在LangChain 中使用OpenAI大語言模型

2、(實操)在LangChain 中使用文心一言大語言模型

3、(實操)在LangChain 中使用DeepSeek大語言模型

4、(實操)在LangChain 中使用智譜清言大語言模型

5、(實操)在LangChain 中使用本地開源大語言模型

6、案例

第七章、基于LangChain的智能體(Agent)開發

1、使用LangChain構建Agent的使用流程

2、(實操)LangChain的配置與管理

3、(實操)LangChain提示詞模板(PromptTemplate)的創建與調用

4、(實操)利用LLMRequestsChain類實現從互聯網獲取信息(查詢天氣等)

5、(實操)LangChain鏈式請求的創建與調用

6、(實操)LangChain讓AI記住你說過的話

7、案例

第八章、開源大語言模型及本地部署

1、開源大語言模型簡介(開源大語言模型的基本概念、開源大語言模型與閉源大語言模型的對比)

2、(實操)開源大語言模型(Llama3、Mistral、Phi3、Qwen2、DeepSeek等)下載與使用

3、(實操)使用Docker部署開源大語言模型(Docker的基本概念、Docker的核心組件與功能、Docker的安裝與配置、在Docker中部署Llama3等開源大語言模型)

4、(實操)使用Open-WebUI構建Web可視化交互(類似ChatGPT)的開源大語言模型對話系統(Open-WebUI的基本概念與功能、Open-WebUI的下載與安裝、配置一個用于對話系統的Open-WebUI)

5、案例

第九章、從0到1搭建第一個大語言模型

1、(實操)數據集構建(數據集的收集與處理、從互聯網上收集文本數據、數據清洗與標注、常用的數據集格式,如:CSV、JSON、TXT等)

2、(實操)大語言預訓練模型的選擇(預訓練模型的優勢、常見的預訓練模型,如:GPT、BERT等、從Hugging Face等平臺下載預訓練模型)

3、(實操)大語言模型的訓練(模型訓練的基本步驟、訓練過程中的監控與調試)

4、(實操)大語言模型的優化(常見訓練參數,如:學習率、批次大小等、參數調整與優化技巧、優化訓練參數以提高模型性能)

5、(實操)大語言模型的推理(模型推理與模型訓練的區別、提高推理速度的技巧、從輸入到輸出的完整推理流程)

6、(實操)大語言模型的部署與應用(模型部署的基本流程、部署環境的配置與管理)

7、案例

第十章、大語言模型優化

1、檢索增強生成(RAG)技術詳解(RAG的基本原理、RAG在大語言模型中的作用和優勢、RAG的系統架構、RAG檢索結果與生成結果相結合的方法、RAG知識庫的構建方法)

2、向量數據庫簡介與向量檢索技術詳解(使用向量數據庫進行快速檢索)

3、文本嵌入(Text Embedding)技術概述(常用的文本嵌入模型、使用GPT API)

4、(實操)基于RAG的問答系統設計

5、微調(Fine-Tuning)技術詳解(微調的基本原理、微調在大語言模型中的作用、準備一個用于微調的數據集、常見的微調方法,如PEFT、LoRA等、不同任務的微調策略、微調過程中的常見問題與解決方案)

6、(實操)微調一個預訓練的GPT模型

7、量化技術詳解(量化的基本概念、量化在模型優化中的重要性、量化的不同方法,如:靜態量化、動態量化、混合量化等、量化處理的步驟)

8、案例

了解更多

V頭像

本文來自互聯網用戶投稿,該文觀點僅代表作者本人,不代表本站立場。本站僅提供信息存儲空間服務,不擁有所有權,不承擔相關法律責任。
如若轉載,請注明出處:http://www.pswp.cn/web/74235.shtml
繁體地址,請注明出處:http://hk.pswp.cn/web/74235.shtml
英文地址,請注明出處:http://en.pswp.cn/web/74235.shtml

如若內容造成侵權/違法違規/事實不符,請聯系多彩編程網進行投訴反饋email:809451989@qq.com,一經查實,立即刪除!

相關文章

vscode 打開工程 看不到文件目錄

vscode 打開工程 看不到文件目錄 View->Explorer 快捷鍵:CtrlShiftE

厘米級定位賦能智造升級:品鉑科技UWB技術驅動工廠全流程自動化與效能躍升”

在智能制造中的核心價值體現在?高精度定位、流程優化、安全管理?等多個維度,具體應用如下: 一、?核心技術與定位能力? ?厘米級高精度定位? UWB技術通過?納秒級窄脈沖信號?(帶寬超500MHz)實現高時間分辨率,結合…

getID3獲取本地或遠程視頻時長

音頻文件也可使用,使用ffmeg安裝太復雜了 附ffmpeg方式:centos下安裝ffmpeg_yum安裝ffmpeg-CSDN博客 使用composer先安裝 composer require james-heinrich/getid3 獲取本地視頻 //獲取本地視頻$video_path $_SERVER[DOCUMENT_ROOT].$params[video];…

10、Linux C 網絡編程(完整版)

1、網絡發展歷史和分層 1.1 Internet 的歷史 起源: 1957 年:蘇聯發射第一顆人造衛星 "Sputnik"。 1958 年:美國總統艾森豪威爾成立 DARPA(國防部高級研究計劃署)。 1968 年:DARPA 提出 "…

前端:開源軟件鏡像站 / 清華大學開源軟件鏡像站 / 阿里云 / 網易 / 搜狐

一、理解開源軟件鏡像站 開源軟件鏡像是指開源軟件在遠程服務器上的備份副本,允許用戶通過互聯網快速下載和安裝所需的軟件。在國內,有多個知名的開源軟件鏡像站,為開發者提供穩定、快速的開源軟件下載服務。 二、常見開源軟件鏡像站 序號…

Oracle 數據庫中優化 INSERT INTO 操作的性能

在 Oracle 數據庫中優化 INSERT INTO 操作的性能,尤其是在處理大批量數據時,可以通過以下方法顯著提升效率。 使用直接路徑插入(Direct-Path Insert) 通過 APPEND 提示繞過緩沖區緩存,直接寫入數據文件,減…

嵌入式硬件篇---嘉立創PCB繪制

文章目錄 前言一、PCB繪制簡介1.1繪制步驟1.1.1前期準備1.1.2原理圖設計1.1.3原理圖轉PCB1.1.4PCB布局1.1.5布線1.1.6布線優化和絲印1.1.7制版 1.2原理1.2.1電氣連接原理1.2.2信號傳輸原理1.2.3電源和接地原理 1.3注意事項1.3.1元件封裝1.3.2布局規則1.3.3過孔設計1.3.4DRC檢查…

ideal自動生成類圖的方法

在 IntelliJ IDEA 中,“**在項目資源管理器中選擇以下類**” 是指通過 **項目資源管理器(Project Tool Window)** 找到并選中你需要生成類圖的類文件(如 .java 文件),然后通過右鍵菜單或快捷鍵操作生成類圖…

【零基礎入門unity游戲開發——2D篇】2D物理關節 —— Joint2D相關組件

考慮到每個人基礎可能不一樣,且并不是所有人都有同時做2D、3D開發的需求,所以我把 【零基礎入門unity游戲開發】 分為成了C#篇、unity通用篇、unity3D篇、unity2D篇。 【C#篇】:主要講解C#的基礎語法,包括變量、數據類型、運算符、流程控制、面向對象等,適合沒有編程基礎的…

在Vue 3 + TypeScript + Vite 項目中安裝和使用 SCSS

在Vue 3 TypeScript Vite 項目中安裝和使用 SCSS 1、安裝 SCSS 的相關依賴 npm install sass --save-dev2、配置 Vite 對于 Vue 3,Vite 已經內置了對 SCSS 的支持,通常不需要額外的配置。但是,如果需要自定義配置,可以在路徑…

【滲透測試】Vulnhub靶機-FSoft Challenges VM: 1-詳細通關教程

下載地址:https://www.vulnhub.com/entry/fsoft-challenges-vm-1,402/ 目錄 前言 信息收集 目錄掃描 wpscan掃描 修改密碼 反彈shell 提權 思路總結 前言 開始前注意靶機簡介,當第一次開機時會報apache錯誤,所以要等一分鐘后重啟才…

Redis 6.2.6 生產環境單機配置詳解redis.conf

文章目錄 Redis 生產環境配置詳解配置文件示例基礎網絡與進程管理RDB 持久化配置復制(主從同步)設置內存管理AOF 持久化性能優化設置限制與監控其他參數完整配置總結 Redis 生產環境配置詳解 在實際生產環境中,為了保障 Redis 的穩定性和高性…

SpringBoot實戰:Excel文件上傳、數據驗證與存儲全流程解析

一、需求場景與技術選型 在企業管理、數據中臺等系統中,Excel文件處理是常見需求。本文將基于SpringBoot實現以下核心功能: 支持.xls/.xlsx文件上傳數據完整性驗證(非空、格式等)業務數據驗證(關聯數據庫校驗&#x…

使用Java爬蟲按關鍵字搜索淘寶商品?

在電商領域,通過關鍵字搜索商品是獲取商品信息的常見需求。Java爬蟲技術可以幫助我們自動化地獲取這些信息,提高工作效率。本文將詳細介紹如何使用Java爬蟲按關鍵字搜索淘寶商品,并提供完整的代碼示例。 一、準備工作 1. 注冊淘寶開放平臺賬…

【Git】5 個分區的切換方式及示例

目錄 1. **工作區(Working Directory)**2. **緩存區(Stage/Index)**3. **本地倉庫(Local Repository)**4. **遠程倉庫(Remote Repository)**5. **貯藏區(Stash&#xff0…

【計算機視覺】YOLO語義分割

一、語義分割簡介 1. 定義 語義分割(Semantic Segmentation)是計算機視覺中的一項任務,其目標是對圖像中的每一個像素賦予一個類別標簽。與目標檢測只給出目標的邊界框不同,語義分割能夠在像素級別上區分不同類別,從…

MATLAB之數據分析圖系列:從二維到三維(直接套用)

MATLAB以其強大的矩陣運算和可視化功能,成為科研、工程領域的標配工具。本文提供從基礎二維圖形到復雜三維模型的即用代碼塊,涵蓋數據標注、多圖排版、動態演示等核心技巧 所有代碼均經過MATLAB 2023a實測,替換數據即可生成專業級圖表。” …

HTTP響應數據包全面解析:結構、原理與最佳實踐

目錄 HTTP響應概述 HTTP響應數據包結構 2.1 狀態行 2.2 響應頭 2.3 空行 2.4 響應體 HTTP狀態碼詳解 3.1 1xx信息響應 3.2 2xx成功響應 3.3 3xx重定向 3.4 4xx客戶端錯誤 3.5 5xx服務器錯誤 常見HTTP響應頭字段 響應體內容類型 緩存控制機制 實際HTTP響應示例分…

H.264編碼解析與C++實現詳解

一、H.264編碼核心概念 1.1 分層編碼結構 H.264采用分層設計,包含視頻編碼層(VCL)和網絡抽象層(NAL)。VCL處理核心編碼任務,NAL負責封裝網絡傳輸數據。 1.2 NALU單元結構 // NAL單元頭部結構示例 struc…

快速入手-基于Django-rest-framework的自身組件權限認證(九)

1、在對應的視圖函數里增加認證(局部起作用,不全局生效) 導入類: from rest_framework.authentication import ( BasicAuthentication, SessionAuthentication, ) from rest_framework.permissions import IsAuthentica…