LLM - 白話RAG(Retrieval-Augmented Generation)

文章目錄

  • Pre
  • 一、大模型的"幻覺"之謎
    • 1.1 何為"幻覺"現象?
    • 1.2 專業場景的致命挑戰
  • 二、RAG技術解析:給大模型裝上"知識外掛"
    • 2.1 核心原理:動態知識增強
    • 2.2 技術實現三部曲
  • 三、RAG vs 微調:技術選型指南
    • 3.1 核心差異對比
    • 3.2 黃金選擇法則

在這里插入圖片描述

Pre

LLM - 白話向量模型和向量數據庫


一、大模型的"幻覺"之謎

1.1 何為"幻覺"現象?

大模型會以高度自信的姿態輸出錯誤信息,猶如天才學生考試時"編造答案"。這種現象主要源于:

  • 知識缺陷:訓練數據存在錯誤/過時信息(如2021年前的GPT模型)
  • 推理偏差:過度泛化語言模式(將"鳥類會飛"套用于企鵝)
  • 領域盲區:缺乏垂直行業知識(如企業私有產品數據)

1.2 專業場景的致命挑戰

在醫療診斷、法律咨詢等場景中,10%的錯誤率可能帶來災難性后果。


二、RAG技術解析:給大模型裝上"知識外掛"

在這里插入圖片描述

2.1 核心原理:動態知識增強

RAG(Retrieval-Augmented Generation)通過實時檢索外部知識庫,為生成過程提供精準參考。其創新之處在于:

傳統大模型RAG增強模型
依賴靜態訓練數據動態整合最新知識
單一生成過程檢索-生成雙階段流程
通用知識覆蓋領域知識深度定制

2.2 技術實現三部曲

案例:構建智能客服系統

在這里插入圖片描述

  1. 知識索引構建

在這里插入圖片描述

  1. 智能檢索階段

  2. 增強生成階段

在這里插入圖片描述
在這里插入圖片描述

// 使用LangChain4j實現電商智能客服的RAG流程
import dev.langchain4j.data.segment.TextSegment;
import dev.langchain4j.model.embedding.EmbeddingModel;
import dev.langchain4j.retriever.EmbeddingStoreRetriever;
import dev.langchain4j.store.embedding.EmbeddingStore;public class RagProductAssistant {// 1. 檢索增強組件private final EmbeddingModel embeddingModel;private final EmbeddingStore<TextSegment> embeddingStore;// 2. 大模型組件private final ChatLanguageModel chatModel;public RagProductAssistant(EmbeddingModel embeddingModel, EmbeddingStore<TextSegment> embeddingStore,ChatLanguageModel chatModel) {this.embeddingModel = embeddingModel;this.embeddingStore = embeddingStore;this.chatModel = chatModel;}// 核心RAG處理流程public String answerQuestion(String userQuery) {// 階段1:檢索上下文List<TextSegment> relevantContexts = retrieveRelevantContext(userQuery);// 階段2:增強生成return generateAugmentedResponse(userQuery, relevantContexts);}// 上下文檢索方法private List<TextSegment> retrieveRelevantContext(String query) {// 生成查詢向量Embedding queryEmbedding = embeddingModel.embed(query).content();// 向量數據庫檢索(取Top3)int maxResults = 3;List<EmbeddingMatch<TextSegment>> matches = embeddingStore.findRelevant(queryEmbedding, maxResults);// 提取文本片段return matches.stream().map(EmbeddingMatch::embedded).collect(Collectors.toList());}// 增強生成方法private String generateAugmentedResponse(String query, List<TextSegment> contexts) {// 構建增強提示詞String promptTemplate = """基于以下產品信息回答用戶問題:${contexts}用戶問題:${query}要求:1. 使用中文回答2. 如果信息不足請明確說明3. 保持專業性""";// 拼接上下文String contextStr = contexts.stream().map(TextSegment::text).collect(Collectors.joining("\n\n"));// 填充模板String finalPrompt = promptTemplate.replace("${contexts}", contextStr).replace("${query}", query);// 調用大模型生成return chatModel.generate(finalPrompt);}
}// 使用示例
public class RagDemo {public static void main(String[] args) {// 1. 初始化組件EmbeddingModel embeddingModel = new AllMiniLmL6V2EmbeddingModel();EmbeddingStore<TextSegment> embeddingStore = createProductEmbeddingStore();ChatLanguageModel chatModel = OpenAiChatModel.builder().apiKey("your_key").modelName("gpt-3.5-turbo").build();// 2. 創建RAG助手RagProductAssistant assistant = new RagProductAssistant(embeddingModel, embeddingStore, chatModel);// 3. 處理用戶查詢String question = "你們最新款手機支持多少倍光學變焦?";String answer = assistant.answerQuestion(question);System.out.println(answer);}// 初始化產品知識庫private static EmbeddingStore<TextSegment> createProductEmbeddingStore() {// 實際場景中連接Redis/Elasticsearch等向量數據庫InMemoryEmbeddingStore<TextSegment> store = new InMemoryEmbeddingStore<>();// 加載產品文檔(示例數據)List<String> productSpecs = Arrays.asList("型號X30 Pro: 支持100倍混合變焦,搭載潛望式鏡頭","型號X30: 支持30倍光學變焦,夜景拍攝增強");// 生成嵌入并存儲productSpecs.forEach(text -> {Embedding embedding = embeddingModel.embed(text).content();store.add(embedding, TextSegment.from(text));});return store;}
}

三、RAG vs 微調:技術選型指南

3.1 核心差異對比

維度RAG微調
知識更新實時動態需重新訓練
硬件需求CPU可運行需GPU資源
實施周期小時級部署周級準備
可解釋性檢索記錄可溯源黑盒決策

3.2 黃金選擇法則

  • 選擇RAG:知識頻繁更新、需要結果溯源、快速迭代場景
  • 選擇微調:專業術語理解、特殊任務適配、長期穩定場景

典型案例

  • 醫院病歷系統:微調+醫學知識庫RAG
  • 法律咨詢平臺:法條庫RAG+裁判文書微調

在這里插入圖片描述

本文來自互聯網用戶投稿,該文觀點僅代表作者本人,不代表本站立場。本站僅提供信息存儲空間服務,不擁有所有權,不承擔相關法律責任。
如若轉載,請注明出處:http://www.pswp.cn/bicheng/73184.shtml
繁體地址,請注明出處:http://hk.pswp.cn/bicheng/73184.shtml
英文地址,請注明出處:http://en.pswp.cn/bicheng/73184.shtml

如若內容造成侵權/違法違規/事實不符,請聯系多彩編程網進行投訴反饋email:809451989@qq.com,一經查實,立即刪除!

相關文章

探索現代 C++:新特性、工程實踐與熱點趨勢

目錄 一、現代 C 的關鍵特性與熱點關聯 二、精簡代碼示例解析 三、工程實踐中的應用思考 四、總結與展望 近幾年&#xff0c;人工智能、邊緣計算與跨語言開發成為技術熱點&#xff0c;而 C 作為高性能系統編程的主力軍&#xff0c;也在不斷進化。從 C11 到 C20&#xff0c;…

《HTML + CSS + JS 打造炫酷輪播圖詳解》

《HTML CSS JS 打造炫酷輪播圖詳解》 一、項目概述 本次項目旨在使用 HTML、CSS 和 JavaScript 實現一個具有基本功能的輪播圖&#xff0c;包括圖片自動輪播、上一張 / 下一張按鈕切換、小圓點指示與切換等功能&#xff0c;以提升網頁的交互性和視覺吸引力。 二、實現步驟…

257. 二叉樹的所有路徑(遞歸+回溯)

257. 二叉樹的所有路徑 力扣題目鏈接(opens new window) 給定一個二叉樹&#xff0c;返回所有從根節點到葉子節點的路徑。 說明: 葉子節點是指沒有子節點的節點。 示例: 思路&#xff1a;在葉子節點收割結果&#xff0c;如果不是葉子節點&#xff0c;則依次處理左右子樹&a…

【架構差異】SpringとSpringBoot:Bean機制的深入剖析與自動配置原理

目錄標題 SpringBoot框架中Bean機制的深入剖析與自動配置原理摘要1. 引言2. SpringBoot與Spring的架構差異2.1 從Spring到SpringBoot的演進2.2 SpringBoot中的Bean容器體系 3. SpringBoot的自動配置機制3.1 SpringBootApplication解析3.2 自動配置原理深度解析3.2.1 自動配置類…

CSDN博客:Markdown編輯語法教程總結教程(中)

?個人主頁&#xff1a;折枝寄北的博客 Markdown編輯語法教程總結 前言1. 列表1.1 無序列表1.2 有序列表1.3 待辦事項列表1.4 自定義列表 2. 圖片2.1 直接插入圖片2.2 插入帶尺寸的圖片2.3 插入寬度確定&#xff0c;高度等比例的圖片2.4 插入高度確定寬度等比例的圖片2.5 插入居…

ChebyKAN0、ChebyKAN1 網絡閱讀

目錄 ChebyKAN0 Chebyshev Polynomial-Based Kolmogorov-Arnold Networks: An Efficient Architecture for Nonlinear Function Approximation 參考文獻 文章內容 文章詳細結構 5. Experiments and Results 5.1 Digit Classification on MNIST 5.2 Function Approximat…

RK3588部署YOLOv8(2):OpenCV和RGA實現模型前處理對比

目錄 前言 1. 結果對比 1.1 時間對比 1.2 CPU和NPU占用對比 2. RGA實現YOLO前處理 2.1 實現思路 2.2 處理類的聲明 2.3 處理類的實現 總結 前言 RK平臺上有RGA (Raster Graphic Acceleration Unit) 加速&#xff0c;使用RGA可以減少資源占用、加速圖片處理速度。因此…

破局者登場:中國首款AI原生IDE Trae深度解析--開啟人機協同編程新紀元

摘要 字節跳動于2025年3月3日正式發布中國首款AI原生集成開發環境Trae國內版&#xff0c;以動態協作、全場景AI賦能及本土化適配為核心優勢。Trae內置Doubao-1.5-pro與DeepSeek R1/V3雙引擎&#xff0c;支持基于自然語言生成端到端代碼框架、實時上下文感知與智能Bug修復&…

【PyCharm】Python和PyCharm的相互關系和使用聯動介紹

李升偉 整理 Python 是一種廣泛使用的編程語言&#xff0c;而 PyCharm 是 JetBrains 開發的專門用于 Python 開發的集成開發環境&#xff08;IDE&#xff09;。以下是它們的相互關系和使用聯動的介紹&#xff1a; 1. Python 和 PyCharm 的關系 Python&#xff1a;一種解釋型、…

SNIPAR:快速實現親緣個體的基因型分離與推斷

SNIPAR&#xff1a;快速實現親緣個體的基因型分離與推斷 近日&#xff0c;英國劍橋大學研究團隊在Nature Genetics上發表了最新研究成果——SNIPAR&#xff08;SNP-based Inference of Pedigree relationship, Ancestry, and Recombination&#xff09;。這一強大的工具可以幫助…

3.11記錄

leetcode刷題&#xff1a; 1. 334. 遞增的三元子序列 - 力扣&#xff08;LeetCode&#xff09; 方法一&#xff1a;使用貪心算法求解 class Solution(object):def increasingTriplet(self, nums):first nums[0]second float(inf)for i in nums:if i>second:return Truee…

阿里云操作系統控制臺評測:國產AI+運維 一站式運維管理平臺

阿里云操作系統控制臺評測&#xff1a;國產AI運維 一站式運維管理平臺 引言 隨著云計算技術的飛速發展&#xff0c;企業在云端的運維管理面臨更高的要求。阿里云操作系統控制臺作為一款集運維管理、智能助手和系統診斷等多功能于一體的工具&#xff0c;正逐步成為企業高效管理…

大語言模型學習--向量數據庫Milvus實踐

Milvus是目前比較流行的開源向量數據庫&#xff0c;其官網地址 Milvus 是什么&#xff1f; | Milvus 文檔 1.Milvus簡介 Milvus 是一種高性能、高擴展性的向量數據庫。Milvus 提供強大的數據建模功能&#xff0c;能夠將非結構化或多模式數據組織成結構化的 Collections。它支…

DeepSeek Kimi詳細生成PPT的步驟

以下是使用 DeepSeek 和 Kimi 協作生成 PPT 的詳細步驟&#xff0c;結合了兩者的優勢實現高效創作&#xff1a; 第一步&#xff1a;使用 DeepSeek 生成 PPT 大綱或內容 明確需求并輸入提示詞 在 DeepSeek 的對話界面中&#xff0c;輸入具體指令&#xff0c;要求生成 PPT 大綱或…

Visual Studio 安裝及使用教程(Windows)【安裝】

文章目錄 一、 Visual Studio 下載1. 官網下載2. 其它渠道 二、Visual Studio 安裝三、Visual Studio 使用四、Visual Studio 其它設置1. 桌面快捷方式2. 更改主題、字體大小 軟件 / 環境安裝及配置目錄 一、 Visual Studio 下載 1. 官網下載 安裝地址&#xff1a;https://vi…

Java多線程與高并發專題——阻塞和非阻塞隊列的并發安全原理是什么?

引入 之前我們探究了常見的阻塞隊列的特點&#xff0c;在本文我們就以 ArrayBlockingQueue 為例&#xff0c;首先分析 BlockingQueue &#xff0c;也就是阻塞隊列的線程安全原理&#xff0c;然后再看看它的兄弟——非阻塞隊列的并發安全原理。 ArrayBlockingQueue 源碼分析 …

關于ngx-datatable no data empty message自定義模板解決方案

背景&#xff1a;由于ngx-dataable插件默認沒有數據時顯示的文案是no data to display&#xff0c;且沒有任何樣式。這里希望通過自定義模板來實現。但目前github中有一個案例是通過設置代碼&#xff1a; https://swimlane.github.io/ngx-datatable/empty** <ngx-datatable…

Matlab 雙線性插值(二維)

文章目錄 一、簡介二、實現代碼三、實現效果參考資料一、簡介 雙線性插值是一種 二維插值方法,用于計算 柵格(Grid) 或 像素點 之間的插值值。它主要用于 圖像縮放、旋轉、變換 等操作,以在新像素位置估算灰度值或顏色值。 如上圖所示,假設存在一個二維離散函數(如圖像)…

coding ability 展開第二幕(雙指針——鞏固篇)超詳細!!!!

文章目錄 前言有效的三角形個數思路 查找總價格為目標值的兩個商品思路 兩數之和思路 三數之和思路 四數之和思路 總結 前言 本專欄的上篇&#xff0c;講述了雙指針的一些基礎的算法習題 今天我們來學習更進一步的雙指針用法吧 其實也是大相徑庭&#xff0c;和前面的差不多&…

L1-056 猜數字

L1-056 猜數字 - 團體程序設計天梯賽-練習集 (pintia.cn) 題解 這道題要求&#xff1a;一群人坐在一起&#xff0c;每人猜一個 100 以內的數&#xff0c;誰的數字最接近大家平均數的一半就贏。現在需要編寫程序來計算&#xff0c;其中需要存入玩家的名字&#xff08;字符串&a…