大模型筆記：RAG（Retrieval Augmented Generation,檢索增強生成）

大模型筆記：RAG（Retrieval Augmented Generation,檢索增強生成）

news/2025/6/23 2:34:41/文章來源:https://blog.csdn.net/qq_40206371/article/details/136453553

1 大模型知識更新的困境

大模型的知識更新是很困難的，主要原因在于：
- 訓練數據集固定,一旦訓練完成就很難再通過繼續訓練來更新其知識
- 參數量巨大,隨時進行fine-tuning需要消耗大量的資源，并且需要相當長的時間
- LLM的知識是編碼在數百億個參數中的,無法直接查詢或編輯其中的知識圖譜
——>LLM的知識具有靜態、封閉和有限的特點。
——>為了賦予LLM持續學習和獲取新知識的能力,RAG應運而生

2 RAG介紹

將大規模語言模型(LLM)與來自外部知識源的檢索相結合,以改進大模型的問答能力
核心手段是利用外掛于LLM的知識數據庫（通常使用向量數據庫）存儲未在訓練數據集中出現的新數據、領域數據等

2.1 RAG 三階段

RAG將知識問答分成三個階段：
- 索引
  - 事先將文本數據進行處理,通過詞嵌入等向量化技術,將文本映射到低維向量空間,并將向量存儲到數據庫中,構建起可檢索的向量索引
- 知識檢索
  - 當輸入一個問題時,RAG會對知識庫進行檢索,找到與問題最相關的一批文檔
- 生成答案
  - RAG會把輸入問題及相應的檢索結果文檔一起提供給LLM,讓LLM充分把這些外部知識融入上下文,并生成相應的答案。
  - RAG控制生成長度,避免生成無關內容

3 RAG特點

3.1 優點

可以利用大規模外部知識改進LLM的推理能力和事實性
第一階段的知識索引可以隨時新增數據，延遲非常低，可以忽略不計。
- 因此RAG架構理論上能做到知識的實時更新
可解釋性強，RAG可以通過提示工程等技術，使得LLM生成的答案具有更強的可解釋性，從而提高了用戶對于答案的信任度和滿意度

3.2 缺點

知識檢索階段（第二階段）依賴相似度檢索技術，并不是精確檢索，因此有可能出現檢索到的文檔與問題不太相關
在第三階段生產答案時，由于LLM基于檢索出來的知識進行總結，從而導致無法應對用戶詢問知識庫之外的問題
外部知識庫的更新和同步，需要投入大量的人力、物力和時間
需要額外的檢索組件，增加了架構的復雜度和維護成本

4 RAG可以解決的問題

模型幻覺問題
- LLM文本生成的底層原理是基于概率進行生成的，在沒有已知事實作為支撐的情況下，不可避免的會出現一本正經的胡說八道的情況
時效性問題
- 具有一定時效性的數據就可能無法及時參與訓練，造成模型無法直接回答與時效性相關的問題
數據安全問題
- 開源的LLM是沒有企業內部數據和用戶數據的，如果企業想在保證數據安全的前提下使用LLM，一種比較好的解決辦法就是把數據放在本地
- 企業數據的業務計算全部放在本地完成,在線的LLM只是完成一個歸納總結的作用

參考內容：RAG從入門到精通-RAG簡介 – Ace Consider

大模型LLM的主流應用RAG技術 - 知乎 (zhihu.com)

本文來自互聯網用戶投稿，該文觀點僅代表作者本人，不代表本站立場。本站僅提供信息存儲空間服務，不擁有所有權，不承擔相關法律責任。
如若轉載，請注明出處：http://www.pswp.cn/news/719296.shtml
繁體地址，請注明出處：http://hk.pswp.cn/news/719296.shtml
英文地址，請注明出處：http://en.pswp.cn/news/719296.shtml

如若內容造成侵權/違法違規/事實不符，請聯系多彩編程網進行投訴反饋email:809451989@qq.com，一經查實，立即刪除！

相關文章

格式規范性知識的探究式學習

格式規范性知識的探究式學習

對于格式規范性這種規定性的知識，可以采用“增刪改”的方式進行控究式學習。 #include<stdio.h>int main(){printf("%.1f\n", 8.0/5.0);return 0;} 這個printf語句分兩部分，本身的功能就是格式化輸出，因此參數完全是格式化…

閱讀更多...

一些C語言知識

一些C語言知識

C語言的內置類型： char short int long float double C99中引入了bool類型，用來表示真假的變量類型，包含true，false。這個代碼的執行結果是什么？好好想想哦，坑挺多的。 #include <stdio.h>int mai…

閱讀更多...

STM32(5) GPIO(2）輸出

STM32(5) GPIO(2）輸出

1.點亮LED 1.1 推挽接法和開漏接法要想點亮LED，有兩種接法推挽接法： 向寄存器寫1，引腳輸出高電平，LED點亮；向寄存器寫0，引腳輸出低電平，LED熄滅。開漏接法： 向寄存器寫0&…

閱讀更多...

Kubernetes operator 前置知識篇

Kubernetes operator 前置知識篇

云原生學習路線導航頁（持續更新中） 本文是 Kubernetes operator學習系列的前置知識篇，幫助大家對 Operator 進行初步了解Kubernetes operator學習系列快捷鏈接 Kubernetes operator 前置知識篇Kubernetes operator（一&#xff0…

閱讀更多...

《精益DevOps》：填補IT服務交付的認知差距，實現高效可靠的客戶期望滿足

《精益DevOps》：填補IT服務交付的認知差距，實現高效可靠的客戶期望滿足

寫在前面在當今的商業環境中，IT服務交付已經成為企業成功的關鍵因素之一。然而，實現高效、可靠、安全且符合客戶期望的IT服務交付卻是一項艱巨的任務。這要求服務提供商不僅具備先進的技術能力，還需要擁有出色的組織協作、流程管理和態勢感…

閱讀更多...

UniApp項目處理小程序分包

UniApp項目處理小程序分包

目前 uniApp也成為一種 App端開發的大趨勢因為在目前跨端 uniApp可以說相當優秀可以同時兼容 H5 PC 小程序 APP 的技術目前市場屈指可數那么說到微信小程序自然就要處理分包因為微信小程序對應用大小限制非常銘感限制在2MB 超過之后就會無法真機調試與打包不過需要注…

閱讀更多...

快速排序C語言代碼實現（2）

快速排序C語言代碼實現（2）

#include<stdio.h> void quick_sort(int arr[], int left, int right) {if (left < right) {int i left, j right, pivot arr[i];while (i < j) {while (i<j&&arr[j]>pivot) {//此時判斷使用i<j的目的是為了最終的目標位置是ij時的位置j--;}if…

閱讀更多...

vue項目中使用antvX6新手教程，附demo案例講解（可拖拽流程圖、網絡拓撲圖）

vue項目中使用antvX6新手教程，附demo案例講解（可拖拽流程圖、網絡拓撲圖）

前言： 之前分別做了vue2和vue3項目里的網絡拓撲圖功能，發現對antv X6的講解博客比較少，最近終于得閑碼一篇了！ 需求： 用戶可以自己拖拽節點，節點之間可以隨意連線，保存拓撲圖數據后傳給后端&…

閱讀更多...

cPanel面板安裝付費的SSL證書

cPanel面板安裝付費的SSL證書

前不久遇到購買Hostease服務器的客戶反饋需要安裝SSL證書。因為安裝 SSL 證書不僅可以保護用戶數據安全，增加用戶信任度，提升搜索引擎排名，還有助于符合法規和標準，防止網絡攻擊。安裝SSL證書可以通過如下步驟: 1. 選擇 SSL 證書…

閱讀更多...

數學建模【多元線性回歸模型】

數學建模【多元線性回歸模型】

一、多元線性回歸模型簡介回歸分析是數據分析中最基礎也是最重要的分析工具，絕大多數的數據分析問題，都可以使用回歸的思想來解決。回歸分析的任務就是，通過研究自變量X和因變量Y的相關關系，嘗試去解釋Y的形成機制，進…

閱讀更多...

Linux配置網卡功能

Linux配置網卡功能

提示:工具下載鏈接在文章最后目錄一.network功能介紹二.配置network功能2.1 network_ip配置檢查 2.2 network_br配置2.2.1 配置的網橋原先不存在檢查2.2.2 配置的網橋已存在-修改網橋IP檢查2.2.3 配置的網橋已存在-只添加網卡到網橋里檢查 2.3 network_bond配置檢查 2.4 netw…

閱讀更多...

Access AR Foundation 5.1 in Unity 2022

Access AR Foundation 5.1 in Unity 2022

如果已經下載安裝了ARF但版本是5.0.7 可以通過下面的方式修改修改后面的數字會自動更新更新完成后查看版本官方文檔 Access AR Foundation 5.1 in Unity 2021 | AR Foundation | 5.1.2

閱讀更多...

【知識整理】Git 使用實踐問題整理

【知識整理】Git 使用實踐問題整理

問題1、fatal: refusing to merge unrelated histories 一、Git 的報錯 fatal: refusing to merge unrelated histories 新建了一個倉庫之后，把本地倉庫進行關聯提交、拉取的時候，出現了如下錯誤： fatal: master does not appear to be a g…

閱讀更多...

js原型原型鏈

js原型原型鏈

js原型原型鏈在 JavaScript 中，每個對象都有一個原型（prototype）。對象的原型是另一個對象的引用，它包含對象的共享屬性和方法。JavaScript 中的原型鏈則是對象之間通過原型鏈接起來的一種機制，用于實現繼承和屬性查找…

閱讀更多...

電腦無法開啟虛擬化

電腦無法開啟虛擬化

vm開啟虛擬化失敗如果出現以下錯誤，需要進入bios界面，不同電腦進入界面的方式不一樣。這里以hp為例： 1、關機后，按住開機鍵和f10，進入如下界面（語言在主菜單里面） 2、選擇先進和下面的系統選…

閱讀更多...

c語言游戲實戰（10）：坤坤的籃球回避秀

c語言游戲實戰（10）：坤坤的籃球回避秀

前言： 這款簡易版的球球大作戰是博主耗時兩天半完成的，玩家需要控制坤坤在游戲界面上移動，來躲避游戲界面上方不斷掉下來的籃球。本游戲使用C語言和easyx圖形庫編寫，旨在幫助初學者了解游戲開發的基本概念和技巧。在開始編寫代…

閱讀更多...

Vue使用高德地圖定位到當前位置，并顯示天氣信息

Vue使用高德地圖定位到當前位置，并顯示天氣信息

首先得去高德控制臺申請兩個 key，一個天氣key和一個定位key 獲取天氣信息的函數： const getWeather function (city) {// 使用 fetch 發送請求獲取天氣信息fetch(https://restapi.amap.com/v3/weather/weatherInfo?city${city}&keyeefd36557b0250…

閱讀更多...

哪個有名的工具可以安全記事私密記事本筆記推薦

哪個有名的工具可以安全記事私密記事本筆記推薦

在這個數字化的時代，我們的生活已經離不開各種記事工具。它們幫助我們記錄生活中的點點滴滴，無論是工作上的重要事項，還是個人的私密心情。然而，當我在尋找一個能夠安心記錄私密事情的工具時，安全性成為了我最關心的因…

閱讀更多...

C++從零開始的打怪升級之路(day42)

C++從零開始的打怪升級之路(day42)

這是關于一個普通雙非本科大一學生的C的學習記錄貼在此前，我學了一點點C語言還有簡單的數據結構，如果有小伙伴想和我一起學習的，可以私信我交流分享學習資料那么開啟正題今天分享的是關于繼承的知識點 1.菱形繼承我們有許多關于繼承…

閱讀更多...

【軟件測試】Postman中變量的使用

【軟件測試】Postman中變量的使用

Postman中可設置的變量類型有全局變量，環境變量，集合變量，數據變量及局部變量。區別則是各變量作用域不同，全局變量適用于所有集合，環境變量適用于當前所選環境（所有集合中均可使用不同環境變量&#xff09…

閱讀更多...

最新文章