AI_RAG

AI_RAG

pingmian/2025/8/10 9:14:59/文章來源:https://blog.csdn.net/qq_50655286/article/details/150006952

一.為什么需要RAG（AI幻覺）

大模型LLM在某些情況下給出的回答很可能錯誤的，涉及虛構甚至是故意欺騙的信息。

二.什么是RAG

RAG是一種結合“信息檢索”和“文本生成”的技術，旨在提升生成式AI模型的準確性和可靠性。它通過以下兩個核心步驟工作：

1.?信息檢索（Retrieval）

當收到用戶提問時，RAG首先從外部知識庫（如數據庫、文檔或網頁）中檢索與問題相關的信息片段，而不是僅依賴模型訓練時學到的知識。

2..文本生成（Generation）

將檢索到的相關信息和用戶問題一起輸入生成模型，生成更精準、基于事實的答案。

三.RAG的分塊策略

?按照字符數來切分

?按固定字符數結合overlapping window

?按照句子來切分

?遞歸方法 RecursiveCharacterTextSplitter

四.RAG向量和向量檢索

1.Embeddings向量化

（1）向量檢索

????????根據用戶的輸入，與向量數據庫中存放的文本向量進行相似度計算匹配，并檢索返回最為相似的內容

（2）數據內容轉為向量（目前的向量模型可實現）

2.本地大模型

????????Ollama向量模型本地部署：官方網址：https://ollama.com/

3.向量間的相似度計算

常用的向量相似度計算方法包括：

????????-余弦相似度Cosine：基于兩個向量夾角的余弦值來衡量相似度。

????????-歐式距離L2：通過計算向量之間的歐幾里得距離來衡量相似度。

????????-點積：計算兩個向量的點積，適合歸一化后的向量

4.“top-k”語義檢索

????????在根據向量相似度檢索向量時，能夠找出的相似向量一般是多個，如果我們不需要這么多或者要控制相似度的大小，top-k 語義檢索就派上了用場。

五.向量數據庫

本文來自互聯網用戶投稿，該文觀點僅代表作者本人，不代表本站立場。本站僅提供信息存儲空間服務，不擁有所有權，不承擔相關法律責任。
如若轉載，請注明出處：http://www.pswp.cn/pingmian/92392.shtml
繁體地址，請注明出處：http://hk.pswp.cn/pingmian/92392.shtml
英文地址，請注明出處：http://en.pswp.cn/pingmian/92392.shtml

如若內容造成侵權/違法違規/事實不符，請聯系多彩編程網進行投訴反饋email:809451989@qq.com，一經查實，立即刪除！

相關文章

LeetCode111~130題解

LeetCode111~130題解

LeetCode111.二叉樹的最小深度： 題目描述： 給定一個二叉樹，找出其最小深度。最小深度是從根節點到最近葉子節點的最短路徑上的節點數量。說明：葉子節點是指沒有子節點的節點。示例 1： 輸入：root …

閱讀更多...

n8n飛書webhook配置（飛書機器人、飛書bot、feishu bot）Crypto節點、js timestamp代碼、Crypto node

n8n飛書webhook配置（飛書機器人、飛書bot、feishu bot）Crypto節點、js timestamp代碼、Crypto node

自定義機器人使用指南利用 n8n 打造飛書 RSS 推送機器人文章目錄自定義機器人使用指南注意事項功能介紹在群組中添加自定義機器人操作步驟邀請自定義機器人進群。- 進入目標群組，在群組右上角點擊更多按鈕，并點擊設置。- 在右側設置界面&#xff0…

閱讀更多...

nhdeep檔案管理工具軟件官網

nhdeep檔案管理工具軟件官網

歡迎訪問nhdeep官網： www.nhdeep.com NHDEEP提供一系列專業的單機版檔案管理工具，滿足不同場景下的檔案管理需求，無需網絡連接，數據安全可靠。所有工具均提供免費試用版下載。檔案綜合管理系統單機版:全面的檔案管理解決方案&a…

閱讀更多...

RocketMQ節點部署計算方案

RocketMQ節點部署計算方案

節點計算公式業務場景預期峰值TPS：200,000 單組容量：40K TPS 容災要求：同城雙機房 nameServer節點數max(3, (15/50) 1) max(3, 0.3 1) max(3, 1.3) 3 Broker節點數ceil(200,000 / 40,000) 5組總節點數 NameServer節點Broker組數(Mas…

閱讀更多...

MyBatis聯合查詢 - XML篇

MyBatis聯合查詢 - XML篇

文章目錄數據庫設計MyBatis 配置MyBatis 映射文件Mapper 接口總結數據庫設計建表 SQL CREATE TABLE user (id INT PRIMARY KEY AUTO_INCREMENT,name VARCHAR(50) NOT NULL );CREATE TABLE order (id INT PRIMARY KEY AUTO_INCREMENT,user_id INT NOT NULL,order_no VARCHAR(…

閱讀更多...

Kubelet 探針如何選擇 IP：status.PodIP 溯源與“同 Pod 兩個 IP“現象解析

Kubelet 探針如何選擇 IP：status.PodIP 溯源與“同 Pod 兩個 IP“現象解析

背景與現象同一個 Pod 的 readiness 和 liveness 探針日志顯示連接的 IP 不一致（例如 10.10.6.10:9999 與 10.10.6.32:9999）。本文從 kubelet 源碼入手，解釋探針目標 IP 的來源、為何會出現兩個不同 IP，并給出建議與驗證方法。在如…

閱讀更多...

Arm Development Studio 安全通告：CVE-2025-7427

Arm Development Studio 安全通告：CVE-2025-7427

安全之安全(security)博客目錄導讀目錄一、概述二、CVE 詳情三、受影響產品四、建議五、致謝六、版本歷史一、概述 ARM已知悉一個影響 Arm Development Studio 的安全漏洞，該漏洞可能允許攻擊者執行 DLL 劫持攻擊（DLL hijacking attack&…

閱讀更多...

C#異步編程雙利器：異步Lambda與BackgroundWorker實戰解析

C#異步編程雙利器：異步Lambda與BackgroundWorker實戰解析

**摘要：**深入剖析兩種異步編程范式，解決GUI線程阻塞難題一、異步Lambda表達式：事件處理的輕量化利器核心價值：簡化事件響應中的異步操作，避免UI線程阻塞 ? 典型應用場景（WPF示例）&#xff1…

閱讀更多...

yolo world (1): 論文解讀

yolo world (1): 論文解讀

YOLO 系列檢測器以其高效性和實用性而聞名。然而，它們依賴于預定義和訓練的目標類別，這限制了其在開放場景中的適用性。為了解決這一限制，我們提出了 YOLO-World，這是一種創新的方法，通過視覺-語言建模和大規模數據集預訓練，增強了 YOLO 的開放詞匯檢測能力。具體來說，我…

閱讀更多...

【JVM】深入解析Java虛擬機

【JVM】深入解析Java虛擬機

目錄 1. 區分JDK，JRE 和 JVM 1.1 JVM 1.2 JRE 1.3 JDK 1.4 關系總結 2. 跨平臺性 3. JVM中的內存劃分 4. JVM的類加載機制 5. 雙親委派模型 6. 垃圾回收機制（GC） 6.1 識別垃圾 6.1.1 單個引用 6.1.2 多個引用 6.2 釋放垃圾 6.…

閱讀更多...

98-基于Python的網上廚房美食推薦系統

98-基于Python的網上廚房美食推薦系統

基于Python的網上廚房美食推薦系統 - 技術分享博客 📋 目錄項目概述技術棧系統架構核心功能實現數據庫設計推薦算法數據可視化部署與優化項目特色總結與展望 🎯 項目概述項目背景隨著生活節奏的加快，越來越多的人開始關注美食制作&…

閱讀更多...

創建MyBatis-Plus版的后端查詢項目

創建MyBatis-Plus版的后端查詢項目

記得編碼和maven庫的檢測！！！ 1、maven庫導入包<dependency><groupId>org.springframework.boot</groupId><artifactId>spring-boot-starter-web</artifactId></dependency><dependency><groupI…

閱讀更多...

開發板RK3568和stm32的異同：

開發板RK3568和stm32的異同：

RK3568 和 STM32 是兩類不同定位的處理器 / 微控制器，在架構、性能、應用場景等方面差異顯著，但也存在部分共性。以下從核心特性、異同點及典型場景進行對比：一、核心差異維度RK3568（瑞芯微）STM32（意法半導…

閱讀更多...

C# 使用iText獲取PDF的trailer數據

C# 使用iText獲取PDF的trailer數據

文章目錄C# 使用iText獲取PDF的trailer數據iText 核心概念C# 代碼示例步驟 1: 確保已安裝 iText步驟 2: C# 代碼程序運行效果解讀 Trailer 的輸出總結C# 使用iText獲取PDF的trailer數據開發程序debug的時候，看到了PDF有個trailer數據，挺有意思&#xf…

閱讀更多...

京東流量資產基于湖倉架構的落地實踐

京東流量資產基于湖倉架構的落地實踐

在當今數字化商業浪潮中，數據無疑是企業的核心資產，而流量數據更是電商巨頭京東業務運轉的關鍵驅動力。它廣泛應用于搜索推薦、廣告投放等多個核心業務場景，直接影響著用戶體驗和商業效益。但隨著業務規模的不斷膨脹，傳統架構在處…

閱讀更多...

???????【Datawhale AI夏令營】多模態RAG財報問答挑戰賽：學習筆記與上分思考

???????【Datawhale AI夏令營】多模態RAG財報問答挑戰賽：學習筆記與上分思考

一、初識賽題——從迷茫到清晰剛看到賽題時，坦白說有些不知所措。“多模態”、“RAG”、“圖文混排PDF”，這些詞匯組合在一起，聽起來就像一個龐大而復雜的工程。但當我強迫自己靜下心來，從“終點”（提交格式和評審規則…

閱讀更多...

數據挖掘2.6 Perceptron Modeling 感知器建模

數據挖掘2.6 Perceptron Modeling 感知器建模

Perceptron Modeling 感知器建模Linear Discriminants 線性判別式Loss Function 損失函數misclassification 誤分類0-1 Loss/Error function 0-1損失函數Hinge Loss Function 鉸鏈損失函數Optimization 優化算法Linear Discriminants 線性判別式線性判別式公式 f(x;w)w1x(1)w…

閱讀更多...

使用qemu運行與GDB調試內核

使用qemu運行與GDB調試內核

目錄一、前期準備二、內核編譯三、QEMU與GDB 1、QEMU調試參數 2、gdb vmlinux 一、前期準備內核鏡像：bzimage gdb：x86_64 QEMU：qemu-system-x86_64 前置知識： （1）內核編譯 （2&#x…

閱讀更多...

歐盟 Radio Equipment Directive (RED)

歐盟 Radio Equipment Directive (RED)

歐盟 Radio Equipment Directive (RED) ——從 2014/53/EU 原文到 2025-08-01 強制生效的網絡安全新規，一次看懂全部關鍵點。1. 法規身份與適用范圍要素內容指令全稱Directive 2014/53/EU on radio equipment取代指令1999/5/EC (R&TTE)適用產品所有“有意發射/接…

閱讀更多...

【FastExcel】解決ReadSheet在Map中獲取對象不準確問題(已提交PR并合并到開源社區)

【FastExcel】解決ReadSheet在Map中獲取對象不準確問題(已提交PR并合并到開源社區)

解決問題：源碼ReadSheet在同一個Map中獲取對象不準確問題 PR：Fixed the issue where different ReadSheet objects could not get the correct value when comparing them. 一：問題場景 ReadSheet在同一個Map中獲取對象不準確(如Map<…

閱讀更多...

最新文章