RAG優化

RAG優化

news/2025/7/15 23:37:58/文章來源:https://blog.csdn.net/hzp666/article/details/149267162

RAG搭建本地AI知識庫，在使用過程中遇到的三大痛點，以及相應的進階方案。

1. RAG知識庫的三大痛點

--?

內容理解不足：

AI難以全面理解導入資料的內容，比如在向量編碼時候，生硬的截斷等導致分析結果不理想。

eg: 知識庫分割器造成截斷。

信息提取不準確：

AI在提取關鍵信息時可能存在偏差，RAG靠輸入的檢索字符的向量編碼，和知識庫中的向量編碼對比，影響最終結論的準確性。

綜合分析能力有限：

AI無法像人類一樣進行復雜的邏輯推理和綜合分析，導致結論缺乏深度。

比如：一個excel文檔，有300條數據，因為rag切分之后，無法求出整個文檔的最大或最小值

2. 進階方案

引入重排序模型：

通過優化內容的排序邏輯，提高信息提取的準確性。

使用數據庫MCP Server：

利用MCP（Model Context Protocol）技術，增強AI知識庫的存儲和處理能力。

比如：使用postgre mcp server，連接數據庫，進行數據的分析。

借助超大上下文模型：

通過擴展模型的上下文能力，提升AI對復雜內容的理解與分析能力。

現在大模型的發展，prompt 長度越來越長，可以直接把整個文檔或者資料庫，投給大模型。

5. 實用工具和資源

CherryStudio下載：用戶可以通過Cherry-ai.com下載CherryStudio。
硅基流動：訪問硅基流動獲取更多模型資源。
PostGreSQL MCP：通過GitHub上的PostGreSQL MCP了解更多MCP相關技術。

本文來自互聯網用戶投稿，該文觀點僅代表作者本人，不代表本站立場。本站僅提供信息存儲空間服務，不擁有所有權，不承擔相關法律責任。
如若轉載，請注明出處：http://www.pswp.cn/news/914510.shtml
繁體地址，請注明出處：http://hk.pswp.cn/news/914510.shtml
英文地址，請注明出處：http://en.pswp.cn/news/914510.shtml

如若內容造成侵權/違法違規/事實不符，請聯系多彩編程網進行投訴反饋email:809451989@qq.com，一經查實，立即刪除！

相關文章

Ubuntu 24.04 啟用 root 圖形登錄

Ubuntu 24.04 啟用 root 圖形登錄

關鍵詞：Ubuntu 24.04、root 登錄、GDM、SSH、nano、配置文件一、前言 Ubuntu 默認禁用 root 賬戶的圖形與 SSH 登錄，這是為了安全。但在某些場景（如測試、救援、自動化腳本）你可能需要直接用 root 登錄 GNOME 桌面。本文以 Ubun…

閱讀更多...

Jekyll + Chirpy + GitHub Pages 搭建博客

Jekyll + Chirpy + GitHub Pages 搭建博客

Chirpy 是適用于技術寫作的簡約、響應迅速且功能豐富的 Jekyll 主題，文檔地址：https://chirpy.cotes.page/ ，Github 地址：jekyll-theme-chirpy 。 1.開始打開 chirpy-starter 倉庫，點擊按鈕 Use this template -->…

閱讀更多...

學習 Flutter (一)

學習 Flutter (一)

學習 Flutter (一) 1. 引言什么是 Flutter？ Flutter 是 Google 開發的一套開源 UI 框架，主要用于構建高性能、高保真、跨平臺的應用程序。使用一套 Dart 編寫的代碼，開發者可以同時構建適用于： Android iOS Web Windows、mac…

閱讀更多...

Spring Boot 實現圖片防盜鏈：Referer 校驗與 Token 簽名校驗完整指南

Spring Boot 實現圖片防盜鏈：Referer 校驗與 Token 簽名校驗完整指南

Spring Boot 實現圖片防盜鏈教程（Referer 校驗 Token 簽名校驗）本文將詳細講解兩種防盜鏈實現方案，并提供完整代碼示例。方案一：Referer 校驗通過檢查 HTTP 請求頭中的 Referer 字段判斷來源是否合法。實現步驟創建 Referer 攔截…

閱讀更多...

從 JSON 到 Python 對象：一次通透的序列化與反序列化之旅

從 JSON 到 Python 對象：一次通透的序列化與反序列化之旅

目錄一、為什么要談 JSON 二、最快速上手：兩把鑰匙 dumps 與 loads 三、深入 dumps：參數是魔法棒四、深入 loads：把風險擋在門外五、文件級序列化：dump 與 load 六、處理中文與編碼陷阱七、異常場景與調試技巧八、實…

閱讀更多...

Leetcode 3315. 構造最小位運算數組 II

Leetcode 3315. 構造最小位運算數組 II

1.題目基本信息 1.1.題目描述給你一個長度為 n 的質數數組 nums 。你的任務是返回一個長度為 n 的數組 ans ，對于每個下標 i ，以下條件均成立： ans[i] OR (ans[i] 1) nums[i] 除此以外，你需要最小化結果數組里每一個 a…

閱讀更多...

黑搜小知識 | DNS域名解析過程是什么樣的？

黑搜小知識 | DNS域名解析過程是什么樣的？

什么是DNS？DNS( Domain Name System)是“域名系統”的英文縮寫，是一種組織成域層次結構的計算機和網絡服務命名系統，它用于TCP/IP網絡，它所提供的服務是用來將主機名和域名轉換為IP地址的工作。舉例來說，如果你要訪問域…

閱讀更多...

MyBatis 使用教程及插件開發

MyBatis 使用教程及插件開發

作者：小凱沉淀、分享、成長，讓自己和他人都能有所收獲！ 本文的宗旨在于通過簡單干凈實踐的方式教會讀者，使用 SpringBoot 配置 MyBatis 并完成對插入、批量插入、修改、查詢以及注解事務和編程事務的使用，通過擴展插件…

閱讀更多...

Maui勸退：用windows直接真機調試iOS，無須和Mac配對

Maui勸退：用windows直接真機調試iOS，無須和Mac配對

初級代碼游戲的專欄介紹與文章目錄-CSDN博客我的github：codetoys，所有代碼都將會位于ctfc庫中。已經放入庫中我會指出在庫中的位置。這些代碼大部分以Linux為目標但部分代碼是純C的，可以在任何平臺上使用。源碼指引：github源…

閱讀更多...

【極客日常】后端任務動態注入執行策略的一種技術實現

【極客日常】后端任務動態注入執行策略的一種技術實現

近期做項目時遇到一個場景，是需要在后端任務執行時動態注入策略。具體而言，筆者負責的后端服務，可以理解是會在線上服務發布時，對服務風險做實時掃描，那么這個掃描就需要根據當前線上服務發布上下文，匹配對…

閱讀更多...

8. JVM類裝載的執行過程

8. JVM類裝載的執行過程

1. JVM介紹和運行流程-CSDN博客 2. 什么是程序計數器-CSDN博客 3. java 堆和 JVM 內存結構-CSDN博客 4. 虛擬機棧-CSDN博客 5. JVM 的方法區-CSDN博客 6. JVM直接內存-CSDN博客 7. JVM類加載器與雙親委派模型-CSDN博客 8. JVM類裝載的執行過程-CSDN博客 9. JVM垃圾回收…

閱讀更多...

Linux操作系統之信號：信號的產生

Linux操作系統之信號：信號的產生

前言：上篇文章我們大致講解了信號的有關概念，為大家引入了信號的知識點。但光知道那些是遠遠不夠的。本篇文章，我將會為大家自己的講解一下信號的產生的五種方式，希望對大家有所幫助。一、鍵盤（硬件）產生信…

閱讀更多...

pdf拆分

pdf拆分

文章目錄背景目標實現下載背景好不容易下載的1000頁行業報告，領導非要按章節拆分成20份！學術論文合集需要按作者拆分投稿，手動分頁到懷疑人生…客戶發來加密合同，要求每5頁生成獨立文檔，格式還不能亂！ …

閱讀更多...

vue3使用mermaid生成圖表，并可編輯

vue3使用mermaid生成圖表，并可編輯

效果圖實際代碼<template><div class"mermaid-container" style"z-index: 99999" ref"wrapperRef"><div class"control-bar"><div class"control-bar-flex control-bar-tab-wrap"…

閱讀更多...

tcp/quic 的滑動窗口

tcp/quic 的滑動窗口

一、滑動窗口 rwnd： 接收端窗口，接收方在每次發送ACK確認報文時，會包含一個 rwnd (Receive Window Size) 字段，指明自己當前剩余的接收緩沖區大小（即可用窗口），這里是否是socket的接收緩沖區&am…

閱讀更多...

JVM監控及診斷工具-命令行篇

JVM監控及診斷工具-命令行篇

18.1. 概述性能診斷是軟件工程師在日常工作中需要經常面對和解決的問題，在用戶體驗至上的今天，解決好應用的性能問題能帶來非常大的收益。 Java 作為最流行的編程語言之一，其應用性能診斷一直受到業界廣泛關注。可能造成 Java 應用出現性能…

閱讀更多...

Jenkins 版本升級與插件問題深度復盤：從 2.443 到 2.504.3 及功能恢復全解析

Jenkins 版本升級與插件問題深度復盤：從 2.443 到 2.504.3 及功能恢復全解析

前言：問題溯源與升級必要性在 Jenkins 持續集成體系中，插件生態是其強大功能的核心驅動力。然而，某次例行維護中，團隊對 Jenkins 2.443 環境的插件進行批量升級后，意外觸發連鎖反應 ： SSH Server 插件功能…

閱讀更多...

Ribbon實戰

Ribbon實戰

一、前置知識 1.1 負載均衡定義負載均衡指的是將網絡請求通過不同的算法分配到不同的服務器上的技術，從而提升系統的性能。 1.2 負載均衡工具負載均衡工具可以分分為客戶端負載均衡工具和服務端負載均衡工具，它們的區別如下。表1-1 負載均衡工具…

閱讀更多...

cs285學習筆記（一）：課程總覽

cs285學習筆記（一）：課程總覽

根據 Fall 2023 學期的官方課程日程，這里是 CS?285 全課程的 Lecture 大綱及內容摘要，詳細對應周次和主題，方便你快速定位每節課要點、相關作業與視頻資源 🎯 官方課程地址 YouTobe 視頻地址 blibli視頻(帶中文字幕) &#x…

閱讀更多...

OkHttp SSE 完整總結（最終版）

OkHttp SSE 完整總結（最終版）

1. SSE 基礎概念什么是 SSE？ SSE（Server-Sent Events）是一種 Web 標準，允許服務器向客戶端推送實時數據。核心特點單向通信：服務器 → 客戶端基于 HTTP 協議：使用 GET 請求長連接：連…

閱讀更多...

最新文章