RAG檢索系統的兩大核心利器——Embedding模型和Rerank模型

RAG檢索系統的兩大核心利器——Embedding模型和Rerank模型

web/2025/6/27 2:18:20/文章來源:https://blog.csdn.net/daobaqin/article/details/148502194

在RAG系統中，有兩個非常重要的模型一個是Embedding模型，另一個則是Rerank模型；這兩個模型在RAG中扮演著重要角色。

Embedding模型的作用是把數據向量化，通過降維的方式，使得可以通過歐式距離，余弦函數等計算向量之間的相似度，以此來進行相似度檢索。

而Rerank的作用是在Embedding檢索的基礎之上，進行更加準確的數據篩選；如果說Embedding模型進行的是一維篩選，那么Rerank模型就是從多個維度進行篩選。

Embedding模型和Rerank模型

在自然語言處理和信息檢索系統中，Embedding模型和Rerank模型是兩類功能不同但常結合使用的技術。

Embedding和Rerank模型都是基于深度學習方式實現的神經網絡模型，但由于其功能不同，因此其實現方式和訓練方法也有一定的區別。

從使用的角度來看，Embedding一般用于數據向量化并快速檢索，而Rerank模型是在快速檢索的基礎之上進行重排序，提升相似度。

但從技術實現的角度來說，兩種模型使用的學習方式和架構是不一樣的；原因就在于兩個模型的實現目的和處理數據的方式。

它們的核心區別在于目標、應用階段和技術實現。以下是詳細對比：

1. 功能目標

維度	Embedding模型	Rerank模型
核心任務	將文本轉化為低維向量，捕捉語義信息	對候選結果重新排序，提升相關性
輸出形式	高維或低維向量（如768維向量）	候選列表的排序分數（如相關性得分）
關注點	文本的全局語義表示	候選結果與查詢的細粒度匹配

示例

Embedding模型：將“如何訓練神經網絡？”轉換為向量，用于檢索相似問題。
Rerank模型：對初步檢索的100個答案排序，將最相關的答案排到前3。

2. 應用階段

維度	Embedding模型	Rerank模型
所處流程	檢索階段：快速生成候選集	精排階段：優化候選集的順序
數據規模	處理海量數據（如百萬級文檔）	處理小規模候選集（如Top 100~1000）
性能要求	要求高效（毫秒級響應）	可接受較高延遲（需復雜計算）

典型場景

Embedding模型：用于搜索引擎的初步召回（如從10億文檔中篩選出Top 1000）。
Rerank模型：在推薦系統中對Top 100結果精細化排序，提升點擊率。

3. 技術實現

維度	Embedding模型	Rerank模型
模型類型	無監督/自監督學習（如BERT、Sentence-BERT）	有監督學習（如Pairwise Ranking、ListNet）
輸入輸出	單文本輸入 → 固定維度向量	查詢+候選文本對 → 相關性分數
特征依賴	僅依賴文本本身的語義信息	可融合多特征（語義、點擊率、時效性等）

模型舉例

Embedding模型：
- 通用語義編碼：BERT、RoBERTa
- 專用場景：DPR（Dense Passage Retrieval）
Rerank模型：
- 傳統方法：BM25 + 特征工程
- 深度模型：ColBERT、Cross-Encoder

本文來自互聯網用戶投稿，該文觀點僅代表作者本人，不代表本站立場。本站僅提供信息存儲空間服務，不擁有所有權，不承擔相關法律責任。
如若轉載，請注明出處：http://www.pswp.cn/web/82863.shtml
繁體地址，請注明出處：http://hk.pswp.cn/web/82863.shtml
英文地址，請注明出處：http://en.pswp.cn/web/82863.shtml

如若內容造成侵權/違法違規/事實不符，請聯系多彩編程網進行投訴反饋email:809451989@qq.com，一經查實，立即刪除！

相關文章

stm32內存踩踏一例

stm32內存踩踏一例

1、問題描述程序運行過程中，發現顯示的內容亂了，如下圖所示： 2、問題分析此原因產生是由于將一個函數提前引起的，單步跟蹤檢查問題運行過此函數后變量的地址改變了？被調函數能改變調用函數的變量地址&#xff1f…

閱讀更多...

Selenium的底層原理

Selenium的底層原理

Selenium 底層主要依賴于 WebDriver 協議（即 W3C WebDriver 規范，早期也有 JSON Wire Protocol）來實現對瀏覽器的遠程控制，其核心架構可以分為以下幾層： Selenium 客戶端（Client Library） 支持多…

閱讀更多...

前端高頻面試題2：瀏覽器/計算機網絡

前端高頻面試題2：瀏覽器/計算機網絡

本專欄相關鏈接前端高頻面試題1：HTML/CSS 前端高頻面試題2：瀏覽器/計算機網絡前端高頻面試題3：JavaScript 1.什么是強緩存、協商緩存？ 強緩存： 當瀏覽器請求資源時，首先檢查本地緩存是否命中。如果命…

閱讀更多...

MATLAB-電偶極子所產出的電磁場仿真

MATLAB-電偶極子所產出的電磁場仿真

% 清除工作區 clear all % 用戶輸入 a input(輸入點電荷的位置如[1,0,1;2,0,2]表示位置在(1,0,1),(2,0,2): ); Q input(輸入點電荷的電荷量，-表示電性，如[1,-1]: ); a1 input(電場線角度間隔: ); % 角度間隔 % 設置繪圖范圍 xmin min(a(:,1)) - 4;…

閱讀更多...

混合云數據庫連接問題：本地與云實例的兼容性挑戰

混合云數據庫連接問題：本地與云實例的兼容性挑戰

關鍵詞：混合云數據庫，混合云架構，數據庫連接問題，網絡策略，兼容性挑戰，權限沖突，防火墻，VPN，ExpressRoute，Direct Connect，SQL Server，MySQL，PostgreSQL，Azure SQL Database，AWS RDS 隨著企業數字化轉型的深入，混合云架構正成為主流選擇。它結合了本地數據中心…

閱讀更多...

pikachu靶場通關筆記16 CSRF關卡02-CSRF(POST)

pikachu靶場通關筆記16 CSRF關卡02-CSRF(POST)

目錄一、CSRF原理二、源碼分析三、滲透實戰 1、構造CSRF鏈接 （1）登錄 （2）bp設置inception on （3）修改個人信息 （4）構造CSRF鏈接 2、模擬受害者登錄 3、誘導受害者點擊 …

閱讀更多...

CAD2025安裝教程與資源下載

CAD2025安裝教程與資源下載

軟件下載軟件名稱：CAD2025軟件語言：簡體中文軟件大小：2.69G系統要求：Windows10或更高，32/ 64位操作系統硬件要求：CPU2GHz ，RAM4G或更高下載鏈接： 鏈接：https://pan.qua…

閱讀更多...

SpringBoot離線應用的5種實現方式

SpringBoot離線應用的5種實現方式

在當今高度依賴網絡的環境中，離線應用的價值日益凸顯。無論是在網絡不穩定的區域運行的現場系統，還是需要在斷網環境下使用的企業內部應用，具備離線工作能力已成為許多應用的必備特性。本文將介紹基于SpringBoot實現離線應用的5種不同方式。…

閱讀更多...

數據類型 -- 字符

數據類型 -- 字符

在C中，字符型（char）用于存儲單個字符，如字母、數字、符號等。字符型是最基本的數據類型之一，常用于處理文本、字符數組（字符串）等場景。 1. 基本類型 ? char：標準字符類型&#x…

閱讀更多...

國標GB28181視頻平臺EasyGBS視頻實時監控系統打造換熱站全景可視化管理方案

國標GB28181視頻平臺EasyGBS視頻實時監控系統打造換熱站全景可視化管理方案

一、方案背景? 在城市供熱體系中，換熱站作為連接熱源與用戶的核心樞紐，其運行穩定性直接影響供熱質量。面對供熱規模擴大與需求升級，傳統人工巡檢模式暴露出效率低、響應慢、監測不足等問題。基于GB28181協議的EasyGBS視頻實時監控系統&…

閱讀更多...

174頁PPT家居制造業集團戰略規劃和運營管控規劃方案

174頁PPT家居制造業集團戰略規劃和運營管控規劃方案

甲方集團需要制定一個清晰的集團價值定位，從“指引多元”、“塑造能力”以及“強化協同”等方面引領甲方做大做強集團需要通過管控模式、組織架構及職能、授權界面、關鍵流程、戰略實施和組織演進路徑，平衡風險控制和迅速發展，保證戰略落地…

閱讀更多...

python打卡第45天

python打卡第45天

tensorboard的發展歷史和原理一、發展歷史起源與 TensorFlow 一同誕生 (2015年底): TensorBoard 最初是作為 TensorFlow 開源項目（2015年11月發布）的一部分而設計和開發的。其核心目標是解決深度學習模型訓練過程中的“黑盒”問題，提供直觀…

閱讀更多...

CentOS 7如何編譯安裝升級gcc至7.5版本?

CentOS 7如何編譯安裝升級gcc至7.5版本?

CentOS 7如何編譯安裝升級gcc版本? 由于配置CentOS-SCLo-scl.repo與CentOS-SCLo-scl-rh.repo后執行yum install -y devtoolset-7安裝總是異常，遂決定編譯安裝gcc7.5 # 備份之前的yum .repo文件至 /tmp/repo_bak 目錄 mkdir -p /tmp/repo_bak && cd /etc…

閱讀更多...

中山大學美團港科大提出首個音頻驅動多人對話視頻生成MultiTalk，輸入一個音頻和提示，即可生成對應唇部、音頻交互視頻。

中山大學美團港科大提出首個音頻驅動多人對話視頻生成MultiTalk，輸入一個音頻和提示，即可生成對應唇部、音頻交互視頻。

由中山大學、美團、香港科技大學聯合提出的MultiTalk是一個用于音頻驅動的多人對話視頻生成的新框架。給定一個多流音頻輸入和一個提示，MultiTalk 會生成一個包含提示所對應的交互的視頻，其唇部動作與音頻保持一致。相關鏈接論文：https://a…

閱讀更多...

iOS 門店營收表格功能的實現

iOS 門店營收表格功能的實現

iOS 門店營收表格功能實現方案核心功能需求數據展示：表格形式展示門店/日期維度的營收數據排序功能：支持按營收金額、增長率等排序篩選功能：按日期范圍/門店/區域篩選交互操作：點擊查看詳情、數據刷新數據可視化：關…

閱讀更多...

怎么解決cesium加載模型太黑，程序崩潰，不顯示，位置不對模型太大，Cesium加載gltf/glb模型后變暗

怎么解決cesium加載模型太黑，程序崩潰，不顯示，位置不對模型太大，Cesium加載gltf/glb模型后變暗

有時候咱們cesium加載模型時候型太黑，程序崩潰，不顯示，位置不對模型太大怎么辦需要處理可以聯系Q:424081801 謝謝需要處理可以聯系Q:424081801 謝謝

閱讀更多...

移植driver_monitoring_system里的MobileNet到RK3588

移植driver_monitoring_system里的MobileNet到RK3588

根據下面的內容寫一篇技術博客,要求增加更多的解釋,讓普通讀者也能了解為什么這樣做,具體怎么做移植driver_monitoring_system里的MobileNet到RK3588 一、背景二、操作步驟2.1 下載源碼2.2 Tensorflow轉成ONNX2.2.1 在x86上創建容器,安裝依賴2.2.2 保存為saved-model2.2.3 sav…

閱讀更多...

低代碼平臺前端頁面表格字段綁定與后端數據傳輸交互主要有哪些方式？華為云Astro在這方面有哪些方式？

低代碼平臺前端頁面表格字段綁定與后端數據傳輸交互主要有哪些方式？華為云Astro在這方面有哪些方式？

目錄 ?? 一、低代碼平臺中常見的數據綁定與交互方式 1. 接口綁定（API 調用） 2. 數據源綁定（DataSource） 3. 變量中轉（臨時變量 / 頁面狀態） 4. 數據模型綁定（模型驅動） ?? 二、華為云 Astro 輕應用的實現方式 ? 1. 數據源綁定（API服務+API網關） ? 2. 變…

閱讀更多...

《doubao-lite-32k 模型緩存機制使用指南》

《doubao-lite-32k 模型緩存機制使用指南》

doubao-lite-32k 模型緩存機制使用指南一、緩存概述 1. 緩存作用 doubao-lite-32k 模型的緩存（Session 緩存）主要用于多輪對話場景，實現以下功能：存儲歷史對話信息（Token），避免重復傳輸上下文，減少計算資源消耗。優化長上下文（最長 32K Token）處理效率，提升多…

閱讀更多...

量子計算突破：新型超導芯片重構計算范式

量子計算突破：新型超導芯片重構計算范式

??2024年IBM 1281量子比特超導芯片實現0.001%量子錯誤率，計算速度達經典超算2.5億倍??。本文解析： ??物理突破??：鉭基超導材料使量子相干時間突破??800μs??（提升15倍）??架構革命??：十字形…

閱讀更多...

最新文章