LiT and Lean: Distilling Listwise Rerankers intoEncoder-Decoder Models

LiT and Lean: Distilling Listwise Rerankers intoEncoder-Decoder Models

diannao/2025/8/5 0:56:22/文章來源:https://blog.csdn.net/qq_38423732/article/details/147050148

文章：ECIR 2025會議

一、動機

背景：利用LLMs強大的能力，將一個查詢（query）和一組候選段落作為輸入，整體考慮這些段落的相關性，并對它們進行排序。

先前的研究基礎上進行擴展 [14,15]，這些研究使用 RankGPT 作為教師模型，將排序結果蒸餾到 listwise 學生重排序模型中。其中一個代表性模型是 RankZephyr [15]，它在排序效果上縮小了與 GPT-4 的差距，甚至在某些情況下超過了這個閉源的教師模型。

大型語言模型（LLMs）推動了listwise重排序研究的發展，并取得了令人印象深刻的最先進成果。然而，這些模型龐大的參數數量和有限的上下文長度限制了其在重排序任務中的效率。

二、解決方法

LiT5模型架構：

?

模型遵循 FiD 架構，編碼器會將每個段落與查詢（query）逐對分別編碼。對于每個查詢–段落對，輸入提示（prompt）的格式如下：

以 Search Query: 開頭，接著是查詢內容；
然后是 Passage:，后面帶有一個唯一的編號（例如 [1]、[2]）；
最后是該段落的文本；
提示的結尾是 Relevance Ranking:，用于引導模型生成排序結果。

解碼器隨后會對所有段落的編碼表示進行處理，根據與查詢的相關性，生成一個按編號排序的結果（從最相關到最不相關），例如：“3 1 2 ...”。

LiT5 模型的設計和創新，它通過采用 RankZephyr 作為教師模型，利用 FiD 架構 和 蒸餾技術，有效地訓練了一個能夠處理更多段落（最多100個段落）的高效排序模型，突破了傳統模型在處理段落數量上的限制，并且能夠節省計算成本。

三、訓練模型

數據集：

?MS MARCO v1 passage ranking 數據集中隨機抽取了 20K 個查詢，對于每個查詢，我們從 MS MARCO v1 和 v2 數據集中各自檢索了 100 個段落。

實驗結果：

本文來自互聯網用戶投稿，該文觀點僅代表作者本人，不代表本站立場。本站僅提供信息存儲空間服務，不擁有所有權，不承擔相關法律責任。
如若轉載，請注明出處：http://www.pswp.cn/diannao/77026.shtml
繁體地址，請注明出處：http://hk.pswp.cn/diannao/77026.shtml
英文地址，請注明出處：http://en.pswp.cn/diannao/77026.shtml

如若內容造成侵權/違法違規/事實不符，請聯系多彩編程網進行投訴反饋email:809451989@qq.com，一經查實，立即刪除！

相關文章

Python高級爬蟲之JS逆向+安卓逆向1.2節: 變量與對象

Python高級爬蟲之JS逆向+安卓逆向1.2節: 變量與對象

目錄引言： 1.2.1 Python中的變量 1.2.2 變量的命名與可讀性 1.2.3 Python中的對象 1.2.4 跟大神學高級爬蟲安卓逆向引言： 大神薯條老師的高級爬蟲安卓逆向教程： 這套爬蟲教程會系統講解爬蟲的初級，中級，高級知…

閱讀更多...

可發1區的超級創新思路（python 實現）：一種輕量化的動態稀疏門控網絡

可發1區的超級創新思路（python 實現）：一種輕量化的動態稀疏門控網絡

首先聲明，該模型為原創！原創！原創！且該思路還未有成果發表，感興趣的小伙伴可以借鑒！一、應用領域視頻異常檢測、生成視頻檢測。二、模型解析該模型由1.關鍵幀動態選擇機制、2.關鍵幀動態選擇機制以及3.關鍵幀動態選擇機制三大核心組件構成，形成端到端的視頻異常…

閱讀更多...

使用NVM下載Node.js管理多版本

使用NVM下載Node.js管理多版本

提示：我解決這個bug跟別人思路可能不太一樣，因為我是之前好用，換個項目就不好使了，倦了文章目錄前言項目場景一項目場景二解決方案：下載 nvm安裝 nvm重新下載所需Node 版本nvm常用命令項目結構說明前言提示&…

閱讀更多...

MySQL數據庫經典面試題解析

MySQL數據庫經典面試題解析

1. MySQL 索引使用有哪些注意事項呢？可以從三個維度回答這個問題：索引哪些情況會失效，索引不適合哪些場景，索引規則索引哪些情況會失效查詢條件包含or，可能導致索引失效如何字段類型是字符串，where時一定用引號括起來，否則索引失效like通配符可能導致索引失效。聯合…

閱讀更多...

C#結合SQLite數據庫使用方法

C#結合SQLite數據庫使用方法

一、關于SQLite SQLite 是一個輕量級的嵌入式關系型數據庫管理系統（RDBMS）。與傳統的數據庫管理系統（如 MySQL、PostgreSQL 或 SQL Server）不同，SQLite 并不需要運行單獨的服務器進程，它的數據庫存儲在一個…

閱讀更多...

深入解析 MySQL 中的日期時間函數：DATE_FORMAT 與時間查詢優化

深入解析 MySQL 中的日期時間函數：DATE_FORMAT 與時間查詢優化

深入解析 MySQL 中的日期時間函數：DATE_FORMAT 與時間查詢優化在數據庫管理和應用開發中，日期和時間的處理是不可或缺的一部分。MySQL 提供了多種日期和時間函數來滿足不同的需求，其中DATE_FORMAT函數以其強大的日期格式化能力，…

閱讀更多...

如何深刻理解Reactor和Proactor

如何深刻理解Reactor和Proactor

前言： 網絡框架的設計離不開 I/O 線程模型，線程模型的優劣直接決定了系統的吞吐量、可擴展性、安全性等。目前主流的網絡框架，在網絡 IO 處理層面幾乎都采用了I/O 多路復用方案(又以epoll為主)，這是服務端應對高并發的性能利器。 …

閱讀更多...

筆試專題（七）

筆試專題（七）

文章目錄乒乓球筐（哈希）題解代碼組隊競賽題解代碼刪除相鄰數字的最大分數（線性dp）題解代碼乒乓球筐（哈希） 題目鏈接題解 1. 兩個哈希表先統計第一個字符串中的字符個數，再統計第二個字…

閱讀更多...

清晰易懂的 Flutter 卸載和清理教程

清晰易懂的 Flutter 卸載和清理教程

以下是為 Flutter 徹底卸載與清理教程，覆蓋 Windows、macOS、Linux 系統，步驟清晰無殘留，確保完全刪除 Flutter SDK、依賴工具及 IDE 配置。一、通用步驟：確認 Flutter 安裝方式 Flutter 通常通過以下方式安裝： 手動…

閱讀更多...

關于反卷積

關于反卷積

🧠 什么是反卷積？ 反卷積（Deconvolution），通常也稱為轉置卷積（Transpose Convolution），是一種用于擴展輸入特征圖的操作，通常用于生成圖像或上采樣任務中。與標準卷積操…

閱讀更多...

【機器學習】ROC 曲線與 PR 曲線

【機器學習】ROC 曲線與 PR 曲線

目錄一、混淆矩陣：分類評估的基礎二. ROC 曲線 (Receiver Operating Characteristic Curve) 三. PR 曲線 (Precision-Recall Curve) 3.1 核心思想 4. 何時使用 ROC 曲線和 PR 曲線？ 實驗結果 6. 總結在機器學習的分類任務中，我們訓…

閱讀更多...

Python高階函數-map

Python高階函數-map

map() 是 Python 內置的一個高階函數，它接收一個函數和一個可迭代對象作為參數，將函數依次作用在可迭代對象的每個元素上，并返回一個迭代器（Python 3.x 中）。基本語法 map(function, iterable, ...)function: 應用于…

閱讀更多...

上海餐飲市場數據分析與可視化

上海餐飲市場數據分析與可視化

上海作為中國的經濟中心和國際化大都市，其餐飲市場具有高度的多樣性和競爭性。隨著消費者需求的不斷變化，餐飲行業的從業者和投資者需要深入了解市場現狀和趨勢，以便制定更有效的商業策略。本文將通過數據分析和可視化技術，深入探討上海餐飲市場的現狀和趨勢，為餐飲從業者…

閱讀更多...

MySQL基礎 [五] - 表的增刪查改

MySQL基礎 [五] - 表的增刪查改

目錄 Create（insert） Retrieve（select） where條件 ?編輯 NULL的查詢結果排序(order by) 篩選分頁結果 (limit) Update Delete 刪除表截斷表（truncate） 插入查詢結果（insertselect&…

閱讀更多...

SQL：Primary Key（主鍵）和Foreign Key（外鍵）

SQL：Primary Key（主鍵）和Foreign Key（外鍵）

目錄 1. Key（鍵） 2. Index（索引） 3.Key和Index的區別 4. Primary Key（主鍵） 5. Foreign Key（外鍵） 6.主鍵和外鍵的關系溫馨提示： 閃電按鈕不同的執行功能首先&…

閱讀更多...

2025年- H1-Lc109-160. 相交列表--java版

2025年- H1-Lc109-160. 相交列表--java版

1.題目描述 2.思路 “雙指針切換鏈表頭” 思路一：雙指針路徑對齊 while (pA ! pB) { pA (pA null) ? headB : pA.next; pB (pB null) ? headA : pB.next; } 讓兩個指針走相同的總路徑長度！ 設： 鏈表 A 獨有部分長度是 lenA 鏈表 B …

閱讀更多...

PyTorch 深度學習 || 6. Transformer | Ch6.3 Transformer 簡單案例

PyTorch 深度學習 || 6. Transformer | Ch6.3 Transformer 簡單案例

1. 簡單案例這個代碼是一個簡單的 Transformer 模型的實現，這個例子展示了一個基本的序列到序列（seq2seq）任務，比如將一個數字序列轉換為另一個數字序列。可以用于學習和理解 Transformer 的基本結構和工作原理。 import torch import torch.nn as nn import math# 位置…

閱讀更多...

基礎算法篇(4)(藍橋杯常考點)—數據結構（進階）

基礎算法篇(4)(藍橋杯常考點)—數據結構（進階）

前言這期將會講到基礎算法篇里面的數據結構（進階），主要包括單調棧，單調隊列，并查集，擴展域并查集，帶權并查集，字符串哈希，Trie樹。數據結構(進階）正文單…

閱讀更多...

【AI學習】初步了解Gradio

【AI學習】初步了解Gradio

Gradio 是一個開源的 Python 庫，專注于快速構建交互式 Web 界面，特別適用于機器學習模型、數據科學項目或任意 Python 函數的演示與部署。它通過極簡的代碼實現前后端一體化，無需前端開發經驗即可創建功能豐富的應用。以下是 Gradio 的核心特…

閱讀更多...

Overleaf 論文提交 Arxiv

Overleaf 論文提交 Arxiv

Contents References 清除 Overleaf 中所有編譯 error，并且保證 main.tex 文件在 project 最上層參考文件 .bib 轉 .bbl. project 編譯成功后可以在 Overleaf 的 Recompile 按鈕右側找到 “Logs and output files”，點進去之后右下角可以點開 “Other lo…

閱讀更多...

最新文章