FRONT歸因-兩階段訓練流程

FRONT歸因-兩階段訓練流程

web/2025/7/2 12:25:37/文章來源:https://blog.csdn.net/liliang199/article/details/149052297

FRONT, Fine-Grained Grounded Citations歸因

FRONT歸因，首先從檢索到的源文檔中選擇支持性引用，然后基于這些引用指導生成過程，確保生成回答有據可依，引用準確無誤。

FRONT的特色在于兩階段歸因訓練，要點如下:?

階段一：基于依據的引導生成

教導模型首先從源文檔中提取支持性引用，每個引用與其文檔標識符相關聯。這些提取的引用隨后用于歸因答案的生成。

直接從源文檔提取引用，減少了不相關信息的引入和幻覺風險。每個標識符提供了明確的監督信號，有助于后續的偏好調優訓練。

階段二：一致性感知對齊

一致性感知對齊的目的是增強基于依據的過程和生成過程的一致性。采用偏好學習的方法，將一致答案和不一致答案，在相同基準依據引用的指導下進行對齊

使用較小LLM如7B模型在少樣本學習prompt設置下生成低質量、不一致答案作為負樣本，并使用偏好優化(DPO)進行偏好對齊。

reference

----

Learning Fine-Grained Grounded Citations for Attributed Large Language Models

https://aclanthology.org/2024.findings-acl.838.pdf

Fine-grained-Attribution

https://github.com/LuckyyySTA/Fine-grained-Attribution

本文來自互聯網用戶投稿，該文觀點僅代表作者本人，不代表本站立場。本站僅提供信息存儲空間服務，不擁有所有權，不承擔相關法律責任。
如若轉載，請注明出處：http://www.pswp.cn/web/87020.shtml
繁體地址，請注明出處：http://hk.pswp.cn/web/87020.shtml
英文地址，請注明出處：http://en.pswp.cn/web/87020.shtml

如若內容造成侵權/違法違規/事實不符，請聯系多彩編程網進行投訴反饋email:809451989@qq.com，一經查實，立即刪除！

相關文章

單端轉差分放大器AD8138

單端轉差分放大器AD8138

根據 AD8138 的數據手冊特性及參數，可以實現單端 5Vpp（偏置 0V）正弦波轉差分 5Vpp（共模 2.5V）的功能，但需注意以下細節： 1. 信號幅度匹配性輸入信號：單端 5Vpp（峰峰值…

閱讀更多...

用R包mice進行多重插補

用R包mice進行多重插補

利用R包mice實現的鏈式方程多重插補方法來插補缺失的數據。所有多重插補方法都遵循三個步驟插補——與單次插補類似，對缺失值進行插補。但是，插補值會從分布中提取m次，而不是僅提取一次。此步驟結束時，應該有m 個完整的數據集…

閱讀更多...

【專題】網絡攻防技術期末復習資料

【專題】網絡攻防技術期末復習資料

網絡攻防技術期末復習資料鏈接：https://blog.csdn.net/Pqf18064375973/article/details/148996272?sharetypeblogdetail&sharerId148996272&sharereferPC&sharesourcePqf18064375973&sharefrommp_from_link 網絡安全威脅的成因。分類&#xff1a…

閱讀更多...

地震災害的模擬

地震災害的模擬

為確保地震災害模擬的準確性和高效性，涉及的系統需要處理復雜的物理模型、數據輸入和多層次的模擬過程。在技術設計方案中，我們將涵蓋以下幾個方面： 背景：描述該模擬系統的目的與應用場景。需求：列出系統的功能需求&a…

閱讀更多...

9.9 《1/10成本實現GPT-3.5級表現！ChatGLM3-6B QLoRA微調實戰：4bit量化+低秩適配全解析》

9.9 《1/10成本實現GPT-3.5級表現！ChatGLM3-6B QLoRA微調實戰：4bit量化+低秩適配全解析》

1/10成本實現GPT-3.5級表現！ChatGLM3-6B QLoRA微調實戰：4bit量化+低秩適配全解析 ChatGLM3-6B 微調入門實戰：QLoRA 量化低秩適配技術 ▲ ChatGLM3-6B采用GLM架構改進版，支持32K上下文長度和代碼生成能力一、QLoRA 技術原理精要 QLoRA（Quantized Low-Rank Adaptation）…

閱讀更多...

【Python基礎】11 Python深度學習生態系統全景解析：從基礎框架到專業應用的技術深度剖析（超長版，附多個代碼及結果）

【Python基礎】11 Python深度學習生態系統全景解析：從基礎框架到專業應用的技術深度剖析（超長版，附多個代碼及結果）

引言：Python在深度學習領域的統治地位在人工智能浪潮席卷全球的今天，Python已經成為深度學習領域當之無愧的王者語言。這不僅僅是因為Python語法簡潔易學，更重要的是圍繞Python構建的深度學習生態系統的完整性和強大性。從Google的TensorFlow到Facebook的PyTorch，從科學計…

閱讀更多...

RESTful API 設計原則深度解析

RESTful API 設計原則深度解析

在 Web 服務架構中，RESTful API作為一種輕量級、可擴展的接口設計風格，通過 HTTP 協議實現資源的標準化訪問。本文從核心原則、URL 設計、HTTP 方法應用、狀態管理及面試高頻問題五個維度，結合工程實踐與反例分析，系統解析 RESTfu…

閱讀更多...

java web2（黑馬）

java web2（黑馬）

數據庫設計簡介 1.軟件的研發步驟 2.數據庫設計概念 > 數據庫設計就是根據業務系統的具體需求，結合我們所選用的DBMS，為這個業務系統構造出最優的數據存儲模型 > 建立數據庫中的表結構以及表與表之間的關聯關系的過程， > …

閱讀更多...

Meta 宣布加入 Kotlin 基金會，將為 Kotlin 和 Android 生態提供全新支持

Meta 宣布加入 Kotlin 基金會，將為 Kotlin 和 Android 生態提供全新支持

近日 Meta 正式宣發加入了 Kotlin 基金會，如果你對 Meta 不熟悉，那么對于開源了 React Native 的 Facebook 應該不陌生了吧？現在它也正式加入了 Kotlin 領導者的陣營： Kotlin 基金會是由 Jetbrains 和 Google 共同成立的基金會&a…

閱讀更多...

緩存系統-淘汰策略

緩存系統-淘汰策略

目錄一、LRU（最近最少使用） 工作原理操作流程基本特征二、LFU（最不常使用） 工作原理操作流程基本特征三、ARC 自適應工作原理操作流程基本特征四、TTL（生存時間） 工作原理操作流…

閱讀更多...

TypeScript 安裝使用教程

TypeScript 安裝使用教程

一、TypeScript 簡介 TypeScript 是由微軟開發的開源編程語言，是 JavaScript 的超集，添加了靜態類型、接口、枚舉、類等特性，使開發大型應用更安全、可維護、可擴展。最終會被編譯為標準的 JavaScript 代碼在瀏覽器或 Node.js 中運行。二、…

閱讀更多...

強化學習系列--dpo損失函數

強化學習系列--dpo損失函數

DPO 概要 DPO（Direct Preference Optimization，直接偏好優化）是由斯坦福大學等研究團隊于2023年提出的一種偏好優化算法，可用于LLM、VLM與MLLM的對齊訓練。算法基于PPO的RLHF基礎上進行了大幅簡化。DPO算法跳過了訓練獎勵模型這…

閱讀更多...

UniApp完全支持快應用QUICKAPP-以及如何采用 Uni 模式開發發行快應用優雅草卓伊凡

UniApp完全支持快應用QUICKAPP-以及如何采用 Uni 模式開發發行快應用優雅草卓伊凡

UniApp完全支持快應用QUICKAPP-以及如何采用 Uni 模式開發發行快應用優雅草卓伊凡一、UniApp 對快應用的支持深度 UniApp 已完全支持快應用的開發和發布，具體包括： 兩種渲染模式： Webview 渲染（快應用 Light 版）&a…

閱讀更多...

js 允許生成特殊的變量名基于字符集編碼混淆的 XSS 繞過漏洞 -- Google 2025 Lost In Transliteration

js 允許生成特殊的變量名基于字符集編碼混淆的 XSS 繞過漏洞 -- Google 2025 Lost In Transliteration

題目實現了一個字符轉換工具在/file路由用戶可以通過 ct 參數自定義 Content-Type // 文件路由 - 提供靜態文件服務（JS和CSS），支持內容類型驗證 app.MapGet("/file", (string filename "", string? ct null, string?…

閱讀更多...

【仿muduo庫實現并發服務器】LoopThreadPool模塊

【仿muduo庫實現并發服務器】LoopThreadPool模塊

仿muduo庫實現并發服務器 1.LoopThread模塊1.1成員變量1.2構造函數13線程入口函數1.4獲取eventloop對象GetLoop() 2.LoopThreadPool模塊2.1成員變量2.2構造函數2.3配置線程數量2.4按照配置數量創建線程2.5依次分配Eventloop對象 1.LoopThread模塊這個模塊是為了將EventLoop與…

閱讀更多...

華為云Flexus+DeepSeek征文｜基于Dify構建文本/圖像/視頻生成工作流

華為云Flexus+DeepSeek征文｜基于Dify構建文本/圖像/視頻生成工作流

華為云FlexusDeepSeek征文｜基于Dify構建文本/圖像/視頻生成工作流一、構建文本/圖像/視頻生成工作流前言二、構建文本/圖像/視頻生成工作流環境2.1 基于FlexusX實例的Dify平臺2.2 基于MaaS的模型API商用服務三、構建文本/圖像/視頻生成工作流實戰3.1 配置Dify環境…

閱讀更多...

相機-IMU聯合標定：IMU更新頻率

相機-IMU聯合標定：IMU更新頻率

文章目錄 ??簡介?? IMU頻率參數錯誤設置的影響? 相機-IMU聯合標定失敗：Optimization failed!?? 確定IMU更新頻率直接通過 rostopic hz 檢查實際頻率檢查 IMU 驅動或數據手冊從 bag 文件統計頻率在這里插入圖片描述修改 `update_rate` 的注意事項**最終建議****常見問題…

閱讀更多...

動手實踐：如何提取Python代碼中的字符串變量的值

動手實踐：如何提取Python代碼中的字符串變量的值

要提取Python代碼中所有變量類型為字符串的變量的值，但不執行代碼（避免安全風險），可以通過靜態分析代碼的抽象語法樹（AST）來實現。以下是完整的解決方案： 本文由「大千AI助手」原創發布&#xf…

閱讀更多...

Python中字符串isalpha()函數詳解

Python中字符串isalpha()函數詳解

在 Python 中，isalpha() 是字符串（string）類型的內置方法，用于檢查字符串中的所有字符是否都是字母字符（alphabetic character）。以下是詳細說明： 一、基本功能返回值：布爾值&…

閱讀更多...

Gradio全解13——MCP詳解（4）——TypeScript包命令：npm與npx

Gradio全解13——MCP詳解（4）——TypeScript包命令：npm與npx

Gradio全解13——MCP詳解（4）——TypeScript包命令：npm與npx 第13章 MCP詳解13.4 TypeScript包命令：npm與npx13.4.1 概念區分1. npm概念與運行邏輯2. npx概念及特點 13.4.2 操作示例1. 使用npm執行包2. 使用npx執行包3. 常用npm命令…

閱讀更多...

最新文章