FRONT歸因-兩階段訓練流程

FRONT, Fine-Grained Grounded Citations歸因

FRONT歸因,首先從檢索到的源文檔中選擇支持性引用,然后基于這些引用指導生成過程,確保生成回答有據可依,引用準確無誤。

FRONT的特色在于兩階段歸因訓練,要點如下:?

階段一:基于依據的引導生成

教導模型首先從源文檔中提取支持性引用,每個引用與其文檔標識符相關聯。這些提取的引用隨后用于歸因答案的生成。

直接從源文檔提取引用,減少了不相關信息的引入和幻覺風險。每個標識符提供了明確的監督信號,有助于后續的偏好調優訓練。

階段二:一致性感知對齊

一致性感知對齊的目的是增強基于依據的過程和生成過程的一致性。采用偏好學習的方法,將一致答案和不一致答案,在相同基準依據引用的指導下進行對齊

使用較小LLM如7B模型在少樣本學習prompt設置下生成低質量、不一致答案作為負樣本,并使用偏好優化(DPO)進行偏好對齊。

reference

----

Learning Fine-Grained Grounded Citations for Attributed Large Language Models

https://aclanthology.org/2024.findings-acl.838.pdf

Fine-grained-Attribution

https://github.com/LuckyyySTA/Fine-grained-Attribution

本文來自互聯網用戶投稿,該文觀點僅代表作者本人,不代表本站立場。本站僅提供信息存儲空間服務,不擁有所有權,不承擔相關法律責任。
如若轉載,請注明出處:http://www.pswp.cn/web/87020.shtml
繁體地址,請注明出處:http://hk.pswp.cn/web/87020.shtml
英文地址,請注明出處:http://en.pswp.cn/web/87020.shtml

如若內容造成侵權/違法違規/事實不符,請聯系多彩編程網進行投訴反饋email:809451989@qq.com,一經查實,立即刪除!

相關文章

單端轉差分放大器AD8138

根據 AD8138 的數據手冊特性及參數,可以實現單端 5Vpp(偏置 0V)正弦波轉差分 5Vpp(共模 2.5V)的功能,但需注意以下細節: 1. 信號幅度匹配性 輸入信號:單端 5Vpp(峰峰值…

用R包mice進行多重插補

利用R包mice實現的鏈式方程多重插補方法來插補缺失的數據。 所有多重插補方法都遵循三個步驟 插補——與單次插補類似,對缺失值進行插補。但是,插補值會從分布中提取m次,而不是僅提取一次。此步驟結束時,應該有m 個完整的數據集…

【專題】網絡攻防技術期末復習資料

網絡攻防技術期末復習資料 鏈接:https://blog.csdn.net/Pqf18064375973/article/details/148996272?sharetypeblogdetail&sharerId148996272&sharereferPC&sharesourcePqf18064375973&sharefrommp_from_link 網絡安全威脅的成因。 分類&#xff1a…

地震災害的模擬

為確保地震災害模擬的準確性和高效性,涉及的系統需要處理復雜的物理模型、數據輸入和多層次的模擬過程。在技術設計方案中,我們將涵蓋以下幾個方面: 背景:描述該模擬系統的目的與應用場景。需求:列出系統的功能需求&a…

9.9 《1/10成本實現GPT-3.5級表現!ChatGLM3-6B QLoRA微調實戰:4bit量化+低秩適配全解析》

1/10成本實現GPT-3.5級表現!ChatGLM3-6B QLoRA微調實戰:4bit量化+低秩適配全解析 ChatGLM3-6B 微調入門實戰:QLoRA 量化低秩適配技術 ▲ ChatGLM3-6B采用GLM架構改進版,支持32K上下文長度和代碼生成能力 一、QLoRA 技術原理精要 QLoRA(Quantized Low-Rank Adaptation)…

【Python基礎】11 Python深度學習生態系統全景解析:從基礎框架到專業應用的技術深度剖析(超長版,附多個代碼及結果)

引言:Python在深度學習領域的統治地位 在人工智能浪潮席卷全球的今天,Python已經成為深度學習領域當之無愧的王者語言。這不僅僅是因為Python語法簡潔易學,更重要的是圍繞Python構建的深度學習生態系統的完整性和強大性。從Google的TensorFlow到Facebook的PyTorch,從科學計…

RESTful API 設計原則深度解析

在 Web 服務架構中,RESTful API作為一種輕量級、可擴展的接口設計風格,通過 HTTP 協議實現資源的標準化訪問。本文從核心原則、URL 設計、HTTP 方法應用、狀態管理及面試高頻問題五個維度,結合工程實踐與反例分析,系統解析 RESTfu…

java web2(黑馬)

數據庫設計 簡介 1.軟件的研發步驟 2.數據庫設計概念 > 數據庫設計就是根據業務系統的具體需求,結合我們所選用的DBMS,為這個業務系統構造出最優 的數據存儲模型 > 建立數據庫中的表結構以及表與表之間的關聯關系的過程, > …

Meta 宣布加入 Kotlin 基金會,將為 Kotlin 和 Android 生態提供全新支持

近日 Meta 正式宣發加入了 Kotlin 基金會,如果你對 Meta 不熟悉,那么對于開源了 React Native 的 Facebook 應該不陌生了吧?現在它也正式加入了 Kotlin 領導者的陣營: Kotlin 基金會 是由 Jetbrains 和 Google 共同成立的基金會&a…

緩存系統-淘汰策略

目錄 一、LRU(最近最少使用) 工作原理 操作流程 基本特征 二、LFU(最不常使用) 工作原理 操作流程 基本特征 三、ARC 自適應 工作原理 操作流程 基本特征 四、TTL(生存時間) 工作原理 操作流…

TypeScript 安裝使用教程

一、TypeScript 簡介 TypeScript 是由微軟開發的開源編程語言,是 JavaScript 的超集,添加了靜態類型、接口、枚舉、類等特性,使開發大型應用更安全、可維護、可擴展。最終會被編譯為標準的 JavaScript 代碼在瀏覽器或 Node.js 中運行。 二、…

強化學習系列--dpo損失函數

DPO 概要 DPO(Direct Preference Optimization,直接偏好優化)是由斯坦福大學等研究團隊于2023年提出的一種偏好優化算法,可用于LLM、VLM與MLLM的對齊訓練。 算法基于PPO的RLHF基礎上進行了大幅簡化。DPO算法跳過了訓練獎勵模型這…

UniApp完全支持快應用QUICKAPP-以及如何采用 Uni 模式開發發行快應用優雅草卓伊凡

UniApp完全支持快應用QUICKAPP-以及如何采用 Uni 模式開發發行快應用優雅草卓伊凡 一、UniApp 對快應用的支持深度 UniApp 已完全支持快應用的開發和發布,具體包括: 兩種渲染模式: Webview 渲染(快應用 Light 版)&a…

js 允許生成特殊的變量名 基于字符集編碼混淆的 XSS 繞過漏洞 -- Google 2025 Lost In Transliteration

題目實現了一個字符轉換工具 在/file路由用戶可以通過 ct 參數自定義 Content-Type // 文件路由 - 提供靜態文件服務(JS和CSS),支持內容類型驗證 app.MapGet("/file", (string filename "", string? ct null, string?…

【仿muduo庫實現并發服務器】LoopThreadPool模塊

仿muduo庫實現并發服務器 1.LoopThread模塊1.1成員變量1.2構造函數13線程入口函數1.4獲取eventloop對象GetLoop() 2.LoopThreadPool模塊2.1成員變量2.2構造函數2.3配置線程數量2.4按照配置數量創建線程2.5依次分配Eventloop對象 1.LoopThread模塊 這個模塊是為了將EventLoop與…

華為云Flexus+DeepSeek征文|基于Dify構建文本/圖像/視頻生成工作流

華為云FlexusDeepSeek征文|基于Dify構建文本/圖像/視頻生成工作流 一、構建文本/圖像/視頻生成工作流前言二、構建文本/圖像/視頻生成工作流環境2.1 基于FlexusX實例的Dify平臺2.2 基于MaaS的模型API商用服務 三、構建文本/圖像/視頻生成工作流實戰3.1 配置Dify環境…

相機-IMU聯合標定:IMU更新頻率

文章目錄 ??簡介?? IMU頻率參數錯誤設置的影響? 相機-IMU聯合標定失敗:Optimization failed!?? 確定IMU更新頻率直接通過 rostopic hz 檢查實際頻率檢查 IMU 驅動或數據手冊從 bag 文件統計頻率在這里插入圖片描述修改 `update_rate` 的注意事項**最終建議****常見問題…

動手實踐:如何提取Python代碼中的字符串變量的值

要提取Python代碼中所有變量類型為字符串的變量的值,但不執行代碼(避免安全風險),可以通過靜態分析代碼的抽象語法樹(AST)來實現。以下是完整的解決方案: 本文由「大千AI助手」原創發布&#xf…

Python中字符串isalpha()函數詳解

在 Python 中,isalpha() 是字符串(string)類型的內置方法,用于檢查字符串中的所有字符是否都是字母字符(alphabetic character)。以下是詳細說明: 一、基本功能 返回值:布爾值&…

Gradio全解13——MCP詳解(4)——TypeScript包命令:npm與npx

Gradio全解13——MCP詳解(4)——TypeScript包命令:npm與npx 第13章 MCP詳解13.4 TypeScript包命令:npm與npx13.4.1 概念區分1. npm概念與運行邏輯2. npx概念及特點 13.4.2 操作示例1. 使用npm執行包2. 使用npx執行包3. 常用npm命令…