大模型RAG(檢索增強)創新--SELF-RAG

????????檢索增強生成 (RAG) 提供了一種將 ChatGPT/GPT-4 等大型語言模型與自定義數據集成的途徑,但存在局限性。讓我們看看 RAG 最近的研究是如何解決一些問題。

????????大語言模型(LLM)將改變整個金融領域。其中一個場景是大語言模型可以學習大量文檔,并在很短的時間內分析趨勢并分析收益。但存在的問題是很多時候你得到的答案只是部分且不完整的。舉例來說,您有一個文檔,其中包含 X 公司過去 15 年的年收入,但位于不同的段落。在標準檢索增強生成 (RAG) 架構中,您通常檢索前 k 個相似文檔,或選擇固定上下文長度內的文檔。然而,這可能會帶來幾個問題。一個問題是 top-k 文檔并不包含所有答案——例如可能僅對應于過去 5 或 10 年。另一個問題是您檢索的塊和問題并不一定相似。在這種情況下,您可能會得到錯誤的答案

????????當您已經開發了普通的 RAG 策略,該策略在您測試的簡單情況下運行良好,但當您提出一些開箱即用的問題時,就會失敗。讓我們看一下 RAG 最近的一些創新,看看它們如何為上述問題提供解決方案。

自我RAG

????????作者開發了一種巧妙的方法,微調模型,讓模型如(Llama2-7B 和 13B)輸出特殊標記 ?[Retrieval], [No Retrieval], [Relevant], [Irrelevant], [No support / Contradictory], [Partially supported], [Utility]等附加到 LM 生成中,用于決定上下文是否相關/不相關、是否支持從上下文生成 LM 文本以及對生產是否有用。

訓練自我 RAG

????????Self-RAG 通過兩步過程進行訓練。在步驟 1 中,訓練一個簡單的 LM 對生成的輸出(僅提示或提示 + RAG 增強輸出)進行分類,并在末尾附加相關的特殊標記。這個模型是通過 GPT-4 進行訓練的。具體來說,GPT-4 是使用特定指令進行提示的(“Given an instruction, make a judgment on whether finding some external documents from the web helps to generate a better response.”)

在步驟 2 中,生成器模型使用標準的下一個標記預測目標,生成用于檢索/批評生成的特殊標記。與其他微調或 RLHF 方法不同,下游訓練會影響模型輸出并使后代產生偏差,通過這種簡單的方法,模型僅被訓練以生成適當的特殊標記,不會改變底層 LM!太棒了!

評估自我RAG

????????作者針對公共衛生事實驗證、多項選擇推理、問答等進行了一系列評估。共有 3 種類型的任務。閉集任務包括事實驗證和多項選擇推理,并以準確性作為評價指標。簡短的生成任務包括開放域問答數據集。作者評估了模型生成中是否包含較好答案,而不是嚴格要求精確匹配。

長篇生成包括傳記生成和長篇問答。為了評估這些任務,作者使用 FactScore 來評估傳記——基本上是對生成的各種信息及其事實正確性的衡量。對于長格式的 QA,使用了引用精度和召回率。

Self-RAG 在非專有模型中表現最好,并且在大多數情況下較大的 13B 參數優于 7B 模型。在某些情況下它甚至優于 ChatGPT。???????

?

本文來自互聯網用戶投稿,該文觀點僅代表作者本人,不代表本站立場。本站僅提供信息存儲空間服務,不擁有所有權,不承擔相關法律責任。
如若轉載,請注明出處:http://www.pswp.cn/bicheng/72032.shtml
繁體地址,請注明出處:http://hk.pswp.cn/bicheng/72032.shtml
英文地址,請注明出處:http://en.pswp.cn/bicheng/72032.shtml

如若內容造成侵權/違法違規/事實不符,請聯系多彩編程網進行投訴反饋email:809451989@qq.com,一經查實,立即刪除!

相關文章

《AI和人工智能和編程日報》

OpenAI:將深度研究擴展到 ChatGPT Plus、Team、Edu 和 Enterprise 用戶,每月 10 次查詢;Pro 用戶每月有 120 次查詢,ChatGPT 語音模式向免費用戶開放。DeepSeek:R1 大模型宣布降價,調用價格將至四分之一&am…

【音視頻】編解碼相關概念總結

NALU RTP PS流 三者總體關系 NALU在RTP中的應用:視頻流的RTP傳輸通常將NALU作為基本的單元進行傳輸。每個RTP包攜帶一個或多個NALU,這些NALU包含了視頻編碼數據。RTP協議通過其頭部信息(如時間戳、序列號等)幫助接收端重新排列和…

端口映射/內網穿透方式及問題解決:warning: remote port forwarding failed for listen port

文章目錄 需求:A機器是內網機器,B機器是公網服務器,想要從公網,訪問A機器的端口方式:端口映射,內網穿透,使用ssh打洞端口:遇到問題:命令執行成功,但是端口轉發…

11特殊函數

一、遞歸函數 遞歸概念:如果一個函數內部,包含了對自身的調用,則該函數稱為遞歸函數。要點: 只有能被表達為遞歸的問題,才能用遞歸函數解決。遞歸函數必須有一個可直接退出的條件,否則會進入無限遞歸。遞歸…

如何使用useContext進行全局狀態管理?

在 React 中,使用 useContext 進行全局狀態管理是一種有效的方法,尤其在需要在多個組件之間共享狀態時。useContext 允許你在組件樹中傳遞數據,而無需通過每個組件的 props 逐層傳遞。以下是關于如何使用 useContext 進行全局狀態管理的詳細指…

鴻蒙 ArkUI 實現敲木魚小游戲

敲木魚是一款具有禪意的趣味小游戲,本文將通過鴻蒙 ArkUI 框架的實現代碼,逐步解析其核心技術點,包括動畫驅動、狀態管理、音效震動反饋等。 一、架構設計與工程搭建 1.1 項目結構解析 完整項目包含以下核心模塊: ├── entry…

神經性肺纖維的預防方法

神經性肺纖維的預防方法 一、引言 神經性肺纖維化是一種慢性進行性肺部疾病,其病因復雜,包括遺傳、環境等多種因素。該病不僅影響患者的呼吸功能,還可能對神經系統造成損害。因此,預防神經性肺纖維化顯得尤為重要。本文將詳細介…

azure sql 網絡安全組 網絡安全sql注入

🍅 點擊文末小卡片 ,免費獲取網絡安全全套資料,資料在手,漲薪更快 SQL注入 1、原理 針對注入的攻擊行為可描述為通過用戶可控參數中注入SQL語法,破壞原有SQL結構,達到編寫程序意料之外結果的攻擊行為。 其…

【Day50 LeetCode】圖論問題 Ⅷ

一、圖論問題 Ⅷ 1、dijkstra算法 堆優化 采用堆來優化&#xff0c;適合節點多的稀疏圖。代碼如下&#xff1a; # include<iostream> # include<vector> # include<list> # include<queue> # include<climits>using namespace std;class myco…

利用node.js搭配express框架寫后端接口(一)

Node.js 憑借其高效的非阻塞 I/O 操作、事件驅動架構以及輕量級的特點&#xff0c;成為了開發高性能服務器應用的熱門選擇。Express 框架作為 Node.js 上最流行的 Web 應用框架之一&#xff0c;以其簡潔的 API 和豐富的中間件生態系統&#xff0c;極大地簡化了 Web 后端開發流程…

【小白數學】為什么可以用拉格朗日乘子法求函數的極值【二】

我們在上一篇【小白數學】- 為什么可以用拉格朗日乘子法求函數的極值【一】已經介紹了一種較為“嚴謹“的方法來說明為什么拉格朗日乘子法可以幫助我們求具有等式約束條件下的函數的極值。雖然在我們的例子中”等式約束“中只有一個等式。但其實很容易推廣到多個等式約束的情況…

JAVA面試_進階部分_netty面試題

1.BIO、NIO 和 AIO 的區別&#xff1f; BIO&#xff1a;一個連接一個線程&#xff0c;客戶端有連接請求時服務器端就需要啟動一個線程進行處理。線程開銷大。 偽異步 IO&#xff1a;將請求連接放入線程池&#xff0c;一對多&#xff0c;但線程還是很寶貴的資源。 NIO&#x…

考研出分24小時,人類精神狀態圖鑒

2月24日&#xff0c;上午10點起&#xff0c;各省考研初試成績陸續公布&#xff0c;考生們或緊張的輸入準考證號&#xff0c;或抱團等待“審判”。然而更魔幻的還在后頭——下午4點&#xff0c;教育部竟在同一天直接發布了《2025年研考國家分數線》。 不少網友表示&#xff1a;…

川翔云電腦優勢總結

在數字化時代&#xff0c;川翔云電腦依托云計算技術&#xff0c;為用戶解決硬件性能瓶頸問題。川翔云電腦使用云渲碼&#xff1a;【2355】 卓越硬件配置&#xff1a;配備 RTX 3090、48G 顯存的 RTX 4090plus&#xff0c;支持 1 - 8 卡機配置&#xff0c;多卡并行計算能力強&am…

DeepSeek開源周Day4:三連發!突破 AI 訓練瓶頸的立體解決方案,并行計算三劍客DualPipe、EPLB與Profile-data

項目地址&#xff1a; https://github.com/deepseek-ai/DualPipehttps://github.com/deepseek-ai/eplbhttps://github.com/deepseek-ai/profile-data 開源日歷&#xff1a;2025-02-24起 每日9AM(北京時間)更新&#xff0c;持續五天 (4/5)&#xff01; ? ? 一、背景概述 …

基于W2605C語音識別合成芯片的智能語音交互鬧鐘方案-AI對話享受智能生活

隨著科技的飛速發展&#xff0c;智能家居產品正逐步滲透到我們的日常生活中&#xff0c;其中智能鬧鐘作為時間管理的得力助手&#xff0c;也在不斷進化。基于W2605C語音識別與語音合成芯片的智能語音交互鬧鐘&#xff0c;憑借其強大的聯網能力、自動校時功能、實時天氣獲取、以…

Vite與Turbopack現代構建工具架構解析:秒級構建的性能奧秘

引言&#xff1a;傳統構建工具的效能瓶頸 Shopify將前端倉庫遷移至Vite后&#xff0c;HMR更新時間從Webpack的4.2秒縮短至48毫秒。Turbopack在Vercel生產環境測試中&#xff0c;增量構建速度較Webpack快700%。ChromeOS團隊采用Vite后&#xff0c;生產構建從Webpack的17分鐘優化…

網絡基礎知識-2

N個節點完全互聯的網型網即N個節點的無向完全圖&#xff0c;無向完全圖的邊數計算如下&#xff1a;每個節點都要指向其他N-1個節點&#xff0c;但是因為無向兩個節點之間的邊會重復&#xff0c;因此有N(N-1)/2條邊HDLC&#xff08;高級數據鏈路控制協議&#xff09;是一種面向比…

視頻級虛擬試衣技術在淘寶的產品化實踐

作為一種新的商品表現形態&#xff0c;內容幾乎存在于手淘用戶動線全流程&#xff0c;例如信息流種草內容、搜索消費決策內容、詳情頁種草內容等。通過低成本、高時效的AIGC內容生成能力&#xff0c;能夠從供給端緩解內容生產成本高的問題&#xff0c;通過源源不斷的低成本供給…

藍橋備賽(三)- 條件判斷與循環(下)

一、for循環 1.1 for 循環語法形式 for 循環是三種循環中使用最多的 &#xff0c; for 循環的語法形式如下&#xff1a; 1.2 執行流程 for 循環中 &#xff0c; 表達式1&#xff08;初始化&#xff09;只執行一次 &#xff01; 1.3 實踐 練習&#xff1a;使用 for 循環在屏幕…