HippoRAG如何從大腦獲取線索以改進LLM檢索

知識存儲和檢索正在成為大型語言模型(LLM)應用的重要組成部分。雖然檢索增強生成(RAG)在該領域取得了巨大進步,但一些局限性仍然沒有克服。

俄亥俄州立大學和斯坦福大學的研究團隊推出了HippoRAG,這是一種創新性的檢索框架,其設計理念源于人類長期記憶系統中的海馬索引理論。

HippoRAG的引入使大型語言模型(LLM)應用程序能夠更有效地集成動態知識,并更快、更準確地檢索重要信息。HippoRAG在多跳(multi-hop)問答等任務上表現出令人印象深刻的性能,對于需要對大型復雜知識圖進行組裝和推理的LLM應用程序非常有用。

LLM知識整合的挑戰

哺乳動物的大腦可以儲存大量的知識,并在不丟失以前經驗的情況下不斷整合新經驗。這種長期記憶系統允許人類不斷更新他們用于推理和決策的知識。

相比之下,LLM在預訓練后的知識整合仍然很困難。雖然RAG已經成為LLM中長期記憶的主流解決方案,但現有的方法在處理新文檔時往往采取單獨編碼的方式,這使得不同來源的知識難以有效集成。

許多應用程序需要跨多個文檔進行知識集成。例如,科學文獻綜述、法律案例簡報和醫學診斷需要將不同來源中提到的事實和概念相互關聯。標準的多跳問答也需要整合各種文檔的多個段落之間的信息。

為了完成這些任務,當前的RAG系統使用多個檢索和生成步驟來連接不同的段落。然而,即使執行了多步RAG,對于許多知識集成場景來說,也往往是不夠的。

HippoRAG

HippoRAG從大腦中的新皮層和海馬體之間的生物相互作用中獲得靈感,這種相互作用使強大的基于場景的、不斷更新的人類大腦記憶成為可能。

根據科學研究,大腦皮層負責處理和存儲實際的記憶表征,而海馬體則擁有一組相互關聯的索引,這些索引指向新皮層中的記憶單元,并儲存它們之間的關聯性。這兩個關鍵組成部分共同協作,執行“模式分離”和“模式完成”的功能,前者確保不同經歷的表征具有獨特性,后者則讓從部分刺激中檢索完整記憶成為可能。

HippoRAG通過使用LLM將文檔語料庫轉換為充當人工海馬索引的知識圖來模仿這種記憶模型。HippoRAG分為兩個階段,離線索引用于存儲信息,在線檢索用于將知識整合到用戶請求中。

離線索引階段類似于大腦中的記憶編碼,使用指令調優的LLM以知識圖三元組的形式從段落中提取重要特征。與傳統的RAG管道中使用的密集嵌入相比,這允許更細粒度的模式分離。

人工海馬索引是在檢索語料庫中得到的三元組的基礎上建立的開放知識圖譜。為了連接這些組件,HippoRAG使用現成的密集編碼器進行檢索,這些編碼器在知識圖中相似的名詞短語之間提供額外的邊緣,以幫助下游模式完成連接。編碼器有助于使系統更有彈性和靈活性,因為相同的知識可以用稍微不同的方式表達。

在線檢索過程反映了大腦的記憶檢索過程。LLM從用戶查詢中提取顯著的命名實體,然后根據檢索編碼器確定的相似性將其鏈接到知識圖中的節點。然后,HippoRAG使用個性化PageRank算法,這是PageRank的一個版本,它使用一組用戶定義的源節點在圖中分布概率。這種約束使HippoRAG能夠將其輸出限制為前一步中選擇的候選查詢節點集。然后將結果應用于索引的段落,以選擇它們進行檢索。

HippoRAG的實際應用

研究人員在兩項具有挑戰性的多跳問答基準測試(MuSiQue和2WikiMultiHopQA)以及HotpotQA數據集上,對HippoRAG的檢索能力進行了全面的評估。他們將其與幾種強大的檢索方法和最近的LLM增強基線進行了比較。

評估結果表明,?HippoRAG在單步檢索上優于所有其他方法,包括那些基于LLM增強的基線模型。與多步驟檢索方法IRCoT相結合時,HippoRAG在相同的數據集上提供高達20%的互補增益。

HippoRAG的一個主要優點是它能夠在一個步驟中執行多跳檢索。其在線檢索過程的成本與目前的迭代檢索方法(例如IRCoT)相比低10到30倍,快6到13倍,同時實現了相當的性能。

研究人員在報告中寫道:“我們提出的神經生物學原理方法雖然簡單,但已經顯示出克服標準RAG系統固有局限性的巨大潛力,同時保留了它們相對于參數記憶的優勢。HippoRAG在路徑跟蹤多跳QA和路徑發現多跳QA方面的卓越表現,以及其顯著的效率提升和持續更新的能力,使其成為了連接標準RAG方法和參數化記憶之間的強大中間框架,為LLM中的長期記憶問題提供了令人信服的解決方案。”

研究人員承認,為了進一步改進HippoRAG,還需要克服一些局限性,例如對其組件進行微調,并進一步驗證其對更大知識圖譜的可擴展性。然而,當前的研究結果已經證明了神經生物學啟發的方法在推進LLM知識整合方面的潛力,并使他們能夠對非結構化信息進行更復雜的推理。

知識圖譜和LLM的結合是一個非常強大的工具,可以解鎖許多應用程序。GNN-RAG是一種將圖神經網絡(GNN)和知識圖與LLM相結合的創新方法,已被證明可以解決許多經典RAG無法解決的復雜推理問題。而將GNN引入HippoRAG可能是未來探索的一個有趣方向。

本文來自互聯網用戶投稿,該文觀點僅代表作者本人,不代表本站立場。本站僅提供信息存儲空間服務,不擁有所有權,不承擔相關法律責任。
如若轉載,請注明出處:http://www.pswp.cn/diannao/44134.shtml
繁體地址,請注明出處:http://hk.pswp.cn/diannao/44134.shtml
英文地址,請注明出處:http://en.pswp.cn/diannao/44134.shtml

如若內容造成侵權/違法違規/事實不符,請聯系多彩編程網進行投訴反饋email:809451989@qq.com,一經查實,立即刪除!

相關文章

數學建模美賽論文文檔

目錄 1. 摘要:1.1 閱讀并理解題目1.2 背景介紹1.3 問題提出 2. 目錄:2.1 引言(Introduction)2.2 假設與合理性說明(Assumptions and Justifications)2.3 符號說明(Notations)2.4 模型…

2.Date類型的請求參數

前端 <el-form-item label"結束日期" prop"endTime"><el-date-pickerv-model"dataForm.endTime"type"date"value-format"yyyy-MM-dd HH:mm:ss"placeholder"選擇日期"></el-date-picker></el…

線下線上游戲電競陪伴APP小程序H5同城線下約玩APP開發,語聊約玩平臺搭建游戲陪玩APP源碼

開發一款線下陪玩約玩APP的實際意義和在生活中的應用場景 1、滿足社交需求:現代社會人們的社交圈往往受到時間、地點和其他限制的影響。線下陪玩約玩APP可以提供一個平臺&#xff0c;讓用戶通過約玩的方式結識新朋友、擴大社交圈 2、解決孤獨感:有些人由于工作忙碌、居住環境單…

論文閱讀2-《Dynamic Multimodal Fusion》

摘要 &#xff08;DynMM&#xff09;&#xff0c;一種新的方法&#xff0c;自適應融合多模態數據和 d在推理過程中生成依賴于數據的前向路徑。為此&#xff0c;我們提出了一種門控功能來提供基于多模態特征和一個的模態級或融合級決策提高計算效率的源感知損失函數。 細節 模…

185240-00G 同軸連接器

型號簡介 185240-00G是Southwest Microwave的2.92 mm連接器。該連接器采用鈹銅合金、工具鋼和不銹鋼等優質材料&#xff0c;并經過金鍍層和鈍化處理&#xff0c;確保其穩定可靠&#xff0c;經久耐用。它還兼容歐盟 RoHS 和 WEEE 指令&#xff0c;是一位環保使者&#xff0c;致力…

AI繪畫Midjourney從入門到實戰應用

大家好&#xff0c;我是愛編程的喵喵。雙985碩士畢業&#xff0c;現擔任全棧工程師一職&#xff0c;熱衷于將數據思維應用到工作與生活中。從事機器學習以及相關的前后端開發工作。曾在阿里云、科大訊飛、CCF等比賽獲得多次Top名次。現為CSDN博客專家、人工智能領域優質創作者。…

概率論習題

泊松分布習題 假設你在醫院值班&#xff0c;每天需要安保人員出動的次數N~P(1),則關于任一天安保人員出動次數&#xff1a; A&#xff1a;出動一次的概率是多少 B&#xff1a;出動次數小于等于一次的概率為 C&#xff1a;出動次數小于一次的概率為 D&#xff1a;若隨機事件發生…

C# 裝飾器模式(Decorator Pattern)

裝飾器模式動態地給一個對象添加一些額外的職責。就增加功能來說&#xff0c;裝飾器模式相比生成子類更為靈活。 // 組件接口 public interface IComponent { void Operation(); } // 具體組件 public class ConcreteComponent : IComponent { public void Opera…

AI推薦系統落地的實現與應用

目錄 一、推薦系統的基礎二、推薦系統的設計與實現三、推薦系統落地的挑戰四、推薦系統的成功案例五、結語 AI推薦系統近年來在各個領域得到了廣泛應用&#xff0c;從電子商務到娛樂&#xff0c;再到個性化學習平臺。它們通過分析用戶行為、偏好和歷史數據&#xff0c;為用戶提…

【NOI-題解】1108 - 正整數N轉換成一個二進制數1290 - 二進制轉換十進制1386 - 小麗找半個回文數1405 - 小麗找潛在的素數?

文章目錄 一、前言二、問題問題&#xff1a;1108 - 正整數N轉換成一個二進制數問題&#xff1a;1290 - 二進制轉換十進制問題&#xff1a;1386 - 小麗找半個回文數問題&#xff1a;1405 - 小麗找潛在的素數&#xff1f; 三、感謝 一、前言 本章節主要對進制轉換的題目進行講解…

ubuntu下aarch64-linux-gnu(交叉編譯) gdb/gdbserver

ubuntu下aarch64-linux-gnu(交叉編譯) gdb/gdbserver gdb是一款開源的、強大的、跨平臺的程序調試工具。主要用于在程序運行時對程序進行控制和檢查&#xff0c;如設置斷點、單步執行、查看變量值、修改內存數據等&#xff0c;從而幫助開發者定位和修復代碼中的錯誤。 gdbserve…

密態計算,大模型商用數據瓶頸的新解法?

大數據產業創新服務媒體 ——聚焦數據 改變商業 大模型邁向產業的深度應用&#xff0c;首要挑戰是高質量數據供給和安全流通。正如在今年的世界人工智能大會上&#xff0c;產學研屆多位專家達成的共識是&#xff0c;數據決定了AI能力的上限。 在實踐中&#xff0c;行業大模型難…

C#創建windows服務程序

步驟 1: 創建Windows服務項目 打開Visual Studio。選擇“創建新項目”。在項目類型中搜索“Windows Service”并選擇一個C#模板&#xff08;如“Windows Service (.NET Framework)”&#xff09;&#xff0c;點擊下一步。輸入項目名稱、位置和其他選項&#xff0c;然后點擊“創…

Pyecharts繪制熱力圖的說明+代碼實戰

引言 熱力圖在數據可視化中是一種強大的工具&#xff0c;可以直觀地展示數據的分布情況和變化趨勢。Pyecharts是一個基于Echarts的Python可視化庫&#xff0c;提供了豐富的圖表類型&#xff0c;包括熱力圖。在本文中&#xff0c;我們將深入探討Pyecharts繪制多種炫酷熱力圖的參…

Qt 創建的窗口一閃而過【已解決】

Qt 創建的窗口一閃而過 引言一、詳細的解決方案 - 附代碼二、參考博文 引言 創建的窗口一閃而過&#xff0c;就是創建完立馬被銷毀了&#xff0c;常見情況是在一個函數中創建窗口并show() - 即創建在了棧上&#xff0c;函數結束局部變量(窗口)自動被釋放。主流的解決方法有兩種…

如何使用css把input框的number屬性的右側小按鈕去掉

在HTML中&#xff0c;當<input>元素的type屬性被設置為number時&#xff0c;瀏覽器通常會默認顯示一個小的上下箭頭按鈕&#xff08;通常位于輸入框的右側&#xff09;&#xff0c;用于允許用戶通過點擊增加或減少輸入的值。然而&#xff0c;有時候為了設計的一致性或其他…

C語言快速入門

Linux C 的編譯流程 C 編譯器 gcc GNUmsvc windowsclang 蘋果intel…cc 默認Linux c語言編譯器 程序設計語言分類 編譯型 C、C、java 把源代碼轉換成機械指令&#xff08;X86 電腦、ARM 手機&#xff09;編譯做了類型安全檢查&#xff0c;安全性能高靈活差 解釋型 Python、…

三生隨記——毛巾的詛咒

在一個沉悶的傍晚&#xff0c;李明拖著疲憊的身軀回到了家中。一整天的工作讓他精疲力竭&#xff0c;此刻他只想趕緊洗個熱水澡&#xff0c;然后躺在舒適的床上&#xff0c;好好放松一下。 走進浴室&#xff0c;他打開淋浴&#xff0c;溫暖的水流傾灑在身上&#xff0c;疲憊感…

Oracle 利用觸發器鎖住代碼防止他人改動

利用觸發器鎖住自己的代碼防止他人改動 create or replace trigger LockSourcebeforecreateon SCHEMA declare beginif SYS_CONTEXT(USERENV,OS_USER) 自己的機器名thenreturn;end if;if ora_dict_obj_name in (xxxx1_PACKAGE,xxxx2_PACKAGE)thenraise_application_error(-2…

每日刷題(二分查找,匈牙利算法,逆序對)

目錄 1.Sarumans Army 2.Catch That Cow 3.Drying 4.P3386 【模板】二分圖最大匹配 5. Swap Dilemma 1.Sarumans Army 3069 -- Sarumans Army (poj.org) 這道題就是要求我們在給的的位置放入 palantir&#xff0c;每個 palantir有R大小的射程范圍&#xff0c;要求求出最少…