如何使用HippoRAG增強LLM的記憶

大型語言模型(LLM)已經證明是一種非常寶貴的思考工具。經過大量文本、代碼和其他媒體數據集的訓練,它們能夠創作出接近人類水平的文章、翻譯語言、生成圖像,還能以信息豐富的方式回答人們提出的問題,甚至可以編寫不同類型的創意內容。但是,盡管它們功能強大,即使是最先進的LLM也有一個基本的限制:知識的時效性。它們所“知道”的一切知識都是由所接受的訓練數據決定的,這使它們無法適應新的信息,也無法了解人們的具體需求和偏好。

為了克服這一限制,研究人員開發了檢索增強生成(RAG)。RAG賦予了LLM訪問實時更新的數據存儲的能力。這種對動態外部知識庫的訪問使它們能夠動態地檢索相關信息,并將其合并到他們的響應中。然而,由于這些模型往往依賴于關鍵字匹配,當面對需要跨多個信息源進行關聯的問題時,標準的RAG實現就會遇到挑戰——這是一種被稱為“多跳”?(multi-hop)推理的難題。

受到大腦存儲和提取記憶機制的啟發,研究人員開發了HippoRAG這一新穎的RAG方法,這種方法在生成反應時能夠檢索并整合更具意義的來源。本文將深入剖析HippoRAG的工作原理,探究其在傳統RAG技術之上的優勢,并展望其在人工智能系統中激發全新推理和理解水平的潛力。

在RAG技術存在局限時:尋求更深層次的聯系

在傳統的RAG系統中有兩個關鍵組件:檢索器和生成器。檢索器負責在龐大的文本數據庫(知識庫)中搜尋,這些數據庫可能包括維基百科、企業內部文檔,甚至個人文件。其工作原理是將問題和文檔轉化為數字表示(即嵌入),并利用高效的算法迅速找出與問題嵌入最為相似的文檔。隨后,生成器(通常是一個強大的大型語言模型)將這些檢索到的文檔作為場景,生成一個全面且信息豐富的答案。

例如,如果詢問RAG系統“巴黎的主要旅游景點是什么?”,檢索器將在知識庫中搜索包含巴黎和旅游景點信息的文檔。它可能會從維基百科、旅游博客甚至旅游指南中找到文章。然后LLM將使用這些檢索到的文檔來生成響應,可能列出像埃菲爾鐵塔、盧浮宮博物館和凱旋門這樣的熱門景點。

盡管這款工具功能強大,但當面對需要將多個信息片段串聯起來以解答問題的情況時,傳統的RAG系統往往顯得力不從心——這正是所謂的“多跳”推理難題。假設某人向人工智能助理提問:“我下周去倫敦旅行時應該帶把傘嗎?”為了回答這個問題,助理需從他的日歷中檢索旅行日期,核實這些日期內倫敦的天氣狀況,并考慮他的個人行李偏好(他是習慣隨身攜帶雨傘,還是僅在天氣惡劣時才攜帶?)。然而,傳統的RAG系統往往僅依賴于基礎的關鍵字匹配,可能會找到包含“倫敦”和“雨傘”的文件,但不一定能理解這些文件與他的旅行或其個人行李偏好之間的時間關聯性。

類似地,像“谷歌現任首席執行官(CEO)的出生地是哪個國家的首都?”這樣的問題需要將他的出生地與該國的首都聯系起來——這種聯系可能在任何一份文檔中都不明確。傳統的RAG很難有效地建立這些連接。

HippoRAG:模仿大腦的記憶指數

HippoRAG是一個新的RAG框架,其設計理念來自于人們的大腦如何存儲和檢索記憶。人類的大腦不只是將信息存儲在孤立的單元中,它在不同概念之間建立了豐富的聯系網絡。這種將相關想法聯系起來的能力使得HippoRAG能夠進行復雜的邏輯推理,從而做出推斷,并回答需要將多個來源的信息綜合在一起的復雜問題。

通過模擬大腦的記憶索引機制,HippoRAG展現了其獨特的優勢,為信息檢索和推理領域帶來了新的可能性。

受HippoRAG啟發的海馬體索引理論為大腦中的這種工作方式提供了一個模型:

  • 新皮質:作為大腦中負責“思考”的部分,負責處理感官信息和存儲復雜知識。這類似于HippoRAG中的LLM。
  • 海馬體:大腦深處的一個區域,就像記憶的“索引”。它本身并不存儲完整的記憶,但它在存儲在新皮層中的不同信息片段之間建立了聯系(關聯)。可以把它想象成一個概念之間聯系的心理地圖。這就是知識圖譜在HippoRAG中的作用。

當體驗到新事物時,大腦皮層就會處理,海馬體會在相關概念之間建立聯系,形成記憶痕跡。當在今后回憶起那段經歷的一部分時,海馬體會激活相關的聯系,觸發從新皮質提取完整的記憶。

為LLM構建更好的記憶

HippoRAG模仿這種受大腦啟發的模型,為LLM提供了更復雜的記憶系統。以下探討HippoRAG是如何運作的:

1.建立海馬指數

HippoRAG使用LLM從知識庫中提取關鍵概念和關系,構建知識圖,其中節點表示概念,邊表示概念之間的關系。這個知識圖譜就像海馬體,儲存著想法之間的聯系。

以下是示例中知識圖譜的簡化表示:

  • 節點:表示實體和概念:“倫敦”、“英國”、“天氣”、“不可預測”、“雨傘”、“保護”、“雨”、“旅行”、“下周”、“周一”、“周五”、“輕裝”、“我”等。
  • 邊:表示節點之間的關系:“倫敦”-[是首都]->“英國”,“倫敦”-[以]->“不可預測的天氣”而聞名,“雨傘”-[提供]->“保護”,“保護”-[從]->“雨”,“旅行”-[目的地]->“倫敦”,“旅行”-[時間]->“下周”,“下周”-[包括]->“星期一”,“下周”-[包括]->“星期五”,“我”-[偏好]->“輕裝”,等等。
2.個性化PageRank的查詢時間推理

給定一個新問題,LLM識別關鍵實體,并將它們映射到知識圖中的節點。然后,HippoRAG使用一種稱為個性化PageRank (PPR)的算法來探索知識圖譜,在相關節點上傳播激活。這就像海馬體激活了相關的記憶痕跡。PPR允許HippoRAG從遠離原始實體的多“跳”中有效地收集信息,在一個步驟中捕獲多跳關系。在以下示例中:

  • 實體識別:與之前一樣,LLM識別問題中的關鍵實體:“雨傘”、“旅行”和“倫敦”。
  • 知識圖譜上的PPR:從代表這些實體的節點開始,PPR探索知識圖譜,在相關節點之間傳播激活。它考慮邊緣的強度和方向來確定不同路徑的相關性。

在例子中:PPR可能會高度激活通往“雨”、“變幻莫測的天氣”和“保護”等節點的路徑,因為它們與“倫敦”和“雨傘”有聯系。

3.單步檢索

然后檢索最高度激活的節點(以及知識庫中與它們相關的文本塊)。這為LLM提供了回答問題所需的信息,包括概念之間的關鍵聯系。

在示例中,這可能包括原始示例中的文本塊1、2和3。

4.使用LLM生成答案

LLM現在已經掌握了謎題的所有部分——原始問題、檢索到的知識(通過基于圖的連接豐富)和任何額外的實時信息。它可以利用這些更豐富的知識來提供更細致、更準確的答案。

在例子中:

  • 組合輸入:LLM接收原始問題、檢索到的知識(現在已通過基于圖的連接得到豐富)以及倫敦在旅行日期的實時天氣預報。
  • 增強推理:LLM現在可以利用更豐富的知識來提供更細致、更準確的答案。它不僅知道倫敦的天氣變幻莫測,而且還知道雨傘可以防雨,而且知道行程安排在可能下雨的時間。

從多跳到尋徑:人工智能記憶的未來

HippoRAG背后的研究人員證明,它在多跳推理任務上明顯優于標準的RAG方法。但這種方法的含義遠遠超出了簡單的問題回答。

由HippoRAG實現的“尋徑”檢索概念尤其令人興奮。想象一下,人工智能系統不僅可以檢索信息,還可以發現概念之間的新聯系,即使這些聯系沒有在數據中明確說明。這將改變科學發現、法律推理和個性化推薦等領域的游戲規則,在這些領域,建立新聯系的能力是必不可少的。

雖然HippoRAG面臨著擴展到大規模知識圖譜和管理概念-場景權衡等挑戰,但它代表了構建具有更類似人類記憶能力的LLM的重大飛躍。隨著人們繼續探索神經科學和人工智能的交叉點,正在接近創造能夠像人類大腦一樣學習、記憶和推理的深度和靈活性的人工智能系統。

本文來自互聯網用戶投稿,該文觀點僅代表作者本人,不代表本站立場。本站僅提供信息存儲空間服務,不擁有所有權,不承擔相關法律責任。
如若轉載,請注明出處:http://www.pswp.cn/web/40842.shtml
繁體地址,請注明出處:http://hk.pswp.cn/web/40842.shtml
英文地址,請注明出處:http://en.pswp.cn/web/40842.shtml

如若內容造成侵權/違法違規/事實不符,請聯系多彩編程網進行投訴反饋email:809451989@qq.com,一經查實,立即刪除!

相關文章

SQLite 附加數據庫

SQLite 附加數據庫 SQLite 是一種輕量級的數據庫管理系統,因其小巧、快速和易于使用而廣受歡迎。在 SQLite 中,可以將多個數據庫文件附加到單個數據庫連接中,從而允許用戶在不同的數據庫之間輕松切換和操作數據。本文將詳細介紹如何在 SQLite 中附加數據庫,并探討其使用場…

CANopen協議開發梳理總結筆記教程

0、提醒 CANOpen使用時,需要清楚什么是大端和小端,這對于CANOpen數據發送及解析時,有很大的幫助。且學習開發CANOpen時,需要具備一定的CAN基礎。 1、CANOpen協議介紹 ①、什么是CANOpen協議 CANOpen協議是一種架構在控制局域網絡…

基于CLIP特征的多模態大模型中的視覺短板問題

【論文極速讀】 基于CLIP特征的多模態大模型中的視覺短板問題 FesianXu 20240706 at Tencent WeChat search team 前言 今天讀到篇CVPR 24’的論文 [1],討論了常見的多模態大模型(大多都基于CLIP語義特征,以下簡稱為MLLM)中的視覺…

若依 / ruoyi-ui:執行yarn dev 報錯 esnext.set.difference.v2.js in ./src/utils/index.js

一、報錯信息 These dependencies were not found: * core-js/modules/esnext.set.difference.v2.js in ./src/utils/index.js * core-js/modules/esnext.set.intersection.v2.js in ./src/utils/index.js * core-js/modules/esnext.set.is-disjoint-from.v2.js in ./src/utils…

Python處理表格數據常用的 N+個操作

Python作為一種強大且易用的編程語言,其在數據處理方面表現尤為出色。特別是當我們面對大量的表格數據時,Python的各類庫和工具可以極大地提高我們的工作效率。以下,我將詳細介紹Python處理表格數據常用的操作。 首先,我們需要安…

2024.7.5總結

今晚的總結是在圖書館前的梯子上寫的,我多次輾轉,可能是我最后一次看看這個學校了,明天就要踏上回家的旅途了。還有半個月入職,干脆回家看看,畢竟,工作以后機會不多了。 下午的時候,用順豐寄了…

復現YOLO_ORB_SLAM3_with_pointcloud_map項目記錄

文章目錄 1.環境問題2.遇到的問題2.1編譯問題1 monotonic_clock2.2 associate.py2.3 associate.py問題 3.運行問題 1.環境問題 首先環境大家就按照github上的指定環境安裝即可 環境怎么安裝網上大把的資源,自己去找。 2.遇到的問題 2.1編譯問題1 monotonic_cloc…

ASP.NET Core----基礎學習01----HelloWorld---創建Blank空項目

文章目錄 1. 創建新項目--方式一: blank2. 程序各文件介紹(Project name :ASP.Net_Blank)(1)launchSettings.json 啟動方式的配置文件(2)appsettings.json 基礎配置file參數的讀取&a…

ChatGPT:SpringBoot解決跨域問題方法-手動設置請求頭

ChatGPT:SpringBoot解決跨域問題方法-手動設置請求頭 這里的設置響應頭是為了發送請求方還是接收請求方 設置響應頭是為了發送請求方。具體來說,添加 Access-Control-Allow-Origin 頭部是為了告訴瀏覽器,哪些域名可以訪問資源。當設置為 * 時…

Java求自然常數e的近似值(課堂實例1)

??引言🎃🎃 ?點關注編程夢想家(大學生版)-CSDN博客不迷路~~~~~~? 自然常數 𝑒e 是數學中一個非常重要的常數,約等于 2.71828,它在自然對數、復合利息計算等領域有著廣泛的應用。本文將介紹如…

自動批量將阿里云盤文件發布成WordPress文章腳本源碼(以RiPro主題為例含付費信息下載地址SEO等自動設置)源碼

背景 很多資源下載站,付費資源下載站,付費內容查看等都可以用WordPress站點發布內容,這些站點一般會基于一個主題,付費信息作為文章附屬的信息發布,底層存儲在WP表里,比如日主題,子比主題等。 …

掌握IPython的`%%debug`:深入交互式調試的藝術

IPython是一個功能豐富的交互式Python解釋器,它為Python開發者提供了許多便捷的功能,其中之一就是%%debug魔法命令。%%debug是IPython提供的一種快速進入調試模式的方法,它允許用戶在代碼執行出錯時立即開始調試,而無需單獨啟動調…

Apache Seata tcc 模塊源碼分析

本文來自 Apache Seata官方文檔,歡迎訪問官網,查看更多深度文章。 本文來自 Apache Seata官方文檔,歡迎訪問官網,查看更多深度文章。 一 .導讀 spring 模塊分析中講到,Seata 的 spring 模塊會對涉及到分布式業務的 b…

《夢醒蝶飛:釋放Excel函數與公式的力量》9.2 FV函數

9.2 FV函數 FV函數是Excel中用于計算投資或貸款在若干期后的未來值的函數。它是一個非常實用的財務函數,能夠幫助我們快速計算投資的最終價值或貸款的期末余額。 9.2.1 函數簡介 FV函數用于計算基于定期固定支付和固定利率的投資或貸款的未來值。未來值是指在一定…

cs224n作業3 代碼及運行結果

代碼里要求用pytorch1.0.0版本,其實不用也可以的。 【刪掉run.py里的assert(torch.version “1.0.0”)即可】 代碼里面也有提示讓你實現什么,弄懂代碼什么意思基本就可以了,看多了感覺大框架都大差不差。多看多練慢慢來,加油&am…

中英雙語介紹美國的州:阿肯色州(Arkansas)

中文版 阿肯色州簡介 阿肯色州(Arkansas)位于美國南部,以其多樣的自然景觀、豐富的文化遺產和不斷發展的經濟而聞名。以下是對阿肯色州的詳細介紹,包括其地理位置、人口、經濟、教育、文化和主要城市。 地理位置 阿肯色州東臨…

文件、文本閱讀與重定向、路徑與理解指令——linux指令學習(一)

前言:本節內容標題雖然為指令,但是并不只是講指令, 更多的是和指令相關的一些原理性的東西。 如果友友只想要查一查某個指令的用法, 很抱歉, 本節不是那種帶有字典性質的文章。但是如果友友是想要來學習的,…

PD虛擬機怎么聯網?PD虛擬機安裝Win11無法上網 pd虛擬機連不上網怎么解決 mac安裝windows虛擬機教程

PD虛擬機既可以聯網使用,也可以單機使用。如需將PD虛擬機聯網,可以共享Mac原生系統的網絡,其使用體驗與真實系統無異。本文會詳細講解PD虛擬機如何聯網,并會進一步解決PD虛擬機安裝Win10無法上網的問題。 如果有網絡相關問題的小伙…

游戲服務器搭建選VPS還是專用服務器?

游戲服務器搭建選VPS,VPS能夠提供控制、性能和穩定性。它不僅僅是讓游戲保持活力。它有助于減少延遲問題,增強您的游戲體驗。 想象一下:你正沉浸在一場游戲中。 勝利在望。突然,屏幕卡住——服務器延遲。 很崩潰,對…

C語言實現【程序設計與實踐】實驗三:自動售貨機

聲明:著作權歸作者所有。商業轉載請聯系作者獲得授權,非商業轉載請注明出處。 附上c版http://t.csdnimg.cn/BbDSL https://blog.csdn.net/As_sBomb/article/details/105485940 實驗三:自動售貨機 題目: 圖所示為簡易自動售貨…