論文淺嘗 | HOLMES:面向大語言模型多跳問答的超關系知識圖譜方法(ACL2024)

筆記整理:李曉彤,浙江大學碩士,研究方向為大語言模型

論文鏈接:https://arxiv.org/pdf/2406.06027

發表會議:ACL 2024

1. 動機

多跳問答(Multi-Hop Question Answering, MHQA)技術近年來在自然語言處理領域引起了廣泛關注,尤其是在大規模語言模型(LLMs)用于問答任務的背景下。然而,面對復雜的多跳問題時,現有的LLMs表現不盡如人意,其主要原因在于:理解復雜問題所需的信息篩選和上下文聚合存在很大的挑戰。為了緩解這一問題,研究人員嘗試結合結構化知識圖譜(KG)來簡化信息,但這仍不足以應對復雜、多跳問題的挑戰,因為這些方法通常缺乏上下文依賴性和對查詢的具體化。因此,本文提出了一種超關系(Hyper-Relational)知識圖譜,以更有效地輔助LLMs進行多跳問答任務。

2. 貢獻

本文的主要貢獻有:

(1)?引入了一種新的多跳問答方法,通過將非結構化文本轉換為基于查詢產生的超關系知識圖譜來簡化信息處理。

(2)?實驗表明,該方法在多個數據集上顯著提升了多跳問答的性能。具體而言,在HotpotQA數據集上提升了18.7%和20%的EM分數,而在MuSiQue數據集上提升了26%和14.3%。

(3)?相較于現有技術(SoTA)方法,利用本文的查詢聚焦的超關系知識圖能夠減少67%的標記使用,從而提高信息效率。

3. 方法

該方法的關鍵思想是識別包含多跳問題答案的文檔子集,隨后從它們中提取上下文感知的結構化信息,進一步使用基于查詢的schema來完善信息,以保留與查詢相關的信息。

3.1?與查詢相關的結構化知識發現

從支持文檔中提取指定的實體。然后,在文檔和實體節點之間建立邊緣,形成了一個兩分圖,該圖捕獲了實體與它們出現的文檔之間的連接,通過層次遍歷來探索相關的潛在語義圖,并利用LLMs生成知識圖譜三元組,再將其轉換為超關系四元組。

3.2?信息精煉的知識架構構建

為了消除超關系圖中與檢索無關的信息,作者構建了一個與查詢對準的知識模式,圖模式使用兩個來源填充:通過識別推理查詢中的關系得出模式元素,然后使用LLMs估算每個關系中的主題和對象實體類型;使用其他領域特定的關系豐富了知識模式,以幫助多跳的推理。然后執行改進步驟中的完善步驟。根據問題和領域內的知識構建查詢對齊的知識架構,用其對超關系知識圖進行裁剪,保留與查詢相關的信息。

3.3 LLM的提示構建

將裁剪后的超關系圖譜進行語言化處理,并根據與查詢的相關性排序,形成輸入提示。由于結構化信息提取是一個未解決的問題,因此在輸入圖中可能會遺漏一些相關的細節。為了減輕這種情況,作者還在提示構建中包含了一個驗步驟。如果LLM識別輸入圖中缺少有關特定命名實體集的事實,則指示它列出缺失的命名實體。重新從Entity-Document圖中獲取相應的文檔,并將它們與初始相關事實集成在一起。此過程不僅豐富了LLM的輸入,而且還確保檢索任何缺失的查詢信息,從而提高了系統響應的準確性。

4. 實驗

通過兩個基準數據集HotpotQA和MuSiQue的驗證,使用GPT-3.5、GPT-4等最先進的語言模型,證明了本文方法在多跳問答任務中的顯著優越性能。在主要的評價指標(EM、F1、Precision、Recall等)上,該方法在這些數據集上均取得了優于基線方法的結果。

同時,為了衡量LLM提供答案時的信心,還引入了“自知精確匹配”(Self-Aware EM)這一新的評價指標。實驗結果顯示,相較于其他基線方法,HOLMES方法在自知EM分數上具有更高的表現,在多個數據集和各種LLM模型中均實現了一致的改進。

5. 總結

本文提出了一種基于超關系知識圖譜的方法來提升多跳問答的效果,通過減小信息噪聲、對相關事實進行精煉及利用LLMs的強大推理能力來解決復雜的自然語言問題。通過一系列實驗驗證,該方法成功地在具有代表性的問答數據集中實現了先進的性能。此外,幾乎所有處理步驟都是零訓練的,使得該系統在沒有大量標注數據的情況下也能表現優異。總之,HOLMES方法為多跳問答任務提供了更為精確和高效的解決方案,標志著在該領域的一次顯著進步。未來的研究方向可能會圍繞增強模型的上下文理解能力及進一步減少信息處理的冗余展開。


OpenKG

OpenKG(中文開放知識圖譜)旨在推動以中文為核心的知識圖譜數據的開放、互聯及眾包,并促進知識圖譜算法、工具及平臺的開源開放。

點擊閱讀原文,進入 OpenKG 網站。

本文來自互聯網用戶投稿,該文觀點僅代表作者本人,不代表本站立場。本站僅提供信息存儲空間服務,不擁有所有權,不承擔相關法律責任。
如若轉載,請注明出處:http://www.pswp.cn/diannao/83273.shtml
繁體地址,請注明出處:http://hk.pswp.cn/diannao/83273.shtml
英文地址,請注明出處:http://en.pswp.cn/diannao/83273.shtml

如若內容造成侵權/違法違規/事實不符,請聯系多彩編程網進行投訴反饋email:809451989@qq.com,一經查實,立即刪除!

相關文章

機器學習中的特征工程:解鎖模型性能的關鍵

在機器學習領域,模型的性能往往取決于數據的質量和特征的有效性。盡管深度學習模型在某些任務中能夠自動提取特征,但在大多數傳統機器學習任務中,特征工程仍然是提升模型性能的關鍵環節。本文將深入探討特征工程的重要性、常用方法以及在實際…

Kotlin與Java的融合趨勢:從互操作到云原生實踐

在2025年的軟件開發領域,Kotlin和Java作為JVM生態的支柱語言,展現出強大的協同能力。Kotlin以其簡潔的語法和現代特性迅速崛起,而Java憑借其成熟生態和穩定性依然占據主導地位。通過兩者的融合,我們的實時聊天系統將開發效率提升了…

Python生成器:高效處理大數據的秘密武器

生成器概述 生成器是 Python 中的一種特殊迭代器,通過普通函數的語法實現,但使用 yield 語句返回數據。生成器自動實現了 __iter__() 和 __next__() 方法,因此可以直接用于迭代。生成器的核心特點是延遲計算(lazy evaluation&…

Flask框架入門與實踐

Flask框架入門與實踐 Flask是一個輕量級的Python Web框架,以其簡潔、靈活和易于上手的特點深受開發者喜愛。本文將帶您深入了解Flask的核心概念、基本用法以及實際應用。 什么是Flask? Flask是由Armin Ronacher于2010年開發的微型Web框架。與Django等…

數學復習筆記 14

前言 和家里人交流了一下,他們還是希望我全力以赴初試,我確實也得放開了干,不要束手束腳的。好好加油。感覺公共課都沒有啥壓力,主要是專業課要好好加油,真不能過不了線,要是過不了線,啥都白搭…

金格iWebOffice控件在新版谷歌Chrome中不能加載了怎么辦?

金格iWebOffice控件是由江西金格網絡科技有限責任公司開發的中間件軟件,主要用于在瀏覽器中直接編輯Word、Excel、PowerPoint等Office文檔,曾經是一款優秀國產的WebOffice插件。 由于2022年Chrome等瀏覽器取消支持PPAPI接口,導致這款金格iWe…

ChatGPT 能“記住上文”的原因

原因如下 你把對話歷史傳給了它 每次調用 OpenAI 接口時,都會把之前的對話作為參數傳入(messages 列表),模型“看見”了之前你說了什么。 它沒有長期記憶 它不會自動記住你是誰或你說過什么,除非你手動保存歷史并再次…

微信小程序van-dialog確認驗證失敗時阻止對話框的關閉

使用官方(Vant Weapp - 輕量、可靠的小程序 UI 組件庫)的before-close&#xff1a; wxml&#xff1a; <van-dialog use-slot title"名稱" show"{{ show }}" show-cancel-button bind:cancel"onClose" bind:confirm"getBackInfo"…

K8S Ingress、IngressController 快速開始

假設有如下三個節點的 K8S 集群&#xff1a; ? k8s31master 是控制節點 k8s31node1、k8s31node2 是工作節點 容器運行時是 containerd 一、理論介紹 1&#xff09;什么是 Ingress 定義&#xff1a;Ingress 是 Kubernetes 中的一種資源對象&#xff0c;它定義了外部訪問集群內…

Vue3 + Element Plus 動態表單實現

完整代碼 <template><div class"dynamic-form-container"><el-formref"dynamicFormRef":model"formData":rules"formRules"label-width"auto"label-position"top"v-loading"loading"&g…

Mac修改hosts文件方法

Mac修改hosts文件方法 在 macOS 上修改 hosts 文件需要管理員權限 步驟 1&#xff1a;打開終端 通過 Spotlight 搜索&#xff08;Command 空格&#xff09;輸入 Terminal&#xff0c;回車打開。或進入 應用程序 > 實用工具 > 終端。 步驟 2&#xff1a;備份 hosts 文件…

深度學習—BP神經網絡

文章目錄 [TOC](文章目錄) 一、基本概念二、 網絡結構三、BP神經網絡的原理總結特點&#xff1a;應用場景優缺點 一、基本概念 BP 神經網絡&#xff08;Backpropagation Neural Network&#xff09;是一種基于誤差反向傳播算法的多層前饋神經網絡&#xff0c;由輸入層、隱藏層…

Spring AI(6)——向量存儲

向量數據庫是一種特殊類型的數據庫&#xff0c;在 AI 應用中發揮著至關重要的作用。 在向量數據庫中&#xff0c;查詢與傳統關系型數據庫不同。它們執行的是相似性搜索&#xff0c;而非精確匹配。當給定一個向量作為查詢時&#xff0c;向量數據庫會返回與該查詢向量“相似”的…

Qt功能區:簡介與安裝

Qt功能區 1. 功能區簡介2. SARibbon2.1 簡介2.2 編譯與安裝采用CMake-gui進行編譯采用VS進行編譯安裝與使用 Qt 官方不支持 Ribbon 風格&#xff08;Ribbon UI 風格是微軟開創的&#xff0c;具有專利許可協議&#xff0c;許可協議對從構建 UI 的指令到每個按鈕間的空格數都做了…

iOS safari和android chrome開啟網頁調試與檢查器的方法

手機開啟遠程調試教程&#xff08;適用于 Chrome / Safari&#xff09; 前端移動端調試指南&#xff5c;適用 iPhone 和 Android&#xff5c;WebDebugX 出品 本教程將詳細介紹如何在 iPhone 和 Android 手機上開啟網頁檢查器&#xff0c;配合 WebDebugX 實現遠程調試。教程包含…

Golang企業級商城高并發微服務實戰

Golang企業級商城高并發微服務實戰包含內容介紹&#xff1a; 從零開始講了百萬級單體高并發架構、千萬級微服務架構&#xff0c;其中包含Rpc實現微服務、微服務的跨語言調用jsonrpc和protobuf、protobuf的安裝、protobuf高級語法、protobuf結合Grpc實現微服務實戰、微服務服務…

實現可靠的 WebSocket 連接:心跳與自動重連的最佳實踐

概覽 本文將手把手教你如何從零編寫一個可用于直播或在線聊天的 WSocket 類&#xff0c;依次實現連接建立、心跳檢測、斷線重連、消息收發以及資源清理等功能。我們將結合 WebSocket API 的標準用法、心跳保持 和 重連策略&#xff0c;并充分運用現代 JavaScript 語法&#xf…

UEFI Spec 學習筆記---33 - Human Interface Infrastructure Overview(1)

33 - Human Interface Infrastructure Overview 本章節主要用于介紹Human Interface Infrastructure&#xff08;HII&#xff09;架構介紹&#xff0c;描述如何通過 HII 來管理用戶的輸入&#xff0c;以及描述在 UEFI spec 中涉及 HII 相關的 Protocol、function 和類型定義。…

ip命令詳解

控制網卡的硬件狀態 ip link set ens36 down ip link set ens36 up 修改網卡名稱&#xff08;臨時&#xff09; ip link set ens36 down ip link set ens36 name xxx 修改網卡的mac地址 ip link set ens36 down ip link set xxx name ens36 查看ip的addr ip addr show ip ad…

hadoop中了解yarm

Hadoop中的YARN&#xff08;Yet Another Resource Negotiator&#xff09;是一種新的Hadoop資源管理器&#xff0c;是一個通用資源管理系統&#xff0c;可為上層應用提供統一的資源管理和調度。以下是其相關介紹&#xff1a; 核心思想 將JobTracker的資源管理和作業調度/監控功…