UNIKGQA論文筆記

UNIKGQA: UNIFIED RETRIEVAL AND REASONING FOR SOLVING MULTI-HOP QUESTION ANSWERING OVER KNOWLEDGE GRAPH(ICLR 2023)

Introduction

?知識圖上的多跳問題回答(KGQA)的目的是在大規模知識圖譜(KG)上找到自然語言問題中提到的主題實體,然后進行多跳推理得到答案實體。

現有方法局限性

?為了應對龐大的搜索空間,現有的工作通常采用兩階段的方法:首先檢索與問題相關的相對較小的子圖,然后對子圖進行推理,以準確地找到答案實體。雖然這兩個階段是高度相關的,但以前的工作采用了非常不同的技術解決方案來開發檢索和推理模型,而忽略了它們在任務本質上的相關性。

UniKGQA

?在本文中,我們提出了一種新的UniKGQA方法,該方法通過將檢索和推理模型統一在模型架構和參數學習中,使得兩個階段更加緊密相關。具體來說,UniKGQA采用了基于預訓練語言模型的語義匹配模塊和匹配信息傳播模塊,并設計了共享預訓練任務和檢索、推理導向的微調策略。實驗結果表明,UniKGQA在三個基準數據集上表現出了很好的效果。

Methodology

統一模型體系結構

Semantic Matching (SM)

?語義匹配模塊旨在生成問題與知識圖譜中三元組的語義匹配特征。

Matching Information Propagation (MIP)

?MIP模塊基于生成的語義匹配特征,首先對其進行聚合,更新實體表示,然后利用其獲得實體匹配得分。

訓練

?多跳KGQA的兩個階段有檢索模型和推理模型。由于這兩個模型采用相同的架構,我們引入Θ和Γ來分別表示用于檢索和推理階段的模型參數。

?模型體系結構包含兩組參數,即底層的PLM和其他用于匹配和傳播的參數。因此,Θ和Γ可以分解為: Θ = {Θp,Θo}和Γ = {Γp,Γo},其中下標p和o分別表示PLM參數和我們的架構中的其他參數。為了學習這些參數,我們設計了基于統一體系結構的預訓練(即問題-關系匹配)和微調(即面向檢索和推理的學習)策略。

Pre-training with Question-Relation Matching(QRM)

?給定一個問題q,主題實體Tq和答案實體Aq,從整個KG中提取所有從Tq到Aq的最短路徑,這些最短路徑所包含的關系可以認為是與q相關的,將其集合表示為R+。在訓練前,對于每個問題q,我們隨機抽取一個相關的關系r+∈R+,利用對比學習損失進行預訓練:

Fine-tuning for Retrieval on Abstract Subgraphs (RAS)

?SA為抽象子圖中的抽象結點的得分,如果抽象結點包括答案實體,將S*A=1賦給抽象節點。

?在對RAS損失進行微調后,可以有效地學習檢索模型。進一步利用它來檢索給定問題q的子圖,根據匹配分數選擇排名前k的節點。只有與主題實體保持合理距離內的節點才會被選擇到子圖中。

Fine-tuning for Reasoning on Retrieved Subgraphs (RRS)

?在對RRS損失進行微調后,可以利用學習到的推理模型,根據匹配分數選擇排名前n位的實體作為答案列表。

Experiments

數據集

評價指標

子圖提取評估標準:answer coverage rate (%)

推理評估標準:Hits@1,F1

結果

消融實驗

Conclusion

?提出了一種新的統一模型架構,可以同時處理多跳KGQA任務中的檢索和推理階段。使用抽象子圖來減少檢索階段中節點的數量,從而提高效率。設計了有效的學習方法,包括預訓練和微調策略,以利用兩個階段之間的共享信息,并提高了性能。在三個基準數據集上進行了廣泛的實驗,并取得了比現有最佳基線更好的結果。

方法創新點

?創新地提出了一個統一的模型架構,將KGQA任務的檢索和推理階段緊密聯系起來,以便更好地共享和傳遞相關信息。引入了抽象子圖的概念,通過合并具有相同前綴(即相同的頭部實體和關系)的尾部實體來減少檢索階段中節點的數量,從而提高了效率。設計了有效的學習方法,包括預訓練和微調策略,以利用兩個階段之間的共享信息,并提高了性能。

未來展望

?該研究為多跳KGQA提供了一個更加統一和簡化的方法,但仍需要進一步探索如何更好地處理不同規模的數據分布以及如何更有效地分享和轉移信息。可以考慮使用更多的預訓練技術來進一步提高模型的性能。未來的研究還可以探索如何將這種方法擴展到其他類型的自然語言問答任務中。

本文來自互聯網用戶投稿,該文觀點僅代表作者本人,不代表本站立場。本站僅提供信息存儲空間服務,不擁有所有權,不承擔相關法律責任。
如若轉載,請注明出處:http://www.pswp.cn/diannao/96591.shtml
繁體地址,請注明出處:http://hk.pswp.cn/diannao/96591.shtml
英文地址,請注明出處:http://en.pswp.cn/diannao/96591.shtml

如若內容造成侵權/違法違規/事實不符,請聯系多彩編程網進行投訴反饋email:809451989@qq.com,一經查實,立即刪除!

相關文章

MySQL 8.0.17 “Too Many Connections” 排查指南

MySQL 8.0.17 “Too Many Connections” 排查與優化指南 在 MySQL 8.0.17 中,當出現“Too many connections”錯誤時,通常意味著數據庫連接數已達上限。這不僅會影響應用性能,還可能導致連接池(如 Druid)無法獲取新連接…

GEO優化服務:智能時代營銷新賽道的中國引領者——全球行業格局與發展趨勢觀察

隨著全球人工智能技術的迅猛發展,以GPT-5、Claude Opus以及我國的DeepSeek Divine、豆包等為代表的新一代生成式AI搜索引擎,正深刻改變著信息獲取與商業決策模式。用戶通過直接向AI提問獲取整合答案的行為日益普遍,傳統搜索引擎的流量入口地位…

全面解析主流AI模型:功能對比與應用推薦

全面解析主流AI模型:功能對比與應用推薦 在當前人工智能技術飛速發展的背景下,市面上涌現了多種具備不同能力的AI模型。本文將系統梳理主流模型的特性、對比其核心能力,并結合實際場景推薦高效、穩定的API服務(如https://api.aaa…

【Nacos知識】Nacos 作為注冊中心的客戶端配置詳解

Nacos 作為注冊中心的客戶端配置詳解Nacos 作為注冊中心的客戶端配置詳解一、核心配置項全景圖二、基礎連接配置1. 服務端地址配置2. 命名空間配置3. 服務分組配置三、服務注冊配置1. 服務元數據配置2. 網絡位置配置3. 集群與權重配置四、健康檢查配置1. 心跳參數配置2. 健康檢…

TypeReference 泛型的使用場景及具體使用流程

簡介 在 Java 中,泛型類型在運行時會被擦除。這意味著當我們使用泛型時,運行時無法直接獲取到泛型的具體類型信息。例如,我們無法直接通過 Class 對象來獲取一個泛型類型的類型參數。這在某些情況下可能會導致問題,特別是在我們需…

商超場景徘徊識別誤報率↓79%!陌訊多模態時序融合算法落地優化

原創聲明本文為原創技術解析文章,核心技術參數與架構設計引用自 “陌訊技術白皮書(2024 版)”,所有技術描述均經過重寫轉換,無復制官網文案行為,嚴禁未經授權轉載。一、行業痛點:徘徊識別的場景…

KubeBlocks AI:AI時代的云原生數據庫運維探索

KubeBlocks AI:AI時代的云原生數據庫運維探索 REF Auto-detect-failure 架構Auto-bug-detect測試 引言 傳統的自動化運維診斷主要依賴基于規則的方法——無論是Ansible Playbooks的預定義腳本,還是Kubernetes Operator的固化邏輯,這些方法…

如何編譯botan加密庫?

Botan加密庫支持2.x版本和3.x版本,其中3.x版本需要支持C20。0、下載源碼git clone https://github.com/randombit/botan.gitcd botan切換分支到2.19.5版本git checkout 2.19.51、Windows編譯Botan加密庫1.1 配置生成MakefileRelease模式python configure.py --ccmsv…

Linux問答題:分析和存儲日志

目錄 1. RHEL 日志文件保存在哪個目錄中? 2.什么是 syslog 消息和非 syslog 消息? 3.哪兩個服務處理 RHEL 中的 syslog 消息? 4. 列舉常用的系統日志文件并說明其存儲的消息類型。 5. 簡單說下日志文件輪轉的作用 6.systemd-journald 服…

chapter05_從spring.xml讀取Bean

一、簡化Bean的注冊 如果每次注冊一個Bean,都要像上節一樣,手動寫PropertyValues相關的代碼,那太復雜了,我們希望讀取XML文件,自動注冊Bean,這樣對于使用者,甚至不知道有BeanDefinition的存在 二…

【數位DP】D. From 1 to Infinity

Problem - D - Codeforces 題目: 思路: 數位DP 數論 題目讓我們求這個無限序列 123456789101112.... 的前 k 個數的數位和 題目看起來很不好求,事實上確實是這樣的 我們可以先從簡單問題開始 問題①. 求 k 位置對應著第幾個數 那么顯然…

gitlab、jenkins等應用集成ldap

gitlab、jenkins等應用集成ldap 文檔 openldap安裝 -添加條目gitlab、jenkins等應用集成ldap gitlab集成ldap gitlab版本:gitlab-jh-17.7.0 ldap版本:openldap-2.6.10 修改/etc/gitlab/gitlab.rb文件,編輯相關信息 gitlab_rails[ldap_en…

Unity中國小游戲行業沙龍:抖音小游戲平臺分析與規劃

目錄 一、抖音小游戲市場全景分析 行業現狀與發展趨勢 行業發展關鍵議題 內容運營生態觀察 二、平臺技術架構與運營體系 用戶復訪與留存體系 技術支撐體系 三、平臺激勵與商業化政策 收益分成機制 資金服務升級 技術基礎建設 四、生態合作與發展規劃 開發者支持體系…

手機橫屏適配方案

CSS自動旋轉頁面實戰指南在移動端開發中,橫屏適配是一個常見但棘手的問題。本文將深入解析一套完整的CSS橫屏適配方案,讓你的網頁在手機旋轉時自動調整布局,提供無縫的用戶體驗。一、橫屏適配的重要性 隨著移動設備使用場景的多樣化&#xff…

藍橋杯算法之基礎知識(2)——Python賽道

1.循環里面套用遞歸,當遞歸執行return時,只會退出當前遞歸層2.不能一邊遍歷list 一邊pop解決辦法:倒序遍歷解決或者創建新的列表去存儲3.sqrt求出來的始終是小數形式,注意題目要求的結果有可能是整型你直接sqrt就提交,…

如何優雅解決 OpenCV 分段錯誤(Segfault):子進程隔離實戰

在分布式數據平臺(如 Databricks Spark)中跑視頻處理任務時,你是否遇到過這種惡心的報錯?Py4JJavaError: An error occurred while calling z:org.apache.spark.api.python.PythonRDD.collectAndServe. : org.apache.spark.Spark…

Docker的六種網絡模式(詳解)

文章目錄1. bridge(默認)2. host3. none4. container5. overlay6. macvlan7. 總結對比Docker 六種網絡模式是容器網絡的基礎概念,不同模式決定容器與宿主機、外部網絡、其他容器之間的通信方式。 1. bridge(默認) Br…

微服務流量分發核心:Spring Cloud 負載均衡解析

目錄 理解負載均衡 負載均衡的實現方式 服務端負載均衡 客戶端負載均衡 Spring Cloud LoadBalancer快速上手 常見的負載均衡策略 自定義負載均衡策略 LoadBalancer 原理 理解負載均衡 在 Spring Cloud 微服務架構中,負載均衡(Load Balance&#…

鴻蒙異步處理從入門到實戰:Promise、async/await、并發池、超時重試全套攻略

摘要(介紹目前的背景和現狀) 在鴻蒙(HarmonyOS)里,網絡請求、文件操作、數據庫訪問這類 I/O 都是異步的。主流寫法跟前端類似:Promise、async/await、回調。想把 app 做得“流暢且不阻塞”,核心…

【html2img/pdf 純!純!python將html保存為圖片/pdf!!效果非常的棒!】

素材 a.png html card.html <!DOCTYPE html> <html lang"zh-CN"><head><meta charset"UTF-8"><title>固定樣式卡片</title><style>/* 基礎樣式和頁面居中 */body {font-family: "微軟雅黑", "P…