如何讓大模型更好地完成知識圖譜推理?

p1.png?

論文標題: Making Large Language Models Perform Better in Knowledge Graph Completion

論文鏈接:?https://arxiv.org/abs/2310.06671?

代碼鏈接:GitHub - zjukg/KoPA: [Paper][Preprint 2023] Making Large Language Models Perform Better in Knowledge Graph Completion

01. 動機

大語言模型憑借其強大的文本理解與生成能力在AI的各個領域中掀起了研究的熱潮。大語言模型(LLM)與知識圖譜(KG)的結合是未來大語言模型未來的重要發展方向之一。一方面,大模型憑借其豐富的文本理解和生成能力可以完成知識圖譜的構建以及推理和補全,另一方面,知識圖譜也可以為大模型提供可信的外部知識,緩解大模型中出現的幻覺現象。這篇論文著眼于基于大模型的知識圖譜補全(LLM4KGC),探索了如何才能更好地讓大語言模型完成知識圖譜補全這項任務。

02. 貢獻

已有的LLM4KGC的方法往往是通過指令微調的方式,構造提示詞模版將一條條的三元組輸入大模型中對大模型進行微調,來訓練出能夠完成KGC任務的LLM,但是這樣的方法沒有充分利用KG中存在的復雜結構信息,導致LLM無法充分地理解知識圖譜中的結構信息,從而限制了LLM解決KGC問題的能力。圍繞如何在LLM中引入KG結構信息這一個問題,該文章做出了如下幾點貢獻:

  • 論文探究了在常見的LLM范式(不需要訓練的In-Context Learning和需要訓練的指令微調)基礎上如何引入知識圖譜的結構信息,分別提出了一種結構增強的上下文學習方法和結構增強的指令微調方法
  • 論文提出了一種知識前綴適配器(Knowledge Prefix Adapter, KoPA),將KG中提取的結構知識通過一個適配器映射到大模型的文本token表示空間中,并和三元組的文本一起進行指令微調,使得LLM能夠充分理解KG中的結構信息,并在結構信息的輔助下完成知識圖譜的推理。
  • 論文進行了大量的實驗,來驗證了論文中提出的多種方法的性能,探索最合理的結構信息引入方案。

03. 方法

p2.png?

論文首先提出了結構增強的上下文學習和指令微調方法,通過將輸入的三元組的局部結構信息通過文本描述的方式添加到指令模版中,實現結構信息的注入。

另一方面,論文中提出的知識前綴適配器(KoPA)的主要設計方案如上圖所示,首先KoPA通過結構特征的預訓練提取知識圖譜中實體和關系的結構信息,之后,KoPA通過一個設計好的適配器,將輸入三元組對應的結構特征投影到大語言模型的文本表示空間中,然后放置于輸入prompt的最前端,讓輸入的提示詞模版中的每個token都能“看到”這些結構特征,然后通過微調的Next Word Prediction目標對LLM的訓練。論文對不同的結構信息引入方案進行了對比,對比的結果如下:

d1b432a3d190990469693d3e648093a.png?

04. 實驗

實現部分,該論文選取了三個數據集,進行了三元組分類的實驗。三元組分類是一項重要的知識圖譜補全任務,旨在判斷給定三元組的正確性。論文的主要實驗結果如下:

p3.png?

可以看到,相比于傳統方法、基于大模型的方法和引入結構信息的方法來說,KoPA在三個數據集上的準確率、F1值等指標取得了一定的提升。此外論文還對KoPA中適配器的可遷移性、模塊設計的合理性等進行了分析,感興趣的讀者可以通過閱讀原論文了解進一步的內容。

05. 總結

該論文探索了如何將知識圖譜中的結構知識引入大語言模型中,以更好地完成知識圖譜推理,同時提出了一個新的知識前綴適配器,將從知識圖譜中提取到的向量化的結構知識注入到大模型中。在未來,作者將進一步探索基于大語言模型的復雜知識圖譜推理,同時也將關注如何利用知識圖譜使得大語言模型能夠在知識感知的情況下完成更多下游任務比如問答、對話等等。


關于TechBeat人工智能社區

TechBeat(www.techbeat.net)隸屬于將門創投,是一個薈聚全球華人AI精英的成長社區。

我們希望為AI人才打造更專業的服務和體驗,加速并陪伴其學習成長。

期待這里可以成為你學習AI前沿知識的高地,分享自己最新工作的沃土,在AI進階之路上的升級打怪的根據地!

更多詳細介紹>>TechBeat,一個薈聚全球華人AI精英的學習成長社區?

本文來自互聯網用戶投稿,該文觀點僅代表作者本人,不代表本站立場。本站僅提供信息存儲空間服務,不擁有所有權,不承擔相關法律責任。
如若轉載,請注明出處:http://www.pswp.cn/news/167159.shtml
繁體地址,請注明出處:http://hk.pswp.cn/news/167159.shtml
英文地址,請注明出處:http://en.pswp.cn/news/167159.shtml

如若內容造成侵權/違法違規/事實不符,請聯系多彩編程網進行投訴反饋email:809451989@qq.com,一經查實,立即刪除!

相關文章

node-red - 節點實戰總結1

node-red - 節點實戰總結1 二、功能2.1 循環(for\while) 三、網絡四、序列五、解析六、存儲七、協議7.1 modbus協議7.2 opcua 八、formats8.1 時間格式化與時區轉換 二、功能 2.1 循環(for\while) 安裝節點node-red-contrib-loop-processing,該節點支持三種方式的循環&#xf…

【SpringBoot】 This application has no explicit mapping for 解決方法

This application has no explicit mapping for 解決方法 This application has no explicit mapping for 解決方法一、背景二、原因三、解決方案方式一:方式二: 四、解決 This application has no explicit mapping for 解決方法 一、背景 在SpringBo…

奧特曼不是第一次被開除!離職YC系“被創始人要求離開”

明敏 西風 發自 凹非寺 量子位 | 公眾號 QbitAI 鈕祜祿奧特曼,竟然不是第一次被“掃地出門”??! 沒想到,OpenAI鬧劇剛稍微消停了一點,“前傳”馬上來了。 《華盛頓郵報》從知情人士處獲悉,奧…

java編程:使用遞歸 循環和位運算實現將10進制轉為2進制

1 遞歸 /*** 遞歸&#xff1a;十進制轉二進制* param decimal 待轉換的十進制數* param binary 轉換后的二進制數*/public static void decimalToBinaryByRecursion(int decimal,StringBuilder binary){if(decimal < 0){return;}decimalToBinaryByRecursion(decimal/2,bina…

3D卷積的理解

卷積核不僅需要在高寬這兩個維度上進行滑動&#xff0c;還需要在時間維度上進行滑動

前端設計問題:iframe

居中問題&#xff1a; 嘗試了一般的居中方法&#xff0c;無效果 display: flex;justify-content: center;align-items: center;放到導航欄下面不居中 放到頁面底部還是不居中 Code <iframe id"demo_sanshui" src"demo_sanshui.html" width"120%…

【現場問題】現場的zk出現問題,ES也出現問題,一個一個排查出來,服務器重啟了

湖南現場 zk出現問題ES出現問題了罪魁禍首&#xff0c;服務器重啟 zk出現問題 發現集群出現問題了&#xff0c;想都沒想就直接去重啟了&#xff0c;把三臺服務器都重啟 ES出現問題了 三臺機器只有一臺機器是有ES的&#xff0c;但是看了配置文件&#xff0c;發現這個ES是三臺…

centos7 openssh版本升級至 openssh-9.5p1

公司項目驗收提示ssh版本存在漏洞&#xff0c;要求升級至最高版本&#xff0c;這里做個記錄 默認版本 [rootlocalhost ~]# sshd -v unknown option -- v OpenSSH_7.4p1, OpenSSL 1.0.2k-fips 26 Jan 2017yum groupinstall -y "Development Tools" yum install -y …

[HCIE] IPSec-VPN (IKE自動模式)

概念&#xff1a; IKE&#xff1a;因特網密鑰交換 實驗目標&#xff1a;pc1與pc2互通 步驟1&#xff1a;R1與R3配置默認路由 R1&#xff1a; ip route-static 0.0.0.0 0.0.0.0 12.1.1.2 R2&#xff1a; ip route-static 0.0.0.0 0.0.0.0 23.1.1.2 步驟2&#xff1a;配ACL…

Postgresql在ubuntu 22.04上遭遇OOM的處理方法

OOM機制就是kill那些占用內存多且優先級低的進程以此來保證操作系統內核的正常運轉&#xff0c;一旦我們關閉OOM可能會導致操作系統內核奔潰。 https://manpages.ubuntu.com/manpages/jammy/en/man1/choom.1.html Linux kernel uses the badness heuristic to select which pro…

工業級5G路由器:穩定性更高,網絡速度更快!

隨著5G技術的發展&#xff0c;5G路由器也越來越受到人們的關注。特別是工業級5G路由器&#xff0c;它的應用范圍更廣&#xff0c;穩定性更高&#xff0c;網絡速度更快&#xff0c;已成為許多企業和工業領域的必備選擇。 一、工業級5G路由器的特點 工業級5G路由器具有很多獨特的…

利用MATLAB進行矩陣運算

一、畫出y1/(x3)的函數曲線&#xff0c;x∈[0, 200]。 程序&#xff1a; x0:0.01:200; y(3x).^(-1); plot(x,y) 結果&#xff1a; 二、生成一個信號&#xff1a;xsin(2*pi*t)cos(4*pi*t) 程序&#xff1a; syms t; xsin(2*pi*t).*cos(4*pi*t); fplot(x,[0 pi]); 結果&…

MyBatis - 自定義 ResultMap 返回數據與數據庫查詢不一致

問題描述 最近遇到一個查詢列表問題&#xff0c;發現實際數據庫查詢 4 條數據&#xff0c;但是經過程序就是 3 條&#xff0c;一開始懷疑是不是自己程序做了去重啥的&#xff0c;一頓排查猛如虎發現并沒有&#xff0c;后來看了下 resultMap 的機制的坑~ <resultMap id"…

electerm 跨平臺的終端 /ssh/sftp 客戶端

文章目錄 electerm功能特性主題配色 electerm 每個程序員基本都離開SSH鏈接工具,目前市場上好用的基本都是收費的 給大家推薦一款國人開發的開源鏈接工具https://github.com/electerm/electerm 到目前為止star已經9.5K了,非常受歡迎 功能特性 支持ssh,telnet,serialport,本地和…

使用AndResGuard報錯:copy res file not in resources.arsc file:Ezi.xml

Android使用AndResGuard進行資源混淆&#xff0c;壓縮。 源碼地址&#xff1a;GitHub - shwenzhang/AndResGuard: proguard resource for Android by wechat team 集成完成后編譯過程中出現如下錯誤&#xff1a; 14:57:05 copy res file not in resources.arsc file:IUk.xml…

CMake API使用指南

文章目錄 CMake 的基本語法和用法1. CMakeLists.txt 基本結構2. 變量和宏3. 條件語句4. 循環語句5. 定義和使用函數6. 導入庫和鏈接庫7. 設置編譯器選項 message1. 顯示普通消息&#xff1a;2. 顯示帶模式的消息&#xff1a;3. 顯示變量值&#xff1a;4. 顯示多行消息&#xff…

ptpd2提示failed to join the multicast group (strerror: No buffer space available)

下載交叉編譯ptpd-ptpd-2.3.1源碼&#xff0c;在IMX6板子上面運行ptpd2提示錯誤如下&#xff1a; rootimx6qsabresd_genvict:~# ./ptpd2 -C -m -i eth0 2023-11-24 14:30:21.484399 ptpd2[6512].startup (info) (___) Configuration OK 2023-11-24 14:30:21.487152 ptpd2…

3ds Max 電腦配置建議 | 建模+渲染選專業顯卡or游戲顯卡?

&#xfeff;使用3ds Max進行建模和渲染時&#xff0c;選擇合適的電腦配置非常重要。比如在硬件選擇上&#xff0c;究竟選購游戲顯卡還是專業顯卡呢&#xff1f;本文將為你詳細介紹游戲顯卡和專業顯卡的區別&#xff0c;并提供配置建議&#xff0c;助你作出明智的決策。 &#…

gcc編譯優化

優化選項 -flto Whole Program Mode&#xff08;整個程序模式&#xff09;&#xff1a;在這種模式下&#xff0c;編譯器對整個程序進行優化。它通過將所有源文件合并成一個單獨的中間表示&#xff08;IR&#xff09;文件&#xff0c;然后進行全局的優化和代碼生成。這種模式可…

手把手用GPT開發小程序全流程!就是這么easy~

大家好&#xff0c;我是五竹。 前段時間用GPT開發了一款小程序:GPT真牛批&#xff01;三天開發一個小程序&#xff0c;三天積累了2000的用戶&#xff0c;上周末抽空又接入了流量主&#xff0c;感興趣的同學可以圍觀一下。 今天就來帶大家走一遍用GPT開發一款小程序的全過程&a…