linux+cp+-rdf,簡單構建基于RDF和SPARQL的KBQA（知識圖譜問答系統）

linux+cp+-rdf,簡單構建基于RDF和SPARQL的KBQA（知識圖譜問答系統）

news/2025/8/21 23:31:21/文章來源:https://blog.csdn.net/weixin_35143292/article/details/117008481

本文主要通過python實例講解基于RDF和SPARQL的KBQA系統的構建。該項目可在python2和python3上運行通過。

注：KBQA即是我們通常所說的基于知識圖譜的問答系統。這里簡單構建的EasyKBQA，數據來源于網絡，源碼地址看下面補充說明。

目錄：

流程原理：

該問答系統可以解析輸入的自然語言問句，主要運用REFO庫的"對象正則表達式"匹配得到結果, 進而生成對應 SPARQL 查詢語句，再通過API請求后臺基于TDB知識譜圖數據庫的 Apache Jena Fuseki 服務, 得到結果。

實際過程：

1. 預定義 3 ?類共 5 ?個示例問題，?包括：

● "誰是苑茵?",

● "丁洪奎是誰?",

● "蘇進木來自哪里?",

● "苑茵哪個族的?",

● "苑茵是什么民族的人?".

2. 利用結巴分詞對中文句子進行分詞, ?同時進行詞性標注；

3. 將詞的文本和詞性打包, ?視為"詞對象"，對應 :class:Word(token,? ?pos)?；

4. 利用 REfO ?模塊對詞進行對象級別 (object-level) ?的正則匹配，判斷問題屬于的?種類?并產生對應的 SPARQL，對應 :class:Rule(condition,? ?action)?；

5. 如果成功匹配并成功產生 SPARQL ?查詢語句, ?立刻請求 Fuseki ?服務并返回結果，打印相關內容；

程序運行：

1、配置第三方庫：pip install refo jieba sparqlwrapper

2、安裝JAVA JDK1.8，配置好環境變量。

3、項目根目錄主要包括backend??文件夾和test.py文件(同一級)，backend是Jena?的Fuseki 模塊，?運行第4步

4、cd backend/apache-jena-fuseki-3.5.0，windows下啟動SPARQL endpoint服務：

fuseki-server.bat --loc=../DB /demo > log.txt 2>&1

對應Linux命令為：

nohup ./fuseki-server --loc=../DB /demo > log.txt 2>&1 &

5、運行根目錄代碼：python test.py，結果如下圖：

補充說明：

1、啟動fuseki服務器參數，--loc=../DB設置在線服務數據庫位置，參數/demo

2、自然語言問句進行正則匹配的邏輯REfO. ?主要參考根目錄下的代碼:words.py

3、后續改進可參考: 使用鄰接鏈表表示自然語言問句, 通過遍歷有向圖或子圖匹配方法構造 SPAPQL ?查詢語句

代碼下載地址：https://download.csdn.net/download/starbaby01/10621927

本文來自互聯網用戶投稿，該文觀點僅代表作者本人，不代表本站立場。本站僅提供信息存儲空間服務，不擁有所有權，不承擔相關法律責任。
如若轉載，請注明出處：http://www.pswp.cn/news/531908.shtml
繁體地址，請注明出處：http://hk.pswp.cn/news/531908.shtml
英文地址，請注明出處：http://en.pswp.cn/news/531908.shtml

如若內容造成侵權/違法違規/事實不符，請聯系多彩編程網進行投訴反饋email:809451989@qq.com，一經查實，立即刪除！

相關文章

java中Object.equals()簡單用法

java中Object.equals()簡單用法

/* equals（）方法默認的比較兩個對象的引用！ */ class Child {int num;public Child(int x){num x;}//人文的拋出運行時異常的好處是：可以自定義錯誤信息！/*public boolean equals(Object o) throws ClassCastExceptio…

閱讀更多...

cmd imp導入dmp文件_oracle導入dmp文件的2種方法

cmd imp導入dmp文件_oracle導入dmp文件的2種方法

使用imp、impdp方式導入數據1.使用imp導入數據打開cmd窗口，然后直接敲入一下命令即可，需要注意的是，要事先把dmp文件放到正確的路徑中去imp yx_base/yx_192. file E:\yxb\yx_base.dmp log E:\yxb\yx_base.log full y2.使用impdp導入數據(1…

閱讀更多...

from server sql 拼接統計兩個子查詢_[SQL SERVER系列]之嵌套子查詢和相關子查詢

from server sql 拼接統計兩個子查詢_[SQL SERVER系列]之嵌套子查詢和相關子查詢

子查詢有兩種類型，一種是只返回一個單值的子查詢，這時它可以用在一個單值可以使用的地方，這時子查詢可以看作是一個擁有返回值的函數；另外一種是返回一列值的子查詢，這時子查詢可以看作是一個在內存中臨時存在的數據表…

閱讀更多...

java中包容易出現的錯誤及權限問題

java中包容易出現的錯誤及權限問題

/* 3，權限在不同地方的體現： public protected default private 同一類中： ok ok ok ok 同一包中： ok ok ok 子類中： ok ok …

閱讀更多...

c語言程序算一元二次方程,如何用C語言來計算一元二次方程

c語言程序算一元二次方程,如何用C語言來計算一元二次方程

C語言實現一元二次方程的解源程序#include#includefloat x1,x2,p,q,d;float great_than_zero(float,float);float equql_to_zero(float,float);float smaller_than_zero(float,float);main(){float a,b,c;printf(“Enter a,b,c:”);scanf(“%f%f%f”,&a,&b,&c);db…

閱讀更多...

cosin等于多少_cos45度等于多少

cosin等于多少_cos45度等于多少

cos45度√2/2。角A的鄰邊比斜邊叫做角A的余弦，記作cosA(由余弦英文cosine簡寫得來)，即cosA等于角A的鄰邊/斜邊(直角三角形)。二倍角公式sin2α2sinαcosαtan2α2tanα/(1-tan^2(α))cos2αcos^2(α)-sin^2(α)2cos^2(α)-11-2sin^2(α)積化和差公式sinα…

閱讀更多...

c語言宏定義比較三個數大小,C語言中兩個宏進行大小對比，其中一個沒有定義，這種行為如何定義。...

c語言宏定義比較三個數大小,C語言中兩個宏進行大小對比，其中一個沒有定義，這種行為如何定義。...

1.C語言中兩個宏進行大小對比，其中一個沒有定義，這種行為如何定義呢？在學習U-boot的過程中遇到這么一個定義：# if (CONFIG_ENV_ADDR > CONFIG_SYS_MONITOR_BASE) && \(CONFIG_ENV_ADDR CONFIG_ENV_SIZE) < \(CONFI…

閱讀更多...

java中變量運算細節 (2)

java中變量運算細節 (2)

/* 目的：測試變量的運算方式結果：byte a, b, c;a bc;或者 a b10形如這種形式的算式， 等式的右邊的運算結果默認的都是int型的！因為等式右邊有變量， 編譯器無法確定變量的內容，因為它是變量！所…

閱讀更多...

c語言設計二級考試程序修改題,全國計算機二級考試C語言復習題與答案解析

c語言設計二級考試程序修改題,全國計算機二級考試C語言復習題與答案解析

全國計算機二級考試C語言復習題與答案解析三、程序修改題下列給定程序中函數fun的功能是：將長整型數中各位上為奇數的數依次取出，構成一個新數放在t中。高位仍在高位，低位仍在低位。例如，當s中的數為87653142時，t中的數…

閱讀更多...

ccs變量觀察窗口在哪_CCS3.3查看變量圖形

ccs變量觀察窗口在哪_CCS3.3查看變量圖形

CCS3.3查看變量圖形首先聲明，覺得ccs3.3中Graph并不是什么量都可以觀察的，原因是跟斷點有關，反正對于我的仿真器XDS510的是如此。即程序運行到斷點處會有延時，對于普通信號可能沒什么影響，但對于高頻信號來說&#xff…

閱讀更多...

poj 2777（線段樹的節點更新策略）

poj 2777（線段樹的節點更新策略）

1 /*2 之前的思想是用回溯的方式進行顏色的更新的！如果用回溯的方法的話，就是將每一個節點的顏色都要更新3 通過子節點的顏色情況來判斷父節點的顏色情況 ！這就是TLE的原因！4 5 后來想一想沒有必要 ！加入[a, b] 區間有…

閱讀更多...

c語言計算機編程例題詳解,計算機C語言編寫程序題及答案解析精選.doc

c語言計算機編程例題詳解,計算機C語言編寫程序題及答案解析精選.doc

計算機C語言編寫程序題及答案解析精選2011年計算機二級C語言編寫程序題及答案解析精選【4.1】已知銀行整存整取存款不同期限的月息利率分別為：0.315% 期限一年0.330% 期限二年月息利率 ＝ 0.345% 期限三年0.375% 期限五年0.420% 期限八年要求輸入存錢的本…

閱讀更多...

mfsort shell語法_Shell中字符串排序的幾種方法

mfsort shell語法_Shell中字符串排序的幾種方法

Shell中字符串排序的幾種方法【方法一】按ASCII正向排序備注:1) tr將子字符串中的空白轉換為換行符，再用sort排序2) sort無參的話，默認按ASCII正向排序【方法二】按ASCII正向排序備注:1) -r參數: 按ASCII碼反向排序2) 在使用sort,uniq等組合命令時候【方…

閱讀更多...

java中并不是任意多個接口都可以實現多實現

java中并不是任意多個接口都可以實現多實現

interface A{public abstract void show(); }interface B{public abstract int show(); }public class Test implements A, B{public void show(){System.out.println("A show!");}/*只寫 void show（）出現的問題：Test不是抽象的, 并…

閱讀更多...

變形監測期末復習_寒假即將來臨，中小學期末考試時間是什么時候?

變形監測期末復習_寒假即將來臨，中小學期末考試時間是什么時候?

2019年下學期也快結束，各個區的中小學考試時間安排已經公布了。今年，初二將首次進行全市統考，統考的意義重大，希望家長們可以督促孩子們重視起來，考出好成績!下面，讓我們來看一下2019下學期深圳各區中小學期…

閱讀更多...

c語言2048項目報告,c語言----項目_小游戲2048

c語言2048項目報告,c語言----項目_小游戲2048

2048 小游戲主要是針對邏輯思維的一個訓練.主要學習方面:1.隨機數產生的概率.2.行與列在進行移動的時候幾種情況.3.messagebox的使用#include #include #include #include using namespace std;int board[4][4] {0}; //二維數組int if_need_rand; //是否生成隨機數int if_gam…

閱讀更多...

java中的顯示初始化和特定初始化

java中的顯示初始化和特定初始化

public class Test{public static void main(String[] args){Child child new Child();} }class Parent{public Parent(){super();show();//this.show(); 因為是Child類對象調用了super()來構造其父類的部分;所以父類中的this（隨著其構造方法入棧的）是指…

閱讀更多...

etl工程師面試題_數據倉庫工程師面試題筆試.doc

etl工程師面試題_數據倉庫工程師面試題筆試.doc

數據倉庫工程師面試題姓名：____張小核______ 開始時間：_____:______ 結束時間：_____:_____數據庫使用過哪些數據庫？試說出它們的異同。答：使用過SQL SERVER和ORACLE它們的區別是：1.sql server 是中小型企業…

閱讀更多...

為什叫c語言,為什么c語言叫c語言？

為什叫c語言,為什么c語言叫c語言？

1972年，美國貝爾實驗室的 D.M.Ritchie 在B語言的基礎上最終設計出了一種新的語言，他取了BCPL的第二個字母作為這種語言的名字，這就是C語言。1973年初，C語言的主體完成。Thompson和Ritchie用它完全重寫了UNIX。隨著UNIX的發展&…

閱讀更多...

java中對象的初始化過程

java中對象的初始化過程

class Parent{int num 8;// ->3Parent(){//super(); // ->2//顯示初始化 // ->3//構造代碼段 // ->4show(); // ->5}{// ->4System.out.println("Parent constructor code run->");}public void show(){//被覆蓋System.out.println(&quo…

閱讀更多...

最新文章