知識圖譜:浙江大學教授 陳華軍
知識圖譜 1課時
http://openkg.cn/datasets-type/
知識圖譜的價值
知識圖譜是有什么用?
-
語義搜索
-
問答系統
- QA問答對
- 知識圖譜:結構化圖
-
輔助推薦系統
-
大數據分析系統
-
自然語言理解
-
輔助視覺理解
例子:
知識圖譜的技術內涵
login graph
pure graph
format graph
知識圖譜技術要素
- 表示
- 存儲
- 抽取
- 融合
- 推理
- 問答
- 分析
- 其他
基于圖的知識表示
- 有向標記圖(Directed-Labled Graph)–最簡單、最接近自然語言和人腦認知的數據模型
RDF代表Resource Description Framework(資源描述框架)
三元組表示: 主題:關系:對象
圖數據存儲與查詢
圖數據庫充分利用圖的結構建立微索引,這種微索引比起關系數據庫的全局索引
在處理圖遍歷查詢時更加廉價,其查詢復雜度與數據集整體大小無關,僅正比于
相鄰子圖的大小。因此在很多涉及復雜關聯和多跳的場景中得到廣泛應用
圖知識庫不是知識圖譜的必選方案
知識抽取
完全抽取高質量的知識無法做到,機器抽取+ 人工眾包目前是構建知識構建的主流技術路線。
知識圖譜融合
多個來源的數據實體或概念隱射到統一的命名空間。
兩個層面:
- 本體概念層面:多個知識圖譜中,同個本體的父子類關系融合
- 實體層面: 同一個人,在不同數據集有不同的名稱。
基于表示的方法 是當前實現知識圖譜異構融合的主流技術
推理
目標:使用知識圖譜中已知的關聯關系或事實來推斷位置的關系和事實
基于符號的推理方法:
具備可解釋性。不易于處理隱含和不確定的知識
基于表示學習的方法:
主要優點:推理i效率高,能處理隱含的知識,但丟失了可解釋性
問答
圖算法和圖神經網絡
總結:建立知識圖譜的系統工程觀
- 數據-》算法-》工具-》形成系統