圖嵌入綜述 (arxiv 1709.07604) 譯文五、六、七

應用

圖嵌入有益于各種圖分析應用,因為向量表示可以在時間和空間上高效處理。 在本節中,我們將圖嵌入的應用分類為節點相關,邊相關和圖相關。

節點相關應用

節點分類

節點分類是基于從標記節點習得的規則,為圖中的每個節點分配類標簽。 直觀地說,“相似”節點具有相同的標簽。 它是圖嵌入文獻中討論的最常見的應用之一。 通常,每個節點都嵌入為低維向量。 通過在用于訓練的標記節點嵌入集上應用分類器來進行節點分類。 示例分類器包括 SVM([1,33,56,20,73,34,45,41,42,57,75,81,87,60]),邏輯回歸([17,27,124,1,21],[28,20,19,45,25,59])和 k-最近鄰分類([58,151])。 然后,給定未標記節點的嵌入,訓練的分類器可以預測其類標簽。 與首先是節點嵌入然后是節點分類的上述順序處理相比,其他一些工作([62,72,47,48,80])設計了一個統一的框架來聯合優化圖嵌入和節點分類,它們學習特定于分類的每個節點的表示。

節點聚類

節點聚類旨在將類似節點組合在一起,以使同一組中的節點彼此更相似,而不是其他組中的節點。 作為無監督算法,當節點標簽不可用時,它是適用的。 在將節點表示為向量之后,可以將傳統的聚類算法應用于節點嵌入。 大多數現有工作[1,2,21,33,23,22,81]采用 k 均值作為聚類算法。 相比之下,[4]和[77]聯合優化了一個目標中的聚類和圖嵌入,來學習特定于聚類的節點表示。

節點推薦/檢索/排名

節點推薦的任務是,基于諸如相似性的某些標準[106,3,47,16,43,45]來推薦給定節點感興趣的前K個節點。 在現實世界的場景中,有各種類型的節點推薦,例如為研究人員推薦研究興趣[66],為客戶推薦項目[3,71],為社會網絡用戶推薦圖像[35],為社交網絡用戶推薦朋友[3],以及為查詢推薦文件[69]。 它在社區問答中也很受歡迎。 給出一個問題,他們預測用戶的相對排名([31,30])或答案([32,29])。 在鄰近搜索[44,39]中,它們對給定查詢節點(例如,“Bob”)和鄰近類別(例如,“同學”)的特定類型(例如,“用戶”)的節點進行排名,例如,排名是Bob的同學的用戶。 并且有一些工作側重于跨模態檢索[33,36,99,34],例如,基于關鍵詞的圖像/視頻搜索。

在知識圖嵌入中廣泛討論的特定應用是實體排名[53,51,59,52,61]。 回想一下,知識圖由一組三元組組成 。 實體排名旨在對正確的缺失實體進行排名,給定三元組中其他兩個成分,它們高于虛假實體。 例如,給定rt,在所有候選實體,它返回真的h,或者給定rh返回真的t

邊相關應用

接下來,我們介紹邊相關應用,其中涉及邊或節點對。

鏈接預測

圖嵌入旨在表示具有低維向量的圖,但有趣的是它的輸出向量也可以幫助推斷圖結構。 在實踐中,圖通常是不完整的; 例如,在社交網絡中,實際上彼此了解的兩個用戶之間可能缺少好友鏈接。 在圖嵌入中,期望低維向量保持不同的網絡鄰近度(例如,DeepWalk [17],LINE [27]),以及不同的結構相似度(例如,GCN [72],struc2vec [145])。 因此,這些向量編碼網絡結構的豐富信息,并且它們可用于預測不完整圖中的缺失鏈接。 大多數圖嵌入驅動的鏈接預測,都在同構圖上[3,16,28,19]嘗試。 例如,[28]預測兩個用戶之間的好友關系。 處理異構圖鏈接預測的圖嵌入工作相對較少。 例如,在異構社交圖上,ProxEmbed [44]試圖根據其在圖上的連接路徑的嵌入,來預測兩個用戶之間某些語義類型(例如,同學)的缺失鏈接。 D2AGE [152]通過嵌入兩個用戶的連通有向無環圖結構,解決了同樣的問題。

三元組分類

三元組分類[142,53,15,51,52,14,38,61]是知識圖的特定應用。 它的目的是分類,沒見過的三元組 是否正確,即 的關系是否是

圖相關應用

圖分類

圖分類將類標簽分配給整圖。 當圖是數據單位時,這很重要。 例如,在[50]中,每個圖是化學化合物,有機分子或蛋白質結構。 在大多數情況下,應用整圖嵌入來計算圖層級相似度[93,55,54,49,95]。 最近,一些工作開始匹配節點嵌入和圖相似性[153,50]。 每個圖表示為一組節點嵌入向量。 基于兩組節點嵌入來比較圖。 [93]將圖分解為一組子結構,然后將每個子結構嵌入為向量,并通過子結構相似性比較圖。

可視化

圖可視化在低維空間上生成圖的可視化[20,23,55,48,73,58]。 通常,出于可視化目的,所有節點都嵌入為2D向量,然后繪制在2D空間中,不同的顏色表示節點的類別。 它提供了生動的演示,表明屬于同一類別的節點的嵌入是否彼此更緊密。

其它應用

以上是一些在現有工作中經常討論的一般應用。 根據輸入圖中攜帶的信息,可能存在更具體的應用。 以下是一些示例場景。

知識圖相關:[15]和[14]從大規模純文本中提取關系事實。 [62]從文本中提取醫學實體。 [69]將自然語言文本與知識圖中的實體聯系起來。 [92]側重于刪除知識圖中重復的等效實體。 [84]聯合嵌入實體提及,文本和實體類型,從其嘈雜的候選類型集中估計每個提及的真實類型路徑。 例如,“特朗普”的候選類型是“人,政治家,商人,藝術家,演員”。 對于提及“特朗普”的句子“共和黨總統候選人唐納德特朗普在洛克希爾的競選活動中發言。”,只有“人,政治家”是正確的類型。

多媒體網絡相關 :[83]嵌入地理標記社交媒體(GTSM)記錄“時間,地點,消息 ”,這使得他們能夠在給定其他兩個成分的情況下,從GTSM三元組中恢復丟失的成分。 它還可以對GTSM記錄進行分類,例如,登記記錄是否與“食物”或“商店”相關。 [85]使用圖嵌入來減少人臉識別的數據維度。 [88]將圖像映射到一個語義流形,忠實地掌握用戶的偏好,來促進基于內容的圖像檢索。

信息傳播相關:[63]預測給定時間間隔后級聯大小的增量。 [64]預測傳播用戶,并通過嵌入社交互動圖來識別領域專家。

社交網絡對齊: [26]和[18]都學習節點嵌入,來對齊跨越不同的社交網絡的用戶,即,預測兩個不同社交網絡中的兩個用戶帳戶是否由同一用戶擁有。

圖像相關:一些工作嵌入由圖像構建的圖,然后使用嵌入進行圖像分類([81,82]),圖像聚類[101],圖像分割[154],模式識別[80]等。

未來發展方向

在本節中,我們總結了圖嵌入領域的四個未來方向,包括計算效率,問題設定,技術和應用場景。

計算。 采用幾何輸入(例如,圖)的深層架構遭受低效率問題。 傳統的深度學習模型(為歐幾里得域設計)通過假設輸入數據在1D或2D網格上,利用現代GPU來優化其效率。 但是,圖沒有這種網格結構,因此為圖嵌入設計的深層架構需要尋求替代解決方案來提高模型效率。 [117]建議可以采用為大規模圖處理開發的計算范式,來提高圖嵌入的深度學習模型的效率。

問題設定。 動態圖是圖嵌入的一個有前途的設定。 圖并不總是靜態的,尤其是在現實生活場景中,例如Twitter中的社交圖,DBLP中的引文圖。 在圖結構或節點/邊信息方面,圖可以是動態的。 一方面,圖結構可以隨時間演變,即,一些舊節點/邊消失時出現新節點/邊。 另一方面,節點/邊可以通過一些時變信息來描述。 現有圖嵌入主要側重于嵌入靜態圖,忽略了動態圖嵌入的設定。 與靜態圖嵌入不同,動態圖的技術需要是可擴展的,并且最好是遞增的,以便有效地處理動態變化。 這使得大多數現有的圖嵌入方法受到低效率問題的影響,不再適用。 如何在動態域中設計有效的圖嵌入方法仍然是一個懸而未決的問題。

技術。 結構感知對于基于邊重建的圖嵌入很重要。 當前基于邊重建的圖嵌入方法主要僅基于邊,例如,一般圖中的一跳的鄰居,知識圖中的排名三元組<h, r, t>,和 cQA 圖中的 。 單個邊僅提供局部鄰域信息來計算一階和二階接近度。 省略了圖的全局結構(例如,路徑,樹,子圖模式)。 直觀地說,子結構包含比單個邊更豐富的信息。 一些工作嘗試探索知識圖嵌入中的路徑信息([142,40,38,39])。 然而,他們中的大多數使用深度學習模型([142,38,40]),這些模型遭受前面討論的低效率問題。 如何設計可以利用圖結構的表現力的非深度學習方法是一個問題。 [39]提供了一個示例解決方案。 它最小化成對和長程損失,來捕獲成對關系和實體之間的遠程交互。 注意,除了列表/路徑結構之外,還存在各種具有不同結構信息的子結構。 例如,SPE [155]試圖引入一個子圖增強路徑結構,用于在異構圖中嵌入兩個節點之間的接近度,并且它比語義搜索任務的簡單路徑嵌入表現出更好的性能。 通常,需要一種有效的結構感知圖嵌入優化解決方案以及子結構采樣策略。

應用。 圖嵌入已應用于許多不同的應用中。 考慮到它們之間的關系,這是學習數據表示的有效方法。 此外,它可以將來自不同源/平臺/視圖的數據實例轉換到一個公共空間,以便它們可以直接比較。 例如,[36,16,34]使用圖嵌入進行跨模態檢索,例如基于內容的圖像檢索,基于關鍵詞的圖像/視頻搜索。 使用圖嵌入進行表示學習的優點在于,訓練數據實例的圖流形被保留在表示中,并且可以進一步有益于后續應用。 因此,圖嵌入可以使假設輸入數據實例與某些關系相關(即,通過某些鏈接連接)的任務受益。 探索受益于圖嵌入的應用場景非常重要,因為它從不同的角度為傳統問題提供了有效的解決方案。

結論

在本綜述中,我們對圖嵌入中的文獻進行了全面的回顧。 我們為圖嵌入問題提供了一個正式的定義,并介紹了一些基本概念。 更重要的是,我們提出了兩種圖嵌入分類法,分別基于問題設定和嵌入技術對現有工作進行分類。 在問題設定分類中,我們介紹了四種嵌入輸入和四種嵌入輸出,并總結了每種設定所面臨的挑戰。 對于嵌入技術分類法,我們介紹了每個類別的工作,并根據它們的優缺點進行比較。 之后,我們總結了圖嵌入的應用。 最后,在計算效率,問題設定,技術和應用場景方面,我們建議了圖嵌入領域的四個有希望的未來研究方向。

本文來自互聯網用戶投稿,該文觀點僅代表作者本人,不代表本站立場。本站僅提供信息存儲空間服務,不擁有所有權,不承擔相關法律責任。
如若轉載,請注明出處:http://www.pswp.cn/news/389645.shtml
繁體地址,請注明出處:http://hk.pswp.cn/news/389645.shtml
英文地址,請注明出處:http://en.pswp.cn/news/389645.shtml

如若內容造成侵權/違法違規/事實不符,請聯系多彩編程網進行投訴反饋email:809451989@qq.com,一經查實,立即刪除!

相關文章

聊聊自動化測試框架

無論是在自動化測試實踐&#xff0c;還是日常交流中&#xff0c;經常聽到一個詞&#xff1a;框架。之前學習自動化測試的過程中&#xff0c;一直對“框架”這個詞知其然不知其所以然。 最近看了很多自動化相關的資料&#xff0c;加上自己的一些實踐&#xff0c;算是對“框架”有…

1971. Find if Path Exists in Graph

1971. Find if Path Exists in Graph 有一個具有 n個頂點的 雙向 圖&#xff0c;其中每個頂點標記從 0 到 n - 1&#xff08;包含 0 和 n - 1&#xff09;。圖中的邊用一個二維整數數組 edges 表示&#xff0c;其中 edges[i] [ui, vi] 表示頂點 ui 和頂點 vi 之間的雙向邊。 …

移動磁盤文件或目錄損壞且無法讀取資料如何找回

文件或目錄損壞且無法讀取說明這個盤的文件系統結構損壞了。在平時如果數據不重要&#xff0c;那么可以直接格式化就能用了。但是有的時候里面的數據很重要&#xff0c;那么就必須先恢復出數據再格式化。具體恢復方法可以看正文了解&#xff08;不格式化的恢復方法&#xff09;…

python 平滑時間序列_時間序列平滑以實現更好的聚類

python 平滑時間序列In time series analysis, the presence of dirty and messy data can alter our reasonings and conclusions. This is true, especially in this domain, because the temporal dependency plays a crucial role when dealing with temporal sequences.在…

基于SmartQQ協議的QQ自動回復機器人-1

0. 本項目的原始代碼及我二次開發后的代碼 1. 軟件安裝:【myeclipse6.0 maven2】 0. https://blog.csdn.net/zgmzyr/article/details/6886440 1. https://blog.csdn.net/shuzhe66/article/details/45009175 2. https://www.cnblogs.com/whgk/p/7112560.html<mirror><…

1725. 可以形成最大正方形的矩形數目

1725. 可以形成最大正方形的矩形數目 給你一個數組 rectangles &#xff0c;其中 rectangles[i] [li, wi] 表示第 i 個矩形的長度為 li 、寬度為 wi 。 如果存在 k 同時滿足 k < li 和 k < wi &#xff0c;就可以將第 i 個矩形切成邊長為 k 的正方形。例如&#xff0c…

幫助學生改善學習方法_學生應該如何花費時間改善自己的幸福

幫助學生改善學習方法There have been numerous studies looking into the relationship between sleep, exercise, leisure, studying and happiness. The results were often quite like how we expected, though there have been debates about the relationship between sl…

Spring Boot 靜態資源訪問原理解析

一、前言 springboot配置靜態資源方式是多種多樣&#xff0c;接下來我會介紹其中幾種方式&#xff0c;并解析一下其中的原理。 二、使用properties屬性進行配置 應該說 spring.mvc.static-path-pattern 和 spring.resources.static-locations這兩屬性是成對使用的&#xff0c;如…

深挖“窄帶高清”的實現原理

過去幾年&#xff0c;又拍云一直在點播、直播等視頻應用方面潛心鉆研&#xff0c;取得了不俗的成果。我們結合點播、直播、短視頻等業務中的用戶場景&#xff0c;推出了“省帶寬、壓成本”系列文章&#xff0c;從編碼技術、網絡架構等角度出發&#xff0c;結合又拍云的產品成果…

學習總結5 - bootstrap學習記錄1__安裝

1.bootstrap是什么&#xff1f; 簡潔、直觀、強悍的前端開發框架&#xff0c;說白了就是給后端二把刀開發網頁用的&#xff0c;讓web開發更迅速、簡單。 復制代碼 2.如何使用&#xff1f; 如圖所示到bootstrap中文網進行下載 復制代碼 下載完成之后&#xff0c;如圖所示&#x…

519. 隨機翻轉矩陣

519. 隨機翻轉矩陣 給你一個 m x n 的二元矩陣 matrix &#xff0c;且所有值被初始化為 0 。請你設計一個算法&#xff0c;隨機選取一個滿足 matrix[i][j] 0 的下標 (i, j) &#xff0c;并將它的值變為 1 。所有滿足 matrix[i][j] 0 的下標 (i, j) 被選取的概率應當均等。 …

模型的搜索和優化方法綜述:

一、常用的優化方法&#xff1a; 1.爬山 2.最陡峭下降 3.期望最大值 二、常用的搜索方法&#xff1a; 1.貪婪搜索 2.分支界定 3.寬度&#xff08;深度&#xff09;優先遍歷轉載于:https://www.cnblogs.com/xyp666/p/9042143.html

Redis 服務安裝

下載 客戶端可視化工具: RedisDesktopManager redis官網下載: http://redis.io/download windos服務安裝 windows服務安裝/卸載下載文件并解壓使用 管理員身份 運行命令行并且切換到解壓目錄執行 redis-service --service-install windowsR 打開運行窗口, 輸入 services.msc 查…

熊貓數據集_對熊貓數據框使用邏輯比較

熊貓數據集P (tPYTHON) Logical comparisons are used everywhere.邏輯比較隨處可見 。 The Pandas library gives you a lot of different ways that you can compare a DataFrame or Series to other Pandas objects, lists, scalar values, and more. The traditional comp…

初級功能筆試題-1

給我徒弟整理的一些理論性的筆試題&#xff0c;不喜勿噴。&#xff08;所以沒有答案哈&#xff09; 1、測試人員返測缺陷時&#xff0c;如果缺陷未修復&#xff0c;把缺陷的狀態置為下列什么狀態&#xff08;&#xff09;。 2、當驗證被測系統的主要業務流程和功能是否實現時&a…

ansbile--playbook劇本案例

個人博客轉至&#xff1a; www.zhangshoufu.com 通過ansible批量管理三臺服務器&#xff0c;使三臺服務器實現備份&#xff0c;web01、nfs、backup&#xff0c;把web和nfs上的重要文件被分到backup上&#xff0c;主機ip地址分配如下 CharacterIP地址IP地址主機名Rsync--server1…

5938. 找出數組排序后的目標下標

5938. 找出數組排序后的目標下標 給你一個下標從 0 開始的整數數組 nums 以及一個目標元素 target 。 目標下標 是一個滿足 nums[i] target 的下標 i 。 將 nums 按 非遞減 順序排序后&#xff0c;返回由 nums 中目標下標組成的列表。如果不存在目標下標&#xff0c;返回一…

決策樹之前要不要處理缺失值_不要使用這樣的決策樹

決策樹之前要不要處理缺失值As one of the most popular classic machine learning algorithm, the Decision Tree is much more intuitive than the others for its explainability. In one of my previous article, I have introduced the basic idea and mechanism of a Dec…

說說 C 語言中的變量與算術表達式

我們先來寫一個程序&#xff0c;打印英里與公里之間的對應關系表。公式&#xff1a;1 mile1.61 km 程序如下&#xff1a; #include <stdio.h>/* print Mile to Kilometre table*/ main() {float mile, kilometre;int lower 0;//lower limitint upper 1000;//upper limi…

gl3520 gl3510_帶有gl gl本機的跨平臺地理空間可視化

gl3520 gl3510Editor’s note: Today’s post is by Ib Green, CTO, and Ilija Puaca, Founding Engineer, both at Unfolded, an “open core” company that builds products and services on the open source deck.gl / vis.gl technology stack, and is also a major contr…