AI論文速讀 | 2024[KDD]自適應時空圖神經網絡中圖中獎彩票的預訓練識別

題目:Pre-Training Identification of Graph Winning Tickets in Adaptive Spatial-Temporal Graph Neural Networks

作者:Wenying Duan, Tianxiang Fang, Hong Rao, Xiaoxi He

機構:南昌大學,澳門大學

arXiv網址:https://arxiv.org/abs/2406.08287

Cool Paper:https://papers.cool/arxiv/2406.08287
Code: https://anonymous.4open.science/r/paper-1430

關鍵詞::自適應時空圖神經網絡,彩票假設,圖中獎票,計算效率。

TL; DR:本文提出了一種新方法,通過預訓練識別圖神經網絡中的高效子網絡(圖中獎票),顯著提高了自適應時空圖神經網絡的計算效率,同時保持了模型性能。

12 Pages 1 Preliminaries 1.5 Methodology 3.75 Experiments 1 Appendix

該研究團隊在KDD23也有一篇對ASTGNNs(自適應時空圖神經網絡)的研究:

2023 [KDD] Localised Adaptive Spatial-Temporal Graph Neural Network

TL;DR: 對于自適應時空圖神經網絡(ASTGNN)在測試(推理)階段圖結構的空間信息是冗余的,訓練是必要的。


🌟【緊跟前沿】“時空探索之旅”與你一起探索時空奧秘!🚀
歡迎大家關注時空探索之旅時空探索之旅QRCode

摘要

在本文中,提出了一種新方法,通過引入源自彩票假設 (Lottery Ticket Hypothesis,LTH) 的圖中獎彩票 (Graph Winning Ticket,GWT) 概念,顯著提高自適應時空圖神經網絡 (ASTGNN) 的計算效率。通過在訓練之前采用預先確定的星型拓撲作為 GWT,本文在邊緣減少和高效信息傳播之間取得平衡,在保持高模型性能的同時降低了計算需求。生成自適應時空圖的時間和空間計算復雜度都從 O ( N 2 ) O(N^2) O(N2) 顯著降低到 O ( N ) O(N) O(N)。本文的方法簡化了 ASTGNN 部署,消除了對詳盡訓練、剪枝和再訓練周期的需求,并在各種數據集上通過實證證明,有可能以低得多的計算成本實現與完整模型相當的性能。具體來說,本文的方法能夠使用配備 48 GB 顯存的單張 A6000 在最大規模時空數據集上訓練 ASTGNN,克服了原始訓練中遇到的內存不足問題,甚至達到了最先進的性能。此外,本文從譜圖理論的角度深入研究了 GWT 的有效性,提供了大量的理論支持。這一進步不僅證明了 ASTGNN 中存在高效子網絡,而且拓寬了 LTH 在資源受限環境中的適用性,標志著圖神經網絡領域的重大進步。

Q: 這篇論文試圖解決什么問題?

A: 這篇論文提出了一種新的方法,旨在顯著提高自適應時空圖神經網絡(Adaptive Spatial-Temporal Graph Neural Networks,簡稱ASTGNNs)的計算效率。具體來說,論文通過引入基于彩票假設(Lottery Ticket Hypothesis,簡稱LTH)的圖中獎票(Graph Winning Ticket,簡稱GWT)的概念,以期在減少計算需求的同時保持模型性能。

ASTGNNs在處理大規模時空數據時面臨顯著的計算開銷挑戰,這主要是因為它們需要學習完整的圖上的自適應鄰接矩陣,并且聚合階段計算密集。論文的主要貢獻包括:

  1. 提出了一種在訓練前確定GWT的方法,通過采用預定的星型拓撲作為GWT,平衡了邊的減少和有效信息傳播之間的關系,從而在降低計算需求的同時保持了高性能。
  2. 通過實驗驗證了這種方法在多個數據集上與完整模型相比具有可比性,甚至在某些情況下性能更優,同時顯著降低了訓練和推理的計算成本。
  3. 從譜圖理論的角度深入探討了GWT的有效性,為LTH在資源受限環境中的適用性提供了理論支持。

這種方法不僅證明了ASTGNNs內存在高效的子網絡,而且擴展了LTH在資源受限設置中的適用性,是圖神經網絡領域的重要進展。

Q: 有哪些相關研究?

A: 論文中提到了多個與時空圖神經網絡(STGNNs)和彩票假設(LTH)相關的研究領域和具體工作。以下是一些主要的相關研究:

  1. 時空圖神經網絡(STGNNs): 這類網絡專注于分析時空數據,特別是動態信號在不同空間域之間的相互作用。STGNNs能夠建模節點之間的空間依賴性,并且通過學習鄰接矩陣來有效捕捉數據的潛在模式。
  2. 預定義和自學習方法: STGNNs可以根據構建鄰接矩陣的方法分為預定義方法和自學習方法。預定義方法使用領域知識來構建圖,例如ASTGNN和STGCN利用道路網絡結構。自學習方法則通過時間變化的輸入動態構建圖,如PDFormer和DG。
  3. 彩票假設(LTH): LTH提出了在大型神經網絡中存在較小的子網絡(稱為“中獎彩票”),這些子網絡可以在隔離訓練時達到與原始網絡相似的性能。這個概念已經被擴展到ASTGNNs的領域,即在可學習的時空圖中識別這樣的子網絡,即GWTs。
  4. 圖彩票假設(Graph Lottery Ticket Hypothesis): 這是LTH在圖神經網絡(GNNs)中的擴展,研究者通過迭代應用UGS來識別圖彩票。
  5. ASTGNN模型: 如Graph WaveNet和AGCRN,這些模型通過隨機初始化的可學習節點嵌入來促進自適應圖的生成。
  6. 譜圖理論: 論文還深入探討了譜圖理論,為GWT的有效性提供了理論支持。
  7. 其他STGNNs: 論文中還提到了其他幾種STGNNs,包括DGCRN、MegaCRN、STGODE、D2STGNN和DSTAGNN,這些模型代表了該領域的最新趨勢。
  8. 圖結構的稀疏化: 論文中提到了AGS方法,這是一種通過稀疏化空間圖來提高ASTGNNs推理效率的先前工作。

這些相關研究為理解論文提出的GWT方法提供了背景,并展示了該方法在現有研究基礎上的創新和改進。

Q: 論文如何解決這個問題?

完整的圖和具有預先指定的節點號的星型生成樹

2跳消息傳遞路徑,紅色節點為中心節點,灰色節點是葉節點

A: 論文通過以下幾個關鍵步驟解決了提高ASTGNNs計算效率的問題:

  1. 引入圖中獎票(GWT)概念:基于彩票假設(LTH),論文提出了圖中獎票的概念,這是一種存在于ASTGNNs可學習空間圖中的高效子網絡,可以在減少計算成本的同時保持模型性能。
  2. 預確定星型拓撲:論文提出使用星型拓撲作為GWT,這種拓撲結構在減少邊數的同時,仍然保持了有效的信息傳播能力。星型拓撲的直徑為2,可以在兩層AGCN中實現全局空間依賴性的建模。
  3. 降低計算復雜度:通過使用星型拓撲,論文將生成自適應時空圖的時間和內存計算復雜度從O(𝑁^2)顯著降低到O(𝑁)。
  4. 簡化訓練過程:論文的方法避免了傳統訓練過程中的迭代訓練、剪枝和重訓練的需要,從而簡化了ASTGNNs的部署。
  5. 理論和實證分析:論文從譜圖理論的角度提供了對GWT有效性的深入分析,并在多個數據集上通過實驗驗證了星型拓撲作為GWT的性能。
  6. 提出GWT-AGCN層:為了進一步提高效率和硬件兼容性,論文提出了一種新的GWT-AGCN層,該層使用矩陣乘法和標準激活函數,與傳統AGCN層相比,具有更低的計算復雜度和更好的硬件兼容性。
  7. 中心節點選擇和初始化:論文討論了中心節點選擇的重要性,并提出了一種平均初始化方法,以確保中心節點嵌入向量位于節點嵌入空間的物理中心,從而提高模型的預測精度。

通過這些方法,論文不僅提高了ASTGNNs的計算效率,還保持了模型性能,甚至在某些情況下達到了最先進的性能水平。

Q: 論文做了哪些實驗?

數據集

整體性能比較

*與★的說明

效率評估

A: 論文中進行了一系列實驗來驗證所提出方法的有效性,實驗主要包括以下幾個方面:

  1. 實驗設置
    • 使用了兩種典型的ASTGNN架構:AGCRN和Graph WaveNet (GWNET)。
    • 在五個大型時空數據集上進行實驗,包括PEMS07、SD、GBA、GLA和CA。
  2. 性能評估
    • 使用了三個標準的預測準確度指標:平均絕對誤差(MAE)、均方根誤差(RMSE)和平均絕對百分比誤差(MAPE)。
  3. 效率評估
    • 評估了模型訓練和推理的墻鐘時間。
    • 報告了訓練過程中的批量大小,以反映模型處理大規模數據集的能力。
  4. 主要結果
    • 展示了AGCRN和GWNET在不同數據集上的性能和效率比較。
    • 證明了在所有數據集上,使用GWT的ASTGNNs(AGCRN★和GWNET★)與原始模型相比具有可比或更優的性能。
  5. 收斂性分析
    • 展示了原始AGCRN和AGCRN★在PEMS07和SD數據集上的損失和測試MAE曲線,證明了預確定的GWT確保了與完整圖模型同樣一致、快速和穩定的收斂性。
  6. 與最新技術比較
    • 將AGCRN和GWNET與當前最先進的STGNNs進行了比較,包括DGCRN、MegaCRN、STGODE、D2STGNN和DSTAGNN。
  7. 節點嵌入初始化的影響分析
    • 對AGCRN★進行了消融研究,比較了平均初始化和隨機初始化對模型預測精度的影響。
  8. 與AGS方法的比較
    • 將所提出的方法與現有的AGS方法進行了比較,證明了所提出方法的優越性。
  9. T★的魯棒性分析
    • 通過引入T★的擾動過程,研究了T★的連通性對ASTGNN建模全局空間依賴性的重要性。

這些實驗全面評估了所提出方法在不同方面的表現,包括預測準確性、計算效率、收斂速度、魯棒性等,從而為論文的主張提供了有力的實證支持。

LOSS收斂,體現更快收斂

AGS(自適應圖稀疏化)與AGCRN中的方法之間的比較實驗結果

AGCRN* 和 GWNET* 與當前最先進的 STGNN 相比

消融實驗

擾動比為𝑝的擾動過程

Q: 總結一下論文的主要內容

A: 這篇論文的主要內容可以概括為以下幾個要點:

  1. 問題提出:論文針對自適應時空圖神經網絡(ASTGNNs)在大規模時空數據上的訓練和推理階段存在的高計算開銷問題,提出了一種新的方法來提高計算效率。
  2. 方法介紹:引入了基于彩票假設(LTH)的圖中獎票(GWT)概念,通過預訓練前確定星型拓撲結構作為GWT,以減少邊數同時保持有效信息傳播,從而降低計算復雜度。
  3. 理論支持:利用譜圖理論為星型拓撲的有效性提供了理論分析和證明,證明了星型拓撲是完整圖的一個良好近似,能夠學習到空間時間依賴性。
  4. 實驗驗證:在多個大型時空數據集上進行了實驗,驗證了使用GWT的ASTGNNs在保持或甚至超越完整模型性能的同時,顯著降低了計算成本。
  5. 效率和性能:論文的方法不僅減少了模型的計算需求,還展示了在不同數據集上與現有模型相比的可比性或優越性。
  6. 簡化訓練過程:通過預確定GWT,避免了傳統訓練過程中的迭代訓練、剪枝和重訓練的需要,簡化了ASTGNNs的部署。
  7. GWT-AGCN層:提出了GWT-AGCN層,提高了模型的硬件兼容性和計算效率。
  8. 中心節點選擇:討論了中心節點選擇的重要性,并提出了平均初始化方法來提高模型的預測精度。
  9. 未來工作:論文最后提出了一些可能的研究方向,包括長期預測、不同拓撲結構的GWT、跨領域適用性等。

出了GWT-AGCN層,提高了模型的硬件兼容性和計算效率。
8. 中心節點選擇:討論了中心節點選擇的重要性,并提出了平均初始化方法來提高模型的預測精度。
9. 未來工作:論文最后提出了一些可能的研究方向,包括長期預測、不同拓撲結構的GWT、跨領域適用性等。

總的來說,這篇論文在理論和實踐層面都為ASTGNNs的效率和實用性提供了顯著的改進,并通過實驗驗證了其有效性。

本文來自互聯網用戶投稿,該文觀點僅代表作者本人,不代表本站立場。本站僅提供信息存儲空間服務,不擁有所有權,不承擔相關法律責任。
如若轉載,請注明出處:http://www.pswp.cn/diannao/38073.shtml
繁體地址,請注明出處:http://hk.pswp.cn/diannao/38073.shtml
英文地址,請注明出處:http://en.pswp.cn/diannao/38073.shtml

如若內容造成侵權/違法違規/事實不符,請聯系多彩編程網進行投訴反饋email:809451989@qq.com,一經查實,立即刪除!

相關文章

Python數據分析-股票分析和可視化(深證指數)

一、內容簡介 股市指數作為衡量股市整體表現的重要工具,不僅反映了市場的即時狀態,也提供了經濟健康狀況的關鍵信號。在全球經濟體系中,股市指數被廣泛用于預測經濟活動,評估投資環境,以及制定財政和貨幣政策。在中國…

IEEE JSTSP綜述:從信號處理領域分析視觸覺傳感器的研究

觸覺傳感器是機器人系統的重要組成部分,雖然與視覺相比觸覺具有較小的感知面積,但卻可以提供機器人與物體交互過程中更加真實的物理信息。 視覺觸覺傳感是一種分辨率高、成本低的觸覺感知技術,被廣泛應用于分類、抓取、操作等領域中。近期&a…

R-CNN和YOLO的各自優缺點

R-CNN(包括其改進版本如Faster R-CNN和Mask R-CNN)與YOLO(You Only Look Once)是兩種常用的物體檢測算法,它們各自有不同的優缺點,適用于不同的應用場景和需求。 R-CNN 系列 優點: 高精度&am…

如何跑起來一個前后端項目

后端部署 第一步配置自己的maven 第二步優先導入自己本地jar包當本地沒有在從遠程下載 第三步找到配置文件 第四步成功運行后端部署完畢 前端部署 第一步看看項目node_modules有沒有文件如果有就是已經安裝好了對應的依賴,沒有執行npm install 第二步運行即可

決策樹劃分屬性依據

劃分依據 基尼系數基尼系數的應用信息熵信息增益信息增益的使用信息增益準則的局限性 最近在學習項目的時候經常用到隨機森林,所以對決策樹進行探索學習。 基尼系數 基尼系數用來判斷不確定性或不純度,數值范圍在0~0.5之間,數值越低&#x…

【知識學習】Unity3D中Scriptable Render Pipeline的概念及使用方法示例

Unity3D中的Scriptable Render Pipeline(SRP)是一種高度可定制的渲染管線框架,允許開發者完全控制渲染流程,以適應不同的渲染需求和硬件平臺。SRP使得開發者可以編寫自己的渲染邏輯,包括攝像機管理、渲染設置、光照處理…

【機器學習】K-means++: 一種改進的聚類算法詳解

🌈個人主頁: 鑫寶Code 🔥熱門專欄: 閑話雜談| 炫酷HTML | JavaScript基礎 ?💫個人格言: "如無必要,勿增實體" 文章目錄 K-means: 一種改進的聚類算法詳解引言1. K-means算法回顧1.1 基本概念1.2 局限性…

Java的多彩之旅

Java的多彩之旅,確實是一場技術與創新的盛宴。下面,我們將探索它如何在不同領域展現其魅力和功能,從基礎到前沿,一步步揭開Java的神秘面紗。 基礎開發:清新之源 Java的基礎語法簡潔而嚴謹,是學習之旅的起…

Mongodb的體系結構,語法,底層原理,怎么開發使用,使用場景有哪些?

MongoDB 教材 MongoDB 是一個開源的 NoSQL 數據庫,以其高性能、高可用性和自動擴展性廣受歡迎。本文將詳細介紹 MongoDB 的體系結構、語法、底層原理、開發使用方法及常見使用場景。 目錄 MongoDB 簡介MongoDB 體系結構MongoDB 語法 基本操作高級查詢聚合操作 底…

RDMA建鏈的3次握手和斷鏈的4次揮手流程?

文章目錄 基礎信息建鏈 3次握手斷鏈4次揮手建聯狀態active端passive端 報文結構函數關系其他后記 基礎信息 CM: Communication Management 通信管理 連接管理SIDR: Service ID Resolution Protocol. 作用: enables users of Unreliable Datagram service to locate …

實驗4 圖像空間濾波

1. 實驗目的 ①掌握圖像空間濾波的主要原理與方法; ②掌握圖像邊緣提取的主要原理和方法; ③了解空間濾波在圖像處理和機器學習中的應用。 2. 實驗內容 ①調用 Matlab / Python OpenCV中的函數,實現均值濾波、高斯濾波、中值濾波等。 ②調…

【操作系統期末速成】 EP02 | 學習筆記(基于五道口一只鴨)

文章目錄 一、前言🚀🚀🚀二、正文:??????2.1 考點二:操作系統的功能及接口2.2 考點三:操作系統的發展及分類2.3 考點四:操作系統的運行環境(重要) 一、前言&#x…

從零開始三天學會微信小程序開發(三)

看到不少入門的小程序開發者不斷的問重復性的問題,我們從實戰角度開發了這個課程,希望能夠幫助大家了解小程序開發。 課程分三天: 第一天:微信小程序開發入門第二天:給小程序接入云端數據第三天:完善我的…

MySQL高級-MVCC- readview介紹

文章目錄 1、介紹2、ReadView中包含了四個核心字段:3、版本鏈數據的訪問規則:4、不同的隔離級別,生成ReadView的時機不同: 1、介紹 ReadView(讀視圖)是 快照讀 SQL執行時MVCC提取數據的依據,記錄…

【計算機組成原理實驗】——運算器組成實驗

計組TEC4實驗——運算器組成實驗 1. 實驗目的 (1)掌握算術邏輯運算加、減、乘、與的工作原理。 (2) 熟悉簡單運算器的數據傳送通路。 (3) 驗證實驗臺運算器的8位加、減、與、直通功能。 (4) 驗證實驗臺的4位乘4位功能。 (5) 按給定數據,完成幾種指…

SerDes介紹以及原語使用介紹(4)ISERDESE2原語仿真

文章目錄 前言一、iserdese2_module模塊二、oserdese2_module模塊三、頂層模塊四、仿真結果分析 前言 上文詳細介紹了ISERDESE2原語的使用,本文根據仿真對ISERDESE2原語的使用進一步加深印象。在仿真時,與OSERDESE進行回環。 一、iserdese2_module模塊…

昇思MindSpore學習筆記4--數據集 Dataset

昇思MindSpore學習筆記4--數據集 Dataset 摘要: 昇思MindSpore數據集Dataset的加載、數據集常見操作和自定義數據集方法。 一、數據集 Dataset概念 MindSpore數據引擎基于Pipeline 數據預處理相關模塊: 數據集Dataset加載原始數據,支持文本…

移動端H5應用,使用了postcss-px-to-viewport插件,750設計稿兼容Vant框架

目前在搞一個移動端的H5項目,使用的是Vue3Vant框架。設計稿是750的,而且使用了postcss-px-to-viewport。所以發現使用Vant框架的時候,發現有點問題,好像縮小了,后來百度了一下,是需要設置portcss.config.js…

vue components

vue components intro 組件是帶有名稱的可復用實例。 因為組件是可復用的組件實例,所以它們與根實例接收相同的選項,例如 data、computed、watch、methods 以及生命周期鉤子等。 組成 props: 組件的attributes,可以傳任意類型…

大創項目推薦 題目:基于機器視覺的圖像矯正 (以車牌識別為例) - 圖像畸變校正

文章目錄 0 簡介1 思路簡介1.1 車牌定位1.2 畸變校正 2 代碼實現2.1 車牌定位2.1.1 通過顏色特征選定可疑區域2.1.2 尋找車牌外圍輪廓2.1.3 車牌區域定位 2.2 畸變校正2.2.1 畸變后車牌頂點定位2.2.2 校正 7 最后 0 簡介 🔥 優質競賽項目系列,今天要分享…