Self-Pro: A Self-Prompt and Tuning Framework for Graph Neural Networks

Self-Pro: A Self-Prompt and Tuning Framework for Graph Neural Networks

?#paper/GFM/GNN-BASED#? #paper/???#?

注意:這篇文章是每個圖一個GCN模型,而不是所有圖一個GCN 模型

算是最早的涉及異配圖的prompt了

貢獻和動機:

  1. 非對稱圖對比學習(GraphACL)
    提出一種預訓練方法,通過非對稱對比學習捕獲節點間的高階相似性,避免傳統方法對同質圖(homophily)的依賴,有效處理異質圖。

  2. 統一任務模板
    將預訓練與下游任務(如節點分類、鏈接預測)統一為相似性計算模板,減少目標差異導致的負遷移問題。例如,節點分類通過類原型(class prototype)與節點的相似性進行預測。

  3. 自適配器與參數重用
    重用預訓練階段的投影器(projector)作為下游任務的適配器(self-adapter),無需額外參數,顯著提升調優效率。

  4. 自提示機制

    • 結構提示:通過添加兩跳鄰居等結構信息增強上下文表示。
    • 語義提示:利用節點屬性(如替換鄰接矩陣為單位矩陣)保留語義信息。
      提示生成基于圖自身信息,而非隨機初始化,提升穩定性和泛化能力。

方法:

對比學習的三種方法:

?image?

作者使用了第三種方法,并認為 g ( ? ) g(\cdot) g(?)可以引入語義信息

方法框架:

?image?

由于對應上面第三種方法,其對比損失可以為:

L = ? 1 ∣ V ∣ ∑ v ∈ V 1 ∣ N ( v ) ∣ ∑ v + ∈ N ( v ) log ? exp ? ( z v T h v + / τ ) exp ? ( z v T h v + / τ ) + ∑ v ? ∈ V ? exp ? ( h v T h v ? / τ ) , \mathcal{L}=-\frac{1}{|\mathcal{V}|}\sum_{v\in\mathcal{V}}\frac{1}{|\mathcal{N}(v)|}\sum_{v^+\in\mathcal{N}(v)}\log\frac{\exp(\mathbf{z}_v{}^\mathsf{T}\mathbf{h}_{v^+}/\tau)}{\exp(\mathbf{z}_v{}^\mathsf{T}\mathbf{h}_{v^+}/\tau)+\sum_{v^-\in\mathcal{V}^-}\exp(\mathbf{h}_v{}^\mathsf{T}\mathbf{h}_{v^-}/\tau)}, L=?V1?vV?N(v)1?v+N(v)?logexp(zv?Thv+?/τ)+v?V??exp(hv?Thv??/τ)exp(zv?Thv+?/τ)?,

其中,z是映射頭g的輸出。

節點分類任務

節點分類任務的話,作者采用了原型向量(prototype: C = { t 1 , t 2 , … , t C } \mathcal{C}=\{\mathbf{t}_1,\mathbf{t}_2,\ldots,\mathbf{t}_C\} C={t1?,t2?,,tC?}。作者通過labeled節點的token均值來初始化原型向量。

t c = 1 N c ∑ v ∈ V L , y v = c t v , ? c ∈ 1 , 2 , … C , \mathbf{t}_c=\frac{1}{N_c}\sum_{v\in\mathcal{V}_L,y_v=c}\mathbf{t}_v,\forall c\in1,2,\ldots C, tc?=Nc?1?vVL?,yv?=c?tv?,?c1,2,C,

Self-prompt結構:

  1. 預訓練的架構: θ ? , ? ? = arg ? min ? θ , ? L p r e ( f θ , g ? , G ) \theta^*,\phi^*=\arg\min_{\theta,\phi}\mathcal{L}_{pre}(f_\theta,g_\phi,\mathcal{G}) θ?,??=argminθ,??Lpre?(fθ?,g??,G)

  2. prompt時,GNN backbone應該是凍結的。作者認為 g ? g_{\phi} g??可以包含更多的語義,應該用于下游訓練。因此下游任務的優化可以表示為: ? ? ? = arg ? min ? ? ? L d o w ( g ? ? , V L , Y ) \phi^{**}=\arg\min_{\phi^*}\mathcal{L}_{dow}(g_{\phi^*},\mathcal{V}_L,\mathcal{Y}) ???=argmin???Ldow?(g???,VL?,Y)

  3. 自結構語義的構建:作者認為2-hop代表同配性,并包含豐富的語義信息。因此: t v = f θ ( G 2 ) [ v ] = f θ ( A 2 , X ) [ v ] \mathbf{t}_v=f_\theta(\mathcal{G}_2)[v]=f_\theta(\mathbf{A}_2,\mathbf{X})[v] tv?=fθ?(G2?)[v]=fθ?(A2?,X)[v]

  4. 子語義提示:

    s v = f θ ( G I ) [ v ] = f θ ( I , X ) [ v ] . \mathbf{s}_{v}=f_{\theta}(\mathcal{G}_{I})[v]=f_{\theta}(\mathbf{I},\mathbf{X})[v]. sv?=fθ?(GI?)[v]=fθ?(I,X)[v].

    h v = f θ ( G ) [ v ] = f θ ( A , X ) [ v ] . \mathbf{h}_v=f_\theta(\mathcal{G})[v]=f_\theta(\mathbf{A},\mathbf{X})[v]. hv?=fθ?(G)[v]=fθ?(A,X)[v].?

    t v = w v s v + ( 1 ? w v ) h v , w v = s i m ( h v , s v ) , \mathbf{t}_v=w_v\mathbf{s}_v+(1-w_v)\mathbf{h}_v,w_v=sim(h_v,s_v), tv?=wv?sv?+(1?wv?)hv?,wv?=sim(hv?,sv?),

  5. Prompt tuning:節點分類: L d o w = ? ∑ v ∈ V L log ? exp ? ( t ′ v t ′ y v / τ ) exp ? ( t ′ v T t ′ y v / τ ) + ∑ c = 1 , c ≠ y v C exp ? ( t ′ v T t ′ c / τ ) , \mathcal{L}_{dow}=-\sum_{v\in\mathcal{V}_{L}}\log\frac{\exp(\mathbf{t^{\prime}}_{v}\mathbf{t^{\prime}}_{y_{v}}/\tau)}{\exp(\mathbf{t^{\prime}}_{v}^{\mathsf{T}}\mathbf{t^{\prime}}_{y_{v}}/\tau)+\sum_{c=1,c\neq y_{v}}^{C}\exp(\mathbf{t^{\prime}}_{v}^{\mathsf{T}}\mathbf{t^{\prime}}_{c}/\tau)}, Ldow?=?vVL??logexp(tvT?tyv??/τ)+c=1,c=yv?C?exp(tvT?tc?/τ)exp(tv?tyv??/τ)?,其中, t ′ v = q ? ( t v ) \mathbf{t^{\prime}}_{v}=q_{\phi}(\mathbf{t}_{v}) tv?=q??(tv?)

  6. L d o w = ? ∑ ( v , a , b ) ∈ T log ? exp ? ( t ′ v T t ′ a / τ ) exp ? ( t ′ v T t ′ a / τ ) + exp ? ( t ′ v T t ′ b / τ ) \mathcal{L}_{dow}=-\sum_{(v,a,b)\in\mathcal{T}}\log\frac{\exp(\mathbf{t^{\prime}}_v^\mathsf{T}\mathbf{t^{\prime}}_a/\tau)}{\exp(\mathbf{t^{\prime}}_v^\mathsf{T}\mathbf{t^{\prime}}_a/\tau)+\exp(\mathbf{t^{\prime}}_v^\mathsf{T}\mathbf{t^{\prime}}_b/\tau)} Ldow?=?(v,a,b)T?logexp(tvT?ta?/τ)+exp(tvT?tb?/τ)exp(tvT?ta?/τ)?

結果:

?image?

?image?

本文來自互聯網用戶投稿,該文觀點僅代表作者本人,不代表本站立場。本站僅提供信息存儲空間服務,不擁有所有權,不承擔相關法律責任。
如若轉載,請注明出處:http://www.pswp.cn/web/71485.shtml
繁體地址,請注明出處:http://hk.pswp.cn/web/71485.shtml
英文地址,請注明出處:http://en.pswp.cn/web/71485.shtml

如若內容造成侵權/違法違規/事實不符,請聯系多彩編程網進行投訴反饋email:809451989@qq.com,一經查實,立即刪除!

相關文章

寶塔 Linux 計劃任務中添加運行項目網站PHP任務-定時任務

一、指定php版運行, cd /www/wwwroot/www.xxx.com/ && /www/server/php/56/bin/php think timedtasks start >> /tmp/timedtasks.log 2>&1 二、不指定php版 cd /www/wwwroot/www.xxx.com/ && php think timedtasks start >> …

【電控筆記z29】擾動估測器DOB估測慣量J-摩擦系數B

基本原理 擾動估測器的核心思想是通過向電機系統施加特定的擾動信號,觀察系統響應的變化,然后利用系統的動態模型和控制理論來估計未知參數,如慣量和摩擦系數 。一般基于電機的運動方程建立數學模型,結合觀測到的電機實際運行數據…

要查看 SQLite 數據庫中的所有表,可以通過查詢 SQLite 的系統表 sqlite_master

要查看 SQLite 數據庫中的所有表,可以查詢 SQLite 的系統表 sqlite_master。 每個 SQLite 數據庫都包含一個名為 sqlite_master 的系統表。該表定義了數據庫的模式,存儲了數據庫中所有表、索引、視圖和觸發器等對象的信息。 通過查詢 sqlite_master&am…

如何在Spring Boot中讀取JAR包內resources目錄下文件

精心整理了最新的面試資料和簡歷模板,有需要的可以自行獲取 點擊前往百度網盤獲取 點擊前往夸克網盤獲取 以下是如何在Spring Boot中讀取JAR包內resources目錄下文件的教程,分為多種方法及詳細說明: 方法1:使用 ClassPathResour…

清華大學DeepSeek賦能家庭教育【附下載鏈接】

核心要點: DeepSeek通過基礎模型(V3)、深度思考模型(R1)及聯網模型,為家庭教育提供分層支持:V3用于作業輔導,R1培養批判性思維,聯網模型助力探究性學習。家長需遵循目標導…

C語言番外篇(5)-------------->作用域與生命周期

作用域與生命周期是非常重要的編程知識。本篇文章使用C語言講述作用域與生命周期。 一、作用域 在程序設計中,變量并非總是有效的,可以使用的區域就是作用域。 1.1局部變量的作用域 在{}中的都是局部變量,只是作用大小不一樣而已。我們可…

若依前后端分離版使用Electron打包前端Vue為Exe文件

1.前言 本文詳細介紹如何使用electron將若依框架前后端分離版的前端Vue頁面打包為Exe文件,并且包括如何實現應用更新。使用若依基礎代碼體現不出打包功能,因此我使用開發的文件管理系統,介紹上述過程,具體可以查看我的文章《若依…

Linux——Docker容器內MySQL密碼忘記了如何查看

目錄 查看正在運行的MySQL的容器ID 方法一:查看MySQL容器的日志里的密碼 方法二:通過環境變量密碼登錄 方法三:修改密碼 查看正在運行的MySQL的容器ID docker ps 方法一:查看MySQL容器的日志里的密碼 docker logs [MySQL的容器…

康謀分享 | 3DGS:革新自動駕駛仿真場景重建的關鍵技術

隨著自動駕駛技術的迅猛發展,構建高保真、動態的仿真場景成為了行業的迫切需求。傳統的三維重建方法在處理復雜場景時常常面臨效率和精度的挑戰。在此背景下,3D高斯點陣渲染(3DGS)技術應運而生,成為自動駕駛仿真場景重…

大模型架構記錄2

一 應用場景 1.1 prompt 示例 1.2 自己搭建一個UI界面,調用接口 可以選用不同的模型,需要對應的API KEY 二 Agent 使用 2.1 構建GPT

【C++】二叉樹相關算法題

一、根據二叉樹創建字符串 題目描述: 給你二叉樹的根節點 root ,請你采用前序遍歷的方式,將二叉樹轉化為一個由括號和整數組成的字符串,返回構造出的字符串。 空節點使用一對空括號對 “()” 表示,轉化后需要省略所有…

【機械視覺】C#+visionPro聯合編程———【一、C# + VisionPro 聯合編程詳解以及如何將visionPro工具加載到winform】

機械視覺與 C# VisionPro 聯合編程詳解 目錄 機械視覺與 C# VisionPro 聯合編程詳解 概念 應用場景 1. 工業檢測與質量控制缺陷檢測 2. 定位與機器人引導 3. 識別與分類 4. 復雜流程控制 將visionPro工具加載到winform 環境準備 一、創建winform項目 二、打開窗體…

修改hosts文件,修改安全屬性,建立自己的DNS

初級代碼游戲的專欄介紹與文章目錄-CSDN博客 我的github:codetoys,所有代碼都將會位于ctfc庫中。已經放入庫中我會指出在庫中的位置。 這些代碼大部分以Linux為目標但部分代碼是純C的,可以在任何平臺上使用。 源碼指引:github源…

對NXP提供的BSP里邊所使用的u-boot的環境變量`bootcmd`的解析

為什么我們要解析環境變量bootcmd? 承接博文 https://blog.csdn.net/wenhao_ir/article/details/145902134 繼續解析u-boot的環境變量bootcmd。 為什么要解析u-boot的這個環境變量bootcmd?因為如果u-boot在倒計時完后,首先執行的是就是下面這條命令&am…

NSSCTF [SWPUCTF 2024 秋季新生賽]金絲雀

5948.[SWPUCTF 2024 秋季新生賽]金絲雀 canary繞過和64位的ret2libc(格式化字符串泄露) (1) motalymotaly-VMware-Virtual-Platform:~/桌面$ file xn xn: ELF 64-bit LSB executable, x86-64, version 1 (SYSV), dynamically linked, interpreter /lib64/ld-linux-x86-64.so.…

神經網絡中梯度計算求和公式求導問題

以下是公式一推導出公式二的過程。 表達式一 ? E ? w j k ? 2 ( t k ? o k ) ? sigmoid ( ∑ j w j k ? o j ) ? ( 1 ? sigmoid ( ∑ j w j k ? o j ) ) ? ? ? w j k ( ∑ j w j k ? o j ) \frac{\partial E}{\partial w_{jk}} -2(t_k - o_k) \cdot \text{sigm…

koa-session設置Cookie后獲取不到

在谷歌瀏覽器中請求獲取不到cookie問題之一(谷歌安全策略) 場景 前端使用 axios 請求,項目地址:http://192.168.8.1:5173 import axios from axiosconst request axios.create({baseURL: http://127.0.0.1:3001/,timeout: 60000,…

單元測試與仿真程序之間的選擇

為什么寫這篇文章 現在的工作需求,讓我有必要總結和整理一下。 凡事都有適用的場景。首先這里我需要提示一下,這里的信息,可能并不普適。 但是可以肯定一點的是,有些人,不論做事還是寫書,上下文還沒有交待…

如何在Android中實現圖片加載和緩存

在Android中實現圖片加載和緩存是提升應用性能和用戶體驗的關鍵環節。高效的圖片加載和緩存策略能夠減少內存占用、避免應用卡頓,并快速響應用戶的圖片查看需求。以下是在Android中實現圖片加載和緩存的幾種常見方法: 一、使用第三方圖片加載庫 1. Gli…

FusionInsight MRS云原生數據湖

FusionInsight MRS云原生數據湖 1、FusionInsight MRS概述2、FusionInsight MRS解決方案3、FusionInsight MRS優勢4、FusionInsight MRS功能 1、FusionInsight MRS概述 1.1、數據湖概述 數據湖是一個集中式存儲庫,允許以任意規模存儲所有結構化和非結構化數據。可以…