Self-Pro: A Self-Prompt and Tuning Framework for Graph Neural Networks

?#paper/GFM/GNN-BASED#? #paper/???#?

注意：這篇文章是每個圖一個GCN模型，而不是所有圖一個GCN 模型

算是最早的涉及異配圖的prompt了

貢獻和動機：

非對稱圖對比學習（GraphACL）
提出一種預訓練方法，通過非對稱對比學習捕獲節點間的高階相似性，避免傳統方法對同質圖（homophily）的依賴，有效處理異質圖。
統一任務模板
將預訓練與下游任務（如節點分類、鏈接預測）統一為相似性計算模板，減少目標差異導致的負遷移問題。例如，節點分類通過類原型（class prototype）與節點的相似性進行預測。
自適配器與參數重用
重用預訓練階段的投影器（projector）作為下游任務的適配器（self-adapter），無需額外參數，顯著提升調優效率。
自提示機制
- 結構提示：通過添加兩跳鄰居等結構信息增強上下文表示。
- 語義提示：利用節點屬性（如替換鄰接矩陣為單位矩陣）保留語義信息。
  提示生成基于圖自身信息，而非隨機初始化，提升穩定性和泛化能力。

方法：

對比學習的三種方法：

作者使用了第三種方法，并認為 $g(\cdot)$ 可以引入語義信息

方法框架：

由于對應上面第三種方法，其對比損失可以為：

$\mathcal{L}=-\frac{1}{|\mathcal{V}|}\sum_{v\in\mathcal{V}}\frac{1}{|\mathcal{N}(v)|}\sum_{v^+\in\mathcal{N}(v)}\log\frac{\exp(\mathbf{z}_v{}^\mathsf{T}\mathbf{h}_{v^+}/\tau)}{\exp(\mathbf{z}_v{}^\mathsf{T}\mathbf{h}_{v^+}/\tau)+\sum_{v^-\in\mathcal{V}^-}\exp(\mathbf{h}_v{}^\mathsf{T}\mathbf{h}_{v^-}/\tau)},$

其中，z是映射頭g的輸出。

節點分類任務

節點分類任務的話，作者采用了原型向量(prototype： $\mathcal{C}=\{\mathbf{t}_1,\mathbf{t}_2,\ldots,\mathbf{t}_C\}$ 。作者通過labeled節點的token均值來初始化原型向量。

$\mathbf{t}_c=\frac{1}{N_c}\sum_{v\in\mathcal{V}_L,y_v=c}\mathbf{t}_v,\forall c\in1,2,\ldots C,$

Self-prompt結構：

預訓練的架構： $\theta^*,\phi^*=\arg\min_{\theta,\phi}\mathcal{L}_{pre}(f_\theta,g_\phi,\mathcal{G})$
prompt時，GNN backbone應該是凍結的。作者認為 $g_{\phi}$ 可以包含更多的語義，應該用于下游訓練。因此下游任務的優化可以表示為： $\phi^{**}=\arg\min_{\phi^*}\mathcal{L}_{dow}(g_{\phi^*},\mathcal{V}_L,\mathcal{Y})$
自結構語義的構建：作者認為2-hop代表同配性，并包含豐富的語義信息。因此： $\mathbf{t}_v=f_\theta(\mathcal{G}_2)[v]=f_\theta(\mathbf{A}_2,\mathbf{X})[v]$
子語義提示：

$\mathbf{s}_{v}=f_{\theta}(\mathcal{G}_{I})[v]=f_{\theta}(\mathbf{I},\mathbf{X})[v].$

$\mathbf{h}_v=f_\theta(\mathcal{G})[v]=f_\theta(\mathbf{A},\mathbf{X})[v].$ ?

$\mathbf{t}_v=w_v\mathbf{s}_v+(1-w_v)\mathbf{h}_v,w_v=sim(h_v,s_v),$
Prompt tuning：節點分類： $\mathcal{L}_{dow}=-\sum_{v\in\mathcal{V}_{L}}\log\frac{\exp(\mathbf{t^{\prime}}_{v}\mathbf{t^{\prime}}_{y_{v}}/\tau)}{\exp(\mathbf{t^{\prime}}_{v}^{\mathsf{T}}\mathbf{t^{\prime}}_{y_{v}}/\tau)+\sum_{c=1,c\neq y_{v}}^{C}\exp(\mathbf{t^{\prime}}_{v}^{\mathsf{T}}\mathbf{t^{\prime}}_{c}/\tau)},$ 其中， $\mathbf{t^{\prime}}_{v}=q_{\phi}(\mathbf{t}_{v})$
$\mathcal{L}_{dow}=-\sum_{(v,a,b)\in\mathcal{T}}\log\frac{\exp(\mathbf{t^{\prime}}_v^\mathsf{T}\mathbf{t^{\prime}}_a/\tau)}{\exp(\mathbf{t^{\prime}}_v^\mathsf{T}\mathbf{t^{\prime}}_a/\tau)+\exp(\mathbf{t^{\prime}}_v^\mathsf{T}\mathbf{t^{\prime}}_b/\tau)}$

結果：

本文來自互聯網用戶投稿，該文觀點僅代表作者本人，不代表本站立場。本站僅提供信息存儲空間服務，不擁有所有權，不承擔相關法律責任。
如若轉載，請注明出處：http://www.pswp.cn/web/71485.shtml
繁體地址，請注明出處：http://hk.pswp.cn/web/71485.shtml
英文地址，請注明出處：http://en.pswp.cn/web/71485.shtml

如若內容造成侵權/違法違規/事實不符，請聯系多彩編程網進行投訴反饋email:809451989@qq.com，一經查實，立即刪除！