WWW‘25一通讀 |圖Anomaly/OOD檢測相關文章(1)

寫在前面:進入新一輪學習階段,從閱讀開始。
本文分享的是WWW2025收錄的與作者研究相近的graph-based xx相關paper的閱讀筆記,含個人理解,僅供參考😄

0x01 HEI:利用不變性原理實現異配圖結構分布偏移學習

Jinluan Yang, et al. Leveraging Invariant Principle for Heterophilic Graph Structure.(浙大)

1.1 摘要

異配圖神經網絡(Heterophilic graph neural networks, HGNNs)在圖的半監督學習任務中表現出了良好的效果。值得注意的是,大多數現實世界中的異配圖是由不同鄰接模式的節點混合而成的,呈現出局部節點級別的同配(Homophilic)和異配結構。

然而,現有的研究僅致力于設計更好的統一的HGNN架構,以同時用于異配和同配圖上的節點分類任務,弄且它們對HGNN性能關于節點的分析僅基于已確定的數據分布,而沒有探索由于訓練節點和測試節點的結構模式差異所導致的影響。如何在異配圖上學習不變的節點表示以處理這種結構差異活分布變化仍未得到探索。

在本文中,我們首先從數據增強的角度討論了以往基于圖的不變學習方法在解決異配圖結構分布偏移的局限性。
然后,我們提出了HEI這一框架,它能夠通過整合異配信息(即節點的估計鄰接模式)來生成不變的節點表示,從而在無需擴充數據的情況下推斷出潛在環境,并用于不變性預測。
我們提供了詳細的理論保證以闡明HEI的合理性。在各種基準測試和骨干網絡上的大量實驗也表明,與現有的SOTA基線相比,我們的方法具有有效性和魯棒性。

開源代碼:HEI

1.2 背景與動機

異配圖結構分布偏移(Heterophilic Graph Structure distribution Shift, HGSS):一種全新的數據分布偏移視角,用于重新審視現有的HGNNs工作。

盡管前景可觀,但大多數先前的HGNNs假設節點共享已確定的數據分布,我們認為不同鄰接模式的節點之間存在數據分布差異。如圖1(a1)所示,異配圖由具有局部同配性和異配性結構的節點混合組成,即節點具有不同的鄰接模式。節點的鄰接模式可以通過節點同配性來衡量,通過比較節點與其鄰接節點的標簽來表示同配水平。在此,我們將訓練節點和測試節點之間不同的鄰接模式識別為異配圖結構分布偏移(圖1(a2))。這種偏移在先前的工作中被忽視,但實際上影響了GNN的性能。如圖1(a3)所示,我們在Squirrel數據集上可視化了訓練節點和測試節點之間的HGSS。與測試節點相比,訓練節點更傾向于高同配性,這可能導致測試性能下降。
值得注意的是,盡管一些近期的研究也探討了同配和異配結構模式,但到目前為止,它們尚未為這一問題提供明確的技術解決方案。與專注于backbone設計的傳統HGNN研究相比,從數據分布的角度尋求解決方案以解決HGSS問題顯得尤為迫切。

現有基于圖的不變性學習(Invariant learning)方法由于采用了基于擴充的環境構建策略,在處理HGSS問題時表現不佳。
在一般分布變化的背景下,不變性學習技術因其在減輕這方面的有效性越來越受到認可。其基本方法是學習節點表示,以促進在各種構建環境中進行不變性預測器的學習(圖1(b1)),遵循風險外推(Risk Extrapolation, REx)原則。不幸的是,之前的基于圖的不變學習方法可能無法有效地解決HGSS問題,主要是因為明確的環境可能對不變性學習無效。如(圖1(c1))所示,在HGSS設置中,改變原始結構并不總是能影響節點的鄰接模式。實際上,獲得與鄰域模式相關的最優且多樣的環境是具有挑戰性的。我們的觀察(圖1(c2))表明,EERM,一種利用環境擴充來解決節點級任務中的圖分布變化的開創性不變性學習方法,在HGSS設置下表現不佳。有時,其改進效果還不如直接采用原始的V-Rex方法,后者是通過將訓練節點隨機分布在不同的環境組中實現的。我們將這種現象歸因于不合理的環境構建。根據我們的分析,EERM實質上是V-Rex的節點環境增強版,即它們之間的性能差異僅僅被不同的環境構建策略影響。
HEI動機說明圖圖1:(a)展示了異配圖結構分布偏移,其中圖表和直方圖顯示了HGSS以及鄰接模式在Squirrel數據集上的訓練節點與測試節點之間的差異;(b)展示了先前不變學習工作與我們方法在數據增強方面不同環境構建策略的比較;(c)表明先前方法的環境構建可能無法有效解決HGSS,因為鄰接模式未發生變化。傳統方法與基于圖的不變學習方法之間的實驗結果可支持我們的分析并驗證我們提出的HEI的優越性。

在訓練階段,我們如何確定一個合適的指標來估計節點的鄰域模式,并利用它來推斷潛在環境以解決HGSS問題。

1.3 Contributions

  1. New Issue. 強調了一個重要但常被忽視的異配圖結構分布偏移(HGSS),這與大多數專注于backbone設計的異配圖神經網絡的研究不同;
  2. New Framework. 提出了HEI,一種新穎的基于圖的不變學習框架,用于解決HGSS問題。與以往不同的是,我們的方法強調利用節點固有的異配信息來推斷潛在環境,無需進行增強操作,從而顯著提高了HGNN的泛化能力和性能;
  3. Exp. 在多個基準和骨干結構上展示了HEI的有效性。

即,異配圖上的OOD泛化,構建環境時利用同配性(結構級別)指標進行構建,先前工作基本是節點級別。

在這里插入圖片描述

在這里插入圖片描述

0x02 SmoothGNN:一種用于無監督節點異常檢測的平滑感知GNN

Xianyu Dong, et al. SmoothGNN: Smoothing-aware GNN for Unsupervised Node Anomaly Detection. (港中文)

2.1 摘要

在圖學習中出現的平滑問題會導致節點表示無法區分,這給與圖相關任務帶來了巨大挑戰。
然而,我們的實驗表明,這個問題能夠揭示節點異常檢測(Node Anomaly Detection, NAD) 中先前研究所忽略的潛在特性。我們引入了個體平滑模式(Individual Smoothing Patterns, ISP)和鄰域平滑模式(Neighborhood Smoothing Patterns, NSP),這表明異常節點的表示比正常節點的表示更難進行平滑處理。此外,我們探討了這些模式的理論意義,展示了ISP和NSP對NAD任務的潛在益處。

受這些發現的啟發,我們提出了SmoothGNN,這是一種新穎的無監督節點異常檢測框架。
首先,我們設計了一個學習組件來明確捕捉ISP以檢測節點異常。
其次,我們設計了一個譜神經網絡來隱式學習ISP以增強檢測能力。
最后,我們根據我們的發現設計了一個有效的系數,使得NSP可以作為節點表示的系數,有助于識別異常節點。
此外,我們設計了一種新穎的異常度量方法,用于計算節點的損失函數和異常得分,該方法利用ISP和NSP來反映NAD的特性。
在9個真實數據集上的大量實驗表明,SmoothGNN比最佳競爭者平均高出14.66%(AUC)、7.28%(AP),運行速度提升了75倍。

開源代碼:SmoothGNN

2.2 背景與動機

節點異常檢測的常見應用場景,例如,金融網絡中的欺詐檢測、社交網絡中的惡意評論檢測、芯片制造中的熱點檢測。

在芯片制造中,Hotspot Detection(熱點檢測)是一項關鍵的質量控制技術,主要用于識別設計或制造過程中可能導致芯片缺陷的潛在問題區域。這些“熱點”通常指設計中容易在光刻、蝕刻或其他工藝步驟中出現故障的局部圖案(如短路、斷路或可靠性問題),可能影響芯片的性能或良率。
即,工業制造中的缺陷檢測

復雜的信息和大規模的現實世界的圖對如何有效與高效地檢測異常節點提出了挑戰,特別是在無監督的設置下。現有方法:淺層模型由于手工規則而表現力有限,重建模型和子監督模型計算復雜度高,特殊模型民林尋找NAD有效標識符的挑戰。

為了解決以上局限性,我們重新評估了NAD任務的傳播過程,發現平滑(Smothing)問題可以為檢測圖中的異常提供潛在優勢。具體來說,我們設計了兩個新的衡量標準:ISP和NSP,從不同角度分析平滑問題。對于ISP,我們計算在每個傳播跳的節點表示和收斂表示后獲得的異常和正常節點的無限數量的跳數之間的平均歸一化距離。對于NSP,我們分別計算異常和正常節點鄰域內的平均歸一化相似度。值得注意的是,這兩種平滑模式在現實世界的數據集中(如Amazon和T-Finance)的不同類型的節點上表現出不同的行為,分別如圖1和圖2所示。在傳播過程中,異常節點的平滑模式一般超過正常節點在大多數跳數。這一觀察結果提供了一個潛在的指標,用于評估節點的異常分數:平滑模式越高,節點越有可能是異常的。
在這里插入圖片描述

2.3 平滑模式的分析

預備知識

譜GNN圖卷積運算可以通過Laplacians的第T階多項式來近似: UgθUTx≈U(∑t=0TθtΛt)UTx=(∑t=0TθtLt)x,\mathbf U g_\theta \mathbf U^{T}\mathbf x \approx \mathbf U(\sum_{t=0}^T \theta_t \Lambda^t)\mathbf U ^T \mathbf x=(\sum_{t=0}^T \theta_t \mathbf L^t)\mathbf x,Ugθ?UTxU(t=0T?θt?Λt)UTx=(t=0T?θt?Lt)x 其中,θ∈RT+1\theta\in \mathbb R^{T+1}θRT+1是多項式系數。

如Figure2所討論的,每個傳播跳處的節點表示與在無限跳數之后獲得的收斂表示之間的距離對于異常節點和正常節點表現出不同的模式。
ISP:
I(x)=∣∣(Pt?P∞)x∣∣22,I(\mathbf x)=||(P^t-P^\infty )x||^2_2,I(x)=∣∣(Pt?P)x22?,其中,PtP^tPt是在傳播的第ttt跳之后的傳播矩陣,P∞P^\inftyP是收斂狀態,xxx是圖信號。如定義所示,ISP有效地描述了傳播過程中每個獨立節點的平滑模式,它可以捕獲光譜信息和平滑模式。

NSP:N(xt)=∑i,j=1nai,j∣∣xitdi+1?xjtdj+1∣∣22,N(x^t)=\sum^n_{i,j=1}a_{i,j}||\frac{x_i^t}{\sqrt{d_i+1}}-\frac{x^t_j}{\sqrt{d_j+1}}||^2_2,N(xt)=i,j=1n?ai,j?∣∣di?+1?xit???dj?+1?xjt??22?,
其中,ai,ja_{i,j}ai,j?表示鄰接矩陣A~\tilde AA~的第(i,j)(i,j)(i,j)項,did_idi?是節點iii的度,并且xt=Ptxx^t=P^txxt=Ptx。NSP測量相鄰節點之間的相似性,指示在傳播期間鄰域內的平滑模式,NSP與譜空間具有很強的相關性,可以作為節點表示的系數。

我們還可以觀察到,在所有層上應用NSP可以在某些數據集上提高性能,但并不是在所有數據集上都是如此。這樣的結果證明了NSP的有效性,因為僅將其應用于最后一層或所有層都明顯優于基線。因此,為了保持模型的簡單性和穩定性,我們只將NSP應用于最后一層。

在這里插入圖片描述

本文來自互聯網用戶投稿,該文觀點僅代表作者本人,不代表本站立場。本站僅提供信息存儲空間服務,不擁有所有權,不承擔相關法律責任。
如若轉載,請注明出處:http://www.pswp.cn/news/922469.shtml
繁體地址,請注明出處:http://hk.pswp.cn/news/922469.shtml
英文地址,請注明出處:http://en.pswp.cn/news/922469.shtml

如若內容造成侵權/違法違規/事實不符,請聯系多彩編程網進行投訴反饋email:809451989@qq.com,一經查實,立即刪除!

相關文章

static_cast:C++類型系統的“正經翻譯官”

1. 背景與核心概念 1.1 C的“類型安全”哲學 想象一下,你所在的世界突然失去了所有規則:文字可以隨意變成數字,人可以瞬間變成椅子,汽車能飛上天變成飛機… 這聽起來像是瘋狂的夢境,但對于早期C語言來說,這…

【嵌入式原理系列-第八篇】USART從原理到配置全解析

目錄 一.通信領域基礎知識介紹 1.1 串行和并行通信 1.2 同步和異步傳輸 1.3 串口和COM口 1.4 通信協議標準以及物理層定義 1.5 物理層協議之TTL / RS-232 / RS-485 二.USART介紹 2.1 USART特點介紹 2.2 UART和TTL / RS-232 / RS-485 2.3 USART硬線流控介紹 2.4 USAR…

MariaDB介紹和MariaDB包安裝

文章目錄MariaDB介紹和安裝1.MariaDB介紹1.1 起源與背景1.2 核心特性1.2.1 高度兼容 MySQL1.2.2 優化的存儲引擎1.2.3 企業級功能增強1.2.4 性能優化1.2.5 安全增強1.3 社區與生態1.4 應用場景1.5 總結2.MariaDB安裝2.1 主機初始化2.1.1 設置網卡名2.1.2 設置ip地址2.1.3 配置鏡…

雙指針與滑動窗口算法精講:從原理到高頻面試題實戰

引言:算法選擇的十字路口 在算法面試中,雙指針和滑動窗口如同兩把瑞士軍刀,能高效解決80%以上的數組和字符串問題。本文將深入解析這兩種技術的核心差異,結合力扣高頻題目,提供可直接復用的代碼。 一、算法核心思想解析…

蘋果MAC、MacBook air和pro安裝windows雙系統與iOS分發

文章目錄1. main1.1 準備工作1.2 啟動轉換助理1.3 Windows安裝1.4 蘋果電腦安裝Windows雙系統切換2. 蘋果(iOS)分發/上架2.1 上架App Store2.2 上架TestFlight2.3 webClip免簽上架2.4 超級簽名2.5 企業證書2.6 app分發系統Reference1. main 蘋果電腦安裝windows雙系統 https:…

ArcGIS定向影像(1)——非傳統影像輕量級解決方案

常常聽到這樣的需求,ArcGIS能讓用戶自己低成本的做出谷歌街景嗎?現在 _ArcGIS Pro 3.2 和 ArcGIS Enterprise 11.2 _能夠讓用戶不使用任何插件和擴展的情況下完成街景數據集的構建,數據管理,發布服務和調用的完整解決方案。非常體…

uni-app 網絡之封裝實戰HTTP請求框架

前言在uniapp開發中,網絡請求是每個應用都必不可少的功能模塊。一個優秀的網絡請求封裝不僅能提高開發效率,還能增強代碼的可維護性和可擴展性。本文將基于實際項目經驗,詳細介紹如何封裝一個高效、可維護的Uniapp網絡請求框架,并…

架構師成長之路-架構方法論

文章目錄前言一、先搞懂:架構師不僅僅是“技術大佬”,更是“問題解決者”1.1 架構師的分類:不止“開發架構師”一種1.2 架構師要關注什么?別只盯著技術1.3 架構師解決問題的4步心法:從定義到落地1.4 架構師的成長攻略&…

uniapp在微信小程序中實現 SSE 流式響應

前言 最近需要使用uniapp開發一個智能對話頁面,其中就需要使用SSE進行通信。 本文介紹下在uniapp中如何基于uni.request實現SSE流式處理。 在線體驗 #小程序:yinuosnowball SSE傳輸格式 返回輸出的流式塊: Content-Type為text/event-stream 每個流式塊均為 d…

STM32N6AI資料匯總

文章目錄前言一、STM32N6硬件資源1.1 NUCLEO-N657X0-Q1.2 STM32N6570-DK1.3 正點原子STM32N647二、STM32N6軟件資源2.1 STM32CubeN6例程資源包2.2 STM32圖像信號處理器(ISP)調優軟件2.3 正點原子N6開發板配套軟件三、AI軟件資源3.1 STM32N6 AI軟件包總結…

Flask學習筆記(一)

1、環境準備pip install Flask使用Flask開發第1個入門程序:from flask import Flask app Flask(__name__) app.route(/) def hello_world():return Hello, World!if __name__ __main__:app.run()Flask構造函數將當前模塊的名稱(__name__)作為參數。2、route函數ap…

CSP認證練習題目推薦(4)

思維、貪心、綜合 排隊打水 這道題目不算難,但是不注意還是會出現很多錯誤,比如結構體的書寫。以及自定義結構體排序。還有這里做的優化,使用前綴和記錄打水的等待時間,但是這里很容易出錯的點在于等待時間是應該是記錄的前一個…

MySQL 視圖的更新與刪除:從操作規范到風險防控

MySQL 視圖的更新與刪除:從操作規范到風險防控 視圖作為 “虛擬表”,其更新與刪除操作常常讓開發者困惑 ——“為什么更新視圖會報錯?”“刪除視圖會不會弄丟數據?” 實際上,80% 的視圖操作問題都源于對 “視圖依賴基表…

C 語言實現 I.MX6ULL 點燈(續上一篇)、SDK、deep及bsp工程管理

目錄 一、匯編點燈轉 C 語言實現 1. 關鍵字:volatile 2. 寄存器地址定義(兩種方式) (1)直接宏定義地址 (2)結構體封裝寄存器(優化訪問) 3. 核心功能代碼 &#xff…

DevOps實戰(7) - 使用Arbess+GitPuk+sourcefare實現Node.js項目自動化部署

Arbess 是一款國產開源免費的 CI/CD 工具,工具支持一鍵部署,頁面簡潔易用。本文將詳細介紹如何安裝配置使用GitPuk、sourcefare、Arbess系統,使用流水線拉取GitPuk源碼、使用sourcefare代碼掃描、構建安裝包并進行主機部署。 1、GitPuk 安裝…

算法,蒜鳥蒜鳥-P1-理解“雙指針”

歡迎來到啾啾的博客🐱。 記錄學習點滴。分享工作思考和實用技巧,偶爾也分享一些雜談💬。 有很多很多不足的地方,歡迎評論交流,感謝您的閱讀和評論😄。 目錄引言1 雙指針:Two Pointers1.1 左右指…

使用cookiecutter創建python項目

一、關于Python項目結構Python 項目并沒有完全統一的 “固定結構”,但行業內有一些廣泛遵循的約定俗成的目錄結構(尤其針對可分發的包或大型項目)。同時,確實有工具可以快速生成這些標準化結構,提高開發效率&#xff0…

臺積電生態工程深度解析:從晶圓廠到蜂巢的系統架構遷移

當半導體巨頭將工廠視為生態系統,用工程思維解決環境問題概述:生態系統的工程化再造臺積電近日開展的"積蜜"項目絕非簡單的企業CSR行為,而是一場將生態系統視為復雜系統進行工程化改造的技術實踐。本文將從系統架構、數據監控、循環…

從零實現一個簡易計算器

最近在刷算法題時,遇到了實現計算器的問題。一開始覺得很簡單,但真正動手實現時才發現其中有很多細節需要考慮。今天就來分享一下我的實現思路和學到的經驗。問題分析我們需要實現一個能夠處理加減乘除四則運算的計算器,要正確處理運算符的優…

Actix-webRust Web框架入門教程

文章目錄引言Actix-web是什么?準備工作你的第一個Actix-web應用理解代碼結構處理請求和響應接收請求數據返回響應中間件 - 增強你的應用狀態管理和依賴注入實用示例:構建RESTful API測試你的Actix-web應用部署Actix-web應用結語額外資源引言 嘿&#xf…