TSB - AD 解讀 — 邁向可靠、透明的 TSAD 任務

目錄

一? 文章動機

二? TSAD 領域內的兩類缺陷

三? 數據集的構建

四? 實驗結果及結論


項目宣傳鏈接:TSB-AD

代碼鏈接:?TheDatumOrg/TSB-AD: TSB-AD: Towards A Reliable Time-Series Anomaly Detection Benchmark

原作者解讀:NeurIPS 2024 | 時序異常檢測基準 TSB-AD - 知乎?

TSB - AD 與其他TSAD基準的全面對比:

一? 文章動機

1.?長期以來,由于使用含缺陷的基準數據集、存在偏見的評估方法、不一致的基準實踐,TSAD 領域面臨諸多困擾;

2.?Wu & Keogh 發起對 TSAD 數據集含缺陷的討論:triviality, anomaly density, mislabeling, and
run-to-failure bias(異常標注瑣碎、異常密度、標簽錯誤、運行失敗偏差);

3. UCR 數據集雖近期收到較多推崇,但仍存在重大缺陷:① 它忽視了某些時序異常區域;② 它通過 “人為引入” 時序異常;

4.??“everyone wants to do the model work instead of the data work”, resulting in limited new efforts to produce a large-scale, high-quality dataset.(典中典的問題)

5.?存在偏見的評估方法(尤其指:“點調整” 后的指標):隨機分數、噪音輸入、“嘈雜” 輸入會造成“進步錯覺”:(*此處補充?SimAD 的示意圖進行說明,不屬于原文內容)

6. “模型預處理” 及 “模型評測方式” 的不一致,也會造成不合理的 TSAD 模型質量評估;

7. 指標推薦:VUS - PR、VUS - ROC 等;

二? TSAD 領域內的兩類缺陷

① 基準數據集的缺陷:

(a) 漏標、誤標:數據集標注者被許可訪問并接觸 “額外的、未批露的數據”,因此 “不顯著” 的時序異常標記是合理的;然而數據集內存在?“相似” 時序被賦予 “不同” 標簽,則不合理;TSB - AD 對其進行修正;

(b) 偏差現象:Yahoo 數據集通常在數據末端標注異常,使結果不合理地傾向將末端數據點預測為異常的算法;UCR 數據集僅標注最顯著的異常現象,忽略對潛在異常的標注,此外,單變量時序不符合真實世界場景;

(c) 可行性、實用性:為 “分類” 任務設計的數據集被不恰當用于 “異常檢測”,僅僅簡單地將少數類重新分類為 “異常”;然而,“少數類” 的占比超出了 “異常” 的占比,不切實際的異常比率違反 “異常不應頻繁發生” 的基本原則,與異常檢測器的設計原則相悖;

② 評估指標的缺陷:

(a)?AUC - ROC 不適配針對 “不平衡分類任務” 的模型評估,AUC - PR 更優;

(b) 基于點的一系列評估指標,對 “靠前或滯后(lag)” 檢測到異常的行為過分敏感,懲罰力度過大,不夠合理;

(c)?點調整(PA)假設檢測到異常段內的任何點都被視為檢測到該段內的所有點。然而,該指標傾向于支持 “有噪聲” 的預測,隨機分數也有機會預測真實異常序列中的點,性能與SOTA相當。隨機生成的預測在點調整下甚至優于SOTA方法;異常平均長度增加時,點調整后的F分數接近1。

三? 數據集的構建

四? 實驗結果及結論

1. 各類模型在 "TSB?- AD - U"(單變量)及?"TSB?- AD - M"(多變量)數據集上的整體實驗結果:

2. 對 各類“模型評測指標”? 的評估實驗:

3. 部分有價值的結論:?

1. 統計方法表現出穩健的性能,而神經網絡方法并未表現出通常被認為的優勢。然而,神經網絡和基礎模型在檢測點異常以及處理多變量場景時仍展現了較大的潛力;
2. 簡單的架構(如:CNN 和 LSTM)通常優于更復雜的設計(如:高級 Transformer 架構);
3. 基礎模型在檢測基于點的異常方面表現出色,但在處理序列異常時表現較弱,主要原因在于其預測機制僅基于有限的回溯窗口逐步估算新的值。當面對長序列異常時,受限的時間上下文往往導致性能下降和噪聲較大的得分。此外,使用有缺陷的點調整技術(偏向這些噪聲得分)進一步加劇了問題,導致進展的假象;
4. 時間序列基礎模型的表現展現出極大潛力:它們在微調后不僅能取得良好表現,還在零樣本能力上優于大多數現有的統計方法和神經網絡方法。然而,基礎模型的主要擔憂是由于預訓練數據規模龐大,可能導致數據污染,因此在實際部署時需謹慎;
5. 將大型語言模型(LLM)應用于時間序列異常檢測的努力結果并不令人滿意,表明該領域仍存在顯著的研究空白;
6. 在表現最佳的方法中,Sub-PCA 和 KShapeAD 表現出色,盡管它們多年來一直被忽視為基本基線,且未在先前的廣泛評估研究中被發現。CNN 和 OmniAnomaly 在多變量場景中的強勁表現 — 與之前的基準結果相反,當時 KMeansAD 被認為更優 — 表明多變量時間序列中的復雜場景需要更高的建模能力,通常超出統計方法的范圍。

本文來自互聯網用戶投稿,該文觀點僅代表作者本人,不代表本站立場。本站僅提供信息存儲空間服務,不擁有所有權,不承擔相關法律責任。
如若轉載,請注明出處:http://www.pswp.cn/news/898177.shtml
繁體地址,請注明出處:http://hk.pswp.cn/news/898177.shtml
英文地址,請注明出處:http://en.pswp.cn/news/898177.shtml

如若內容造成侵權/違法違規/事實不符,請聯系多彩編程網進行投訴反饋email:809451989@qq.com,一經查實,立即刪除!

相關文章

DNS主從服務器

1.1環境準備 作用系統IP主機名web 服務器redhat9.5192.168.33.8webDNS 主服務器redhat9.5192.168.33.18dns1DNS 從服務器redhat9.5192.168.33.28dns2客戶端redhat9.5192.168.33.7client 1.2修改主機名和IP地址 web服務器 [rootweb-8 ~]# hostnamectl hostname web [rootweb-8…

遙感數據獲取、處理、分析到模型搭建全流程學習!DeepSeek、Python、OpenCV驅動空天地遙感數據分析

【扔進數據,直接出結果】在科技飛速發展的時代,遙感數據的精準分析已經成為推動各行業智能決策的關鍵工具。從無人機監測農田到衛星數據支持氣候研究,空天地遙感數據正以前所未有的方式為科研和商業帶來深刻變革。然而,對于許多專…

第一個vue項目

項目目錄 啟動vue項目 npm run serve 1.vue.config.js文件 (CLI通過vue-cli-serve啟動項目,解析配置配置文件vue-condig-js) // vue.config.js //引入path板塊,這是Node.js的一個內置模塊,用于處理文件路徑,這里引用…

QT中讀取QSetting文件

1.ini文件的格式 頭文件 #include <QSettings> #include <QStringList> #include <QtCore> #include <QDebug>2.讀文件 //ini文件的讀取 void iniTest::readIniFile(QString filePath) {//1.打開ini文件QSettings m_iniFile(filePath, QSettings::I…

卷積神經網絡 - 一維卷積、二維卷積

卷積(Convolution)&#xff0c;也叫褶積&#xff0c;是分析數學中一種重要的運算。在信號處理或圖像處理中&#xff0c;經常使用一維或二維卷積&#xff0c;本博文我們來學習一維卷積和二維卷積。 理解一維卷積和二維卷積的核心在于把握維度對特征提取方式的影響。我們從數學定…

java學習總結(六)Spring IOC

一、Spring框架介紹 Spring優點&#xff1a; 1、方便解耦&#xff0c;簡化開發,IOC控制反轉 Spring 就是一個大工廠&#xff0c;可以將所有對象創建和依賴關系維護交給Spring 2、AOP 編程的支持 Spring 提供面向切編程&#xff0c;可以方便的實現對序進行權限攔截、運監控等…

大模型推理:LM Studio在Mac上部署Deepseek-R1模型

LM Studio LM Studio是一款支持離線大模型部署的推理服務框架&#xff0c;提供了易用的大模型部署web框架&#xff0c;支持Linux、Mac、Windows等平臺&#xff0c;并提供了OpenAI兼容的SDK接口&#xff0c;主要使用LLama.cpp和MLX推理后端&#xff0c;在Mac上部署時選擇MLX推理…

AI技術學習筆記系列004:GPU常識

顯卡架構是GPU設計的核心&#xff0c;不同廠商有其獨特的架構演進。以下是主要廠商的顯卡架構概述&#xff1a; 一、NVIDIA Tesla&#xff08;2006-2010&#xff09; 代表產品&#xff1a;GeForce 8000系列&#xff08;G80&#xff09;。特點&#xff1a;首款統一著色架構&…

實驗- 分片上傳 VS 直接上傳

分片上傳和直接上傳是兩種常見的文件上傳方式。分片上傳將文件分成多個小塊&#xff0c;每次上傳一個小塊&#xff0c;可以并行處理多個分片&#xff0c;適用于大文件上傳&#xff0c;減少了單個請求的大小&#xff0c;能有效避免因網絡波動或上傳中斷導致的失敗&#xff0c;并…

Android視頻渲染SurfaceView強制全屏與原始比例切換

1.創建UI添加強制全屏與播放按鈕 2.SurfaceView控件設置全屏顯示 3.全屏點擊事件處理實現 4.播放點擊事件處理 5.使用接口更新強制全屏與原始比例文字 強制全屏/原始比例 點擊實現

數據結構——串、數組和廣義表

串、數組和廣義表 1. 串 1.1 串的定義 串(string)是由零個或多個字符組成的有限序列。一般記為 S a 1 a 2 . . . a n ( n ≥ 0 ) Sa_1a_2...a_n(n\geq0) Sa1?a2?...an?(n≥0) 其中&#xff0c;S是串名&#xff0c;單引號括起來的字符序列是串的值&#xff0c; a i a_i a…

無再暴露源站!群聯AI云防護IP隱匿方案+防繞過實戰

一、IP隱藏的核心原理 群聯AI云防護通過三層架構實現源站IP深度隱藏&#xff1a; 流量入口層&#xff1a;用戶訪問域名解析至高防CNAME節點&#xff08;如ai-protect.example.com&#xff09;智能調度層&#xff1a;基于AI模型動態分配清洗節點&#xff0c;實時更新節點IP池回…

1.5.3 掌握Scala內建控制結構 - for循環

Scala的for循環功能強大&#xff0c;支持單重和嵌套循環。單重for循環語法為for (變量 <- 集合或數組 (條件)) {語句組}&#xff0c;可選篩選條件&#xff0c;循環變量依次取集合值。支持多種任務&#xff0c;如輸出指定范圍整數&#xff08;使用Range、to、until&#xff0…

【MySQL基礎-9】深入理解MySQL中的聚合函數

在數據庫操作中&#xff0c;聚合函數是一類非常重要的函數&#xff0c;它們用于對一組值執行計算并返回單個值。MySQL提供了多種聚合函數&#xff0c;如COUNT、SUM、AVG、MIN和MAX等。這些函數在數據分析和報表生成中扮演著關鍵角色。本文將深入探討這些聚合函數的使用方法、注…

windows版本的時序數據庫TDengine安裝以及可視化工具

了解時序數據庫TDengine&#xff0c;可以點擊官方文檔進行詳細查閱 安裝步驟 首先找到自己需要下載的版本&#xff0c;這邊我暫時只寫windows版本的安裝 首先我們需要點開官網&#xff0c;找到發布歷史&#xff0c;目前TDengine的windows版本只更新到3.0.7.1&#xff0c;我們…

Web測試

7、Web安全測試概述 黑客技術的發展歷程 黑客基本涵義是指一個擁有熟練電腦技術的人&#xff0c;但大部分的媒體習慣將“黑客”指作電腦侵入者。 黑客技術的發展 在早期&#xff0c;黑客攻擊的目標以系統軟件居多。早期互聯網Web并非主流應用&#xff0c;而且防火墻技術還沒有…

華為OD機試 - 最長的完全交替連續方波信號(Java 2023 B卷 200分)

題目描述 給定一串方波信號,要求找出其中最長的完全連續交替方波信號并輸出。如果有多個相同長度的交替方波信號,輸出任意一個即可。方波信號的高位用1標識,低位用0標識。 說明: 一個完整的信號一定以0開始并以0結尾,即010是一個完整的信號,但101,1010,0101不是。輸入的…

游戲引擎學習第163天

我們可以在資源處理器中使用庫 因為我們的資源處理器并不是游戲的一部分&#xff0c;所以它可以使用庫。我說過我不介意讓它使用庫&#xff0c;而我提到這個的原因是&#xff0c;今天我們確實有一個選擇——可以使用庫。 生成字體位圖的兩種方式&#xff1a;求助于 Windows 或…

7、什么是死鎖,如何避免死鎖?【高頻】

&#xff08;1&#xff09;什么是死鎖&#xff1a; 死鎖 是指在兩個或多個進程的執行時&#xff0c;每個進程都持有資源 并 等待其他進程 釋放 它所需的資源&#xff0c;如果此時所有的進程一直占有資源而不釋放&#xff0c;就會陷入互相等待的一種僵局狀態。 死鎖只有同時滿足…

Compose 實踐與探索十四 —— 自定義布局

自定義布局在 Compose 中相對于原生的需求已經小了很多&#xff0c;先講二者在本質上的邏輯&#xff0c;再說它們的使用場景&#xff0c;兩相對比就知道為什么 Compose 中的自定義布局的需求較小了。 原生是在 xml 布局文件不太方便或者無法滿足需求時才會在代碼中通過自定義 …