時間序列的類增量學習:基準與評估

論文地址:https://dl.acm.org/doi/abs/10.1145/3637528.3671581

論文源碼:https://github.com/zqiao11/TSCIL

會議:SIGKDD 2024(CCF-A)

現實環境本質上是非平穩的,隨著時間推移常會引入新類別。這在時間序列分類中尤為常見,例如醫療領域出現新的疾病分類,或人類活動識別中增加新的活動類型。在此類情況下,要求學習系統有效吸收新類別,同時避免對舊類別的災難性遺忘,這便催生了類增量學習(CIL)問題。然而,盡管圖像和語言領域已取得令人鼓舞的進展,針對時間序列數據的類增量學習研究仍相對不足。現有研究存在實驗設計不一致的問題,因此需要在廣泛數據集上對方法進行全面評估與基準測試。為此,我們首先概述時間序列類增量學習(TSCIL)問題,強調其獨特挑戰并涵蓋先進方法。此外,基于標準化設置,我們開發了統一的實驗框架,該框架支持新算法的快速開發、新數據集的便捷集成以及評估流程的標準化。利用此框架,我們在標準場景和隱私敏感場景下對各種通用及時間序列特定的 CIL 方法進行了全面評估。我們的大量實驗不僅為未來研究提供了標準基線,還闡明了批量歸一化層或記憶緩沖區容量閾值等各種設計因素的影響。

論文主要提出了一個框架,該框架包含多種增量學習方法,可支持使用者自主選擇和添加算法,涵蓋基于正則化、經驗重放、生成式重放的方法及基線方法。

基于正則化的類增量學習方法

1. LwF(Learning without Forgetting)

  • 特點:通過知識蒸餾(Knowledge Distillation)保留舊知識,在學習新類時最小化新舊任務輸出的差異。

2. MAS(Memory Aware Synapses)

  • 特點:通過計算神經元對舊任務的重要性(突觸權重),在訓練新任務時施加正則化約束,防止關鍵參數遺忘。

3. DT2W(Deep Task-agnostic Two-stage Weighting)

  • 特點:針對時間序列設計的任務無關權重加權方法,通過兩階段權重調整平衡新舊任務的學習。

基于經驗重放的方法

1. ER(Experience Replay)

  • 特點:最基礎的經驗重放方法,利用記憶緩沖區存儲舊任務樣本,訓練時混合新舊數據以緩解遺忘。

2. DER(Deep Experience Replay)

  • 特點:改進版經驗重放,可能通過更高效的樣本選擇或特征提取增強舊知識保留。

3. Herding

  • 特點:基于聚類的樣本選擇策略,用代表性樣本(而非原始樣本)填充記憶緩沖區,減少存儲成本。

4. ASER(Asymmetric Experience Replay)

  • 特點:非對稱經驗重放,可能通過調整新舊樣本的權重或采樣策略優化增量學習效果。

5. CLOPS(Class-Level Online Plasticity System)

  • 特點:基于類級在線可塑性的系統,可能結合類別級別的樣本管理和重放策略。

6. FastICARL

  • 特點:快速增量分類算法,可能通過高效的特征提取和分類器更新機制提升增量學習效率。

基于生成式重放的方法

1. GR(Generative Replay)

  • 特點:利用生成模型(如 TimeVAE)生成舊任務的合成樣本,避免存儲原始數據,適用于隱私敏感場景。

基線方法

1. Naive

  • 特點:直接微調模型以學習新類,不采取任何抗遺忘策略,作為性能下限。

2. Offline

  • 特點:假設可以訪問所有歷史數據(非增量場景),作為理想情況下的性能上限參考。

這里我們基于UWave數據集+分類場景詳細解釋基于經驗重放、基于生成式重放和基于正則化的類增量學習方法。

首先我們介紹基于經驗重放的增量學習方法,該數據集經過劃分任務流,針對每個任務流進行實驗,當期模型訓練過程中會存儲一些樣本,同時會提取一些以往的樣本作為訓練數據。在存儲和提取過程中會進行一些算法設計,就形成了不同的基于經驗重構的增量學習方法。

其次,基于生成式重放的增量學習方法與基于經驗重放的方法類似,就是將緩存區變成生成器。

最后,基于正則化的類增量學習方法通過對上次任務的模型使用本次數據進行校驗作為正則化項約束對舊類別的預測。

探究批量歸一化(BatchNorm)與層歸一化(LayerNorm)對時間序列類增量學習(TSCIL)中模型準確率動態變化的影響,同時對比使用記憶緩沖區(經驗重放)的方法與無記憶方法的表現差異。

系統評估基于正則化(Regularization) 和經驗重放(Experience Replay, ER) 的類增量學習方法在時間序列數據上的性能,探究不同歸一化技術(BatchNorm 與 LayerNorm)對模型抗遺忘能力和增量學習效率的影響。

探究記憶緩存?大小對時間序列類增量學習中經驗重放(ER-based)方法的平均準確率的影響,同時對比批量歸一化(BatchNorm)與層歸一化(LayerNorm)在不同內存限制下的調節作用。

探究不同類型分類器在時間序列類增量學習(TSCIL)中的性能差異,通過消融實驗驗證交叉熵(CE) 和二元交叉熵(BCE) 訓練的單頭分類器對模型抗遺忘能力和增量學習效率的影響。

系統驗證生成式重放(Generative Replay, GR) 方法在時間序列類增量學習(TSCIL)場景下的有效性,重點評估其在不存儲原始數據的隱私敏感條件下,對舊類別知識的保留能力和新類別的學習效率,并通過多數據集對比揭示 GR 在時序數據中的適用邊界。

本文介紹了一種用于時間序列類增量學習(TSCIL)的統一評估框架。我們通過全面的對比分析,揭示了現有類增量學習(CIL)策略在解決TSCIL問題時的優勢與局限。通過大量實驗,我們評估了TSCIL的關鍵影響因素,包括算法類型、歸一化層選擇、記憶預算配置以及分類器設計。實驗發現,基于重放的方法普遍優于正則化技術,而使用層歸一化(LayerNorm)替代批量歸一化(BatchNorm)可顯著緩解穩定性-可塑性矛盾。我們進一步探討了時間序列數據特有的關鍵挑戰——這些挑戰對TSCIL的成功至關重要。結果與分析突出了歸一化處理、數據隱私保護和類內變異等問題的影響機制。我們堅信,本研究為TSCIL領域的研究與發展提供了有價值的參考。

本文來自互聯網用戶投稿,該文觀點僅代表作者本人,不代表本站立場。本站僅提供信息存儲空間服務,不擁有所有權,不承擔相關法律責任。
如若轉載,請注明出處:http://www.pswp.cn/pingmian/87180.shtml
繁體地址,請注明出處:http://hk.pswp.cn/pingmian/87180.shtml
英文地址,請注明出處:http://en.pswp.cn/pingmian/87180.shtml

如若內容造成侵權/違法違規/事實不符,請聯系多彩編程網進行投訴反饋email:809451989@qq.com,一經查實,立即刪除!

相關文章

智能攻擊原理和架構

大家讀完覺得有幫助記得關注和點贊!!! 智能攻擊系統基于**人工智能(AI)與大語言模型(LLM)技術**,通過**環境感知→自主決策→動態執行→對抗進化**的閉環架構實現高效網絡入侵。以下…

Beamer-LaTeX學習(教程批注版)【4】

眾所周知,隨著顯示器普及寬屏化,PPT排版需要多列化來充分利用頁面的橫向空間。 這節課我們來學習如何創建列,即在beamer中增加列內容,以及如何對齊列。 1 使用不同的寬度來創建列 在beamer中我們通過在頁面上使用columns環境來創…

通俗理解JVM細節-面試篇

文章目錄 前言JVM概述JVM是什么?解決了什么問題?JVM運行流程JVM 與 JRE,JDK的關系 JVM內存結構JVM區域劃分程序計數器棧堆方法區 類加載機制五個階段加載驗證準備解析初始化總結雙親委派模型 垃圾回收內存管理什么是GC?如何判定誰…

意識邊疆保衛戰:22:47深圳AI-BioFab人機融合危機全息實錄

前言 前些天發現了一個巨牛的人工智能免費學習網站,通俗易懂,風趣幽默,忍不住分享一下給大家。點擊跳轉到網站 🧠《意識邊疆保衛戰:22:47深圳AI-BioFab人機融合危機全息實錄》 副標題:機械義…

langchain從入門到精通(三十四)——RAG優化策略(十)父文檔檢索器實現拆分和存儲平衡

1. 拆分文檔與檢索的沖突 在 RAG 應用開發中,文檔拆分 和 文檔檢索 通常存在相互沖突的愿望,例如: 我們可能希望擁有小型文檔,以便它們的嵌入可以最準確地反映它們的含義,如果太長,嵌入/向量沒法記錄太多…

Javaweb - 7 xml

XML 是EXtensible Markup Language 的縮寫,翻譯過來就是可擴展標記語言。即,XML 和 HTML 一樣,都是標記語言,也就是說,它們的基本語法都是標簽。 特點: 1. 可擴展:即 XML 是允許自定義格式的。但…

qml實現 裁剪進度條

我們需要實現一個垂直進度條效果,但使用圖片裁剪的方式。具體需求: 1. 圖片位置固定,容器對齊其左邊和下邊,寬度和圖片相同。 2. 容器背景透明,調整裁剪容器的高度,使其有高度進度條的感覺(從下…

Dify 工作流全棧解析:從零構建你的 AI 應用流程引擎

AI工作流的導言: 工作流系統(Workflow System)是 Dify 的核心組成部分,它通過可視化編程界面支持創建復雜的 AI 應用程序。用戶可以將不同的功能塊連接起來,從而設計出用于處理數據、與 AI 模型交互、管理條件以及執行…

上下位機通訊規則

0:事由 最近開發,上位機Qt與下位機通訊的時候發現通訊規則有些不一樣,這里簡單記錄一下 。所有代碼基于元寶生成,屬于偽代碼不保證真實可用,啊但是邏輯是這么個邏輯。 1:底層通訊規則 以STM32向上位機通訊…

創建平衡二叉樹C++

給你一個整數數組 nums &#xff0c;其中元素已經按 升序 排列&#xff0c;請你將其轉換為一棵 平衡 二叉搜索樹。 平衡二叉樹&#xff1a;每個節點的左右子樹高度差不超過1 class Solution { public:TreeNode* dfs(vector<int>& nums, int left, int right){if(l…

海光の初體驗

背景 八張K100的風扇已經將近一年沒轉過了…早在今年4月29日&#xff0c;Qwen3正式發布并全部開源8款「混合推理模型」。作為Qwen系列中的最新一代大型語言模型&#xff0c;Qwen3在推理、指令遵循、工具調用、多語言能力等方面進行了全面增強。海光DCU&#xff08;Deep Comput…

場外交易(OTC)財富管理系統開發及解決方案報告

——跨境金融科技賦能機構客戶新增長 一、OTC市場現狀與機構業務痛點 1. 政策機遇與市場擴容 “北向互換通”期限延長&#xff1a;2025年7月1日&#xff0c;中國外匯交易中心聯合香港交易所將利率互換合約期限延長至30年&#xff0c;首日交易規模達15.3億元&#xff0c;填補超…

pytorch底層原理學習--JIT與torchscript

文章目錄 0 目的1 TorchScript1.1 語言特性的限定性1.2 設計目的&#xff1a;模型表達的專注性 2pytorch JIT&#xff08;Just-in-time compilation)2.1pytorch JIT定義2.1pytorch JIT整個過程&#xff1a;1. 前端轉換層&#xff1a;生成靜態計算圖2. 中間表示層&#xff08;IR…

Ubuntu+Nginx+php+SQLite3+typecho手動搭建個人博客

零.Ubuntu環境 一.安裝nginx 使用以下指令進行nginx web服務器安裝&#xff1a; apt-get install nginx 如果提示找不到安裝包&#xff0c;也可以更新一下系統的apt環境包&#xff1a; sudo apt update 安裝完成后&#xff0c;可以使用以下指令查看nginx是否處于激活狀態&#…

網絡協議概念與應用層

1.概念 1.1 例子 點外賣 上述這個過程,就是自定義協議 自定義協議,具體的方式也是非常靈活的 2.幾種開發中更常見的格式 2.1xml 上古時期的組織數據的格式 通過標簽來組織數據 xml的優勢:讓數據的可讀性變得更好了 劣勢:標簽寫起來繁瑣,傳輸的時候也占用更多網絡帶寬 2.2…

pytorch學習—7.處理多維特征的輸入

2. 線性模型 3.梯度下降算法 4.反向傳播(用pytorch算梯度) 5.用pytorch實現線性回歸 6.logistic回歸 7.處理多維特征的輸入_嗶哩嗶哩_bilibili 7.1代碼復現: import numpy as np import torch import matplotlib.pyplot as plt# 1. 獲取數據集 xy_data = np.lo

AI助手“智普清言”《三元》(Python)詩解

文本邏輯解清晰&#xff0c;詩意對應技法輕。 筆記模板由python腳本于2025-07-01 06:54:55創建&#xff0c;本篇筆記適合喜歡python三元語句的coder翻閱。 學習的細節是歡悅的歷程 博客的核心價值&#xff1a;在于輸出思考與經驗&#xff0c;而不僅僅是知識的簡單復述。 Pytho…

本地RAG實戰:用Spring AI+Ollama+DeepSeek+ChromaDB增強文檔問答

本文手把手教你在本地部署RAG系統&#xff1a; 用 Spring AI 整合 Ollama&#xff08;運行DeepSeek中文模型&#xff09;ChromaDB 存儲本地文檔&#xff08;PDF/TXT&#xff09;向量Java程序實現&#xff1a;文檔解析 → 語義檢索 → 增強生成 最終效果&#xff1a;模型回答更準…

Python 數據分析:DataFrame,生成,用字典創建 DataFrame ,鍵值對數量不一樣怎么辦?

目錄 1 示例代碼2 歡迎糾錯3 論文寫作/Python 學習智能體------以下關于 Markdown 編輯器新的改變功能快捷鍵合理的創建標題&#xff0c;有助于目錄的生成如何改變文本的樣式插入鏈接與圖片如何插入一段漂亮的代碼片生成一個適合你的列表創建一個表格設定內容居中、居左、居右S…

Java 并發編程的 CAS(Compare and Swap)是什么?

CAS&#xff08;Compare and Swap&#xff0c;比較并交換&#xff09; 并非 Java 語言特有的概念&#xff0c;而是現代計算機硬件提供的一條核心原子指令。在 Java 并發編程中&#xff0c;它扮演著“幕后英雄”的角色&#xff0c;是構建高性能、無鎖并發工具&#xff08;如原子…