【ICML2025】時間序列|TimePro:炸裂!線性復雜度實現高效長程多元時間序列預測!

圖片
論文地址:https://arxiv.org/pdf/2505.20774
代碼地址:https://github.com/xwmaxwma/TimePro


為了更好地理解時間序列模型的理論與實現,推薦參考UP “ThePPP時間序列” 的教學視頻。該系列內容系統介紹了時間序列相關知識,并提供配套的論文資料與代碼示例,有助于理論與實踐相結合。
https://space.bilibili.com/613453963
在這里插入圖片描述

摘要

在長期時間序列預測中,不同的變量通常在不同的時間間隔內影響目標變量,這種挑戰被稱為多延遲問題。傳統的模型通常統一處理所有變量或時間點,這限制了它們捕捉復雜變量關系和獲得非平凡時間表示的能力。為了解決這個問題,本研究提出了TimePro,一個創新的基于Mamba的模型,它構建了變量和時間感知的超狀態。與僅跨變量或時間維度傳遞普通狀態的傳統方法不同,TimePro保留了每個變量標記的細粒度時間特征,并自適應地選擇聚焦的時間點來調整普通狀態。重建的超狀態可以感知變量關系和顯著的時間信息,這有助于模型進行準確的預測。在實驗中,TimePro在八個真實世界的長期預測基準測試中表現出具有競爭力的性能,并具有令人滿意的線性復雜度
圖片

引言

本研究關注多變量長時序預測中的多延遲問題,即不同變量對目標變量的影響時間跨度不同,而現有模型通常對所有變量或時間點進行統一處理,難以捕捉復雜的變量關系和非平凡的時間表示。Mamba模型在時間序列預測中展現了線性計算復雜度和高效的長時依賴性捕獲能力等優勢,已有多種基于Mamba的模型被提出,例如Bi-Mamba+、S-Mamba、TimeMachine和TSMamba等,它們從不同方向掃描特征,但忽略了多延遲問題。本研究指出現有的Mamba模型和基于Transformer的模型,例如PatchTST和iTransformer,都存在對變量或時間點統一處理的局限性,難以捕捉關鍵時間點和獲得非平凡的時間表示。

本研究針對多延遲問題提出了一種名為TimePro的創新性基于Mamba的模型,該模型構建了變量感知和時間感知的超狀態。與傳統方法僅在變量間傳遞普通狀態不同,TimePro保留了每個變量標記的細粒度時間特征,并自適應地選擇關注的時間點來調整普通狀態。具體來說,本研究首先掃描變量維度以獲得包含變量之間相關性的隱藏狀態,然后使用專門的網絡學習關鍵時間點的偏移量,并通過自適應地選擇這些關鍵時間點來動態更新隱藏狀態,使其反映最顯著的時間信息。這種自適應機制使重構的超狀態能夠整合變量特定信息和細微的時間變化,從而提高模型的預測精度。

本研究提出的時間調整策略通過自適應地選擇重要時間點并使用重構的超狀態來獲得輸出,從而調整變量狀態。超狀態能夠感知復雜的變量關系和變量內時間變化,從而有助于實現準確預測。通過結合超狀態重構和硬件感知的實現,本研究提出了一個高效的多變量長時序預測模型TimePro。TimePro在多個真實世界數據集上實現了具有競爭力的性能,并顯著優于現有的Mamba和基于Transformer的方法,同時保持了線性復雜度,確保了計算效率。

本研究的創新之處在于設計了一種時間調整策略,該策略通過自適應地選擇重要時間點并使用重構的超狀態來調整變量狀態,從而提高了預測的準確性。此外,本研究結合了超狀態重構和硬件感知的實現,提出了一個高效的多變量長時序預測模型TimePro。最后,TimePro在八個真實世界數據集上取得了具有競爭力的性能顯著優于現有的Mamba和基于Transformer的方法

論文創新點

🚀 本研究提出了一個名為TimePro的創新性Mamba模型,用于解決多變量長時間序列預測中的多延遲問題。 🚀

該模型的核心創新在于構建了變量感知和時間感知的超狀態。與傳統方法簡單地在變量或時間維度上傳遞狀態不同,TimePro保留了每個變量標記的細粒度時間特征,并自適應地選擇關鍵時間點來調整普通狀態。這種超狀態能夠感知變量關系和顯著的時間信息,從而提高預測精度。

  1. ? 時間調整策略: ?

    • 該策略通過自適應地選擇重要時間點來調整變量狀態,并使用重構的超狀態來獲得輸出。
    • 超狀態能夠感知復雜的變量關系和變量內部時間變化,從而有助于進行準確的預測。
  2. 💻 硬件感知的實現方式與超狀態重構: 💻

    • 結合了超狀態重構和硬件感知的實現方式,提出了一個高效的多變量長時間序列預測模型TimePro。
    • TimePro的硬件感知設計充分利用了GPU內存層次結構,在GPU SRAM上進行普通狀態的獲取,而在GPU HBM上進行其他操作,從而提高了計算效率。
  3. 💡 HyperMamba模塊的設計: 💡

    • 該模塊對原始Mamba模型進行了改進,用硬件感知的Hyper Scan取代了選擇性掃描,并去除了掃描前后的深度卷積和線性投影,從而在不降低效率的情況下提高了性能。
    • 此外,HyperMamba還采用了掃描初始設計,即沿通道的兩個部分進行相反變量方向的掃描,從而增強了模型捕捉全局變量依賴關系的能力。
  4. 📏 線性復雜度: 📏

    • TimePro的線性復雜度使其在處理高維數據時更加高效。
    • 與基于Transformer的模型(如iTransformer和PatchTST)相比,TimePro在變量數量增加時,內存消耗和推理時間呈線性增長。
  5. 📊 實驗結果: 📊

    • 本研究在八個真實世界的數據集上進行了實驗,結果表明TimePro的性能優于現有的Mamba和Transformer模型。
    • TimePro在多個數據集上實現了最先進的性能,并在不同的預測長度和平均值上都具有較小的MSE和MAE。
    • 這證明了TimePro在處理多變量長時間序列預測問題上的有效性。

論文實驗

圖片
圖片

本文來自互聯網用戶投稿,該文觀點僅代表作者本人,不代表本站立場。本站僅提供信息存儲空間服務,不擁有所有權,不承擔相關法律責任。
如若轉載,請注明出處:http://www.pswp.cn/news/916002.shtml
繁體地址,請注明出處:http://hk.pswp.cn/news/916002.shtml
英文地址,請注明出處:http://en.pswp.cn/news/916002.shtml

如若內容造成侵權/違法違規/事實不符,請聯系多彩編程網進行投訴反饋email:809451989@qq.com,一經查實,立即刪除!

相關文章

2025真實面試試題分析-iOS客戶端開發

以下是對iOS客戶端開發工程師面試問題的分類整理、領域占比分析及高頻問題精選(基于??85道問題,總出現次數118次??)。按技術領域整合為??7大核心類別??,按占比排序并精選高頻問題標注優先級(1-5🌟&…

計算機網絡簡答題(大雪圣期末參考資料)

1、網絡性能指標/計算機網絡有哪些常用的性能指標?答:速率,帶寬,吞吐量,時延(發送時延、傳播時延、處理時延、排隊時延),時延帶寬積,往返時間RTT和信道(或網絡…

紅寶書單詞學習筆記 list 76-100

list 76NO.WordMeaning1staleadj. 不新鮮的;陳腐的2stalln. 小隔間;攤位;牲畜棚;v. 停頓;(使) 熄火;故意拖延3staplen. 訂書釘;主要產品;主要部分;主食;v. 用…

Vue3 學習教程,從入門到精通,Vue 3 計算屬性(Computed Properties)知識點詳解與案例代碼(15)

Vue 3 計算屬性(Computed Properties)知識點詳解與案例代碼 在 Vue 3 中,計算屬性(Computed Properties) 是用于基于響應式數據派生新數據的一種方式。計算屬性具有以下特點: 緩存性:只有在依賴…

2.5 PN-PTCP

Pro?net Precision Transparent Clock Protocol (PN-PTCP) PN-PTCP(精確透明時鐘協議)是一種專用于 Profinet 的 二層協議,其作用是為網絡中的設備提供高精度的時間同步。用于實現網絡設備的高精度時間同步。

WordPress與Typecho站點CloudFlare緩存優化實戰指南

文章目錄 WordPress與Typecho站點CloudFlare緩存加速全攻略 引言 一、CloudFlare緩存基礎原理 1.1 CloudFlare工作流程 1.2 緩存類型 二、基礎配置指南 2.1 CloudFlare賬戶設置 2.2 緩存配置 2.3 頁面規則設置 三、高級緩存策略 3.1 動態內容緩存 WordPress方案: Typecho方案:…

【OpenCV實現多圖像拼接】

文章目錄1 OpenCV 圖像拼接核心原理2 OpenCV 圖像拼接實現代碼方法一:使用 OpenCV 內置 Stitcher 類(推薦)方法二:手動實現核心步驟關鍵參數說明3 常見問題處理4 增量式圖像拼接(Incremental Image Stitching&#xff…

haproxy 算法

一、靜態算法按照事先定義好的規則輪詢公平調度,不關心后端服務器的當前負載、連接數和響應速度 等,且無法實時修改權重(只能為0和1,不支持其它值),只能靠重啟HAProxy生效。(不管后端死活)1.1、static-rr:基于權重的輪…

Go 的第一類對象與閉包

1. Go 的第一類對象(First-Class Citizens) 什么是第一類對象? 第一類對象是指能夠像 普通值 一樣使用的對象,通常可以賦值給變量、傳遞給函數、作為函數返回值等。在很多編程語言中,函數本身不被視為第一類對象&#…

深度分析Android多線程編程

理解并正確運用多線程是構建高性能、流暢、響應迅速的 Android 應用的關鍵,但也充滿挑戰和陷阱。 核心挑戰:UI 線程(主線程)的限制 唯一性: Android 應用只有一個主線程,負責處理所有用戶交互(觸…

uniapp在app中關于解決輸入框鍵盤彈出后遮住輸入框問題

問題描述: uniapp的app中,當表單頁面過長時,點擊下方的輸入框時,彈出鍵盤后會把輸入框給擋住,導致看不到輸入內容。 解決方案: 在page.json中,找到此頁面的配置,加上style中的softin…

二分查找----5.尋找旋轉排序數組中的最小值

題目鏈接 /** 數組在某處進行旋轉,分割為兩個獨立的遞增區間,找出數組的最小值;特殊情況:若旋轉次數是數組長度的倍數,則數組不變 特點: 常規情況: 數組被分割為兩個獨立的子區間,左半區的最小值大于右半區的最大值 依據數組長度,mid可能落在左半區也有可能落在右半區,最小值在…

Eureka-服務注冊,服務發現

在遠程調用的時候&#xff0c;我們寫的url是寫死的。 String url "<http://127.0.0.1:9090/product/>" orderInfo.getProductId();當換個機器&#xff0c;或者新增個機器&#xff0c;導致ip變換&#xff0c;從而使得 url 發生了變化&#xff0c;接著就需要去…

ubuntu24的一些小問題

截圖Keyboard -> Keyboard Shortcus -> View and customize Shortcus如上&#xff0c;可以修改默認的快捷按鍵。比如截圖按鍵可以修改。 ibus輸入法無法&#xff0c;輸入V異常問題 也是困擾了很久&#xff0c;發現是這樣的&#xff1a;https://github.com/libpinyin/ibus…

Python Locust庫詳解:從入門到分布式壓力測試實戰

一、Locust核心優勢 作為一款基于Python的開源負載測試工具&#xff0c;Locust通過協程架構實現了高效資源利用。其獨特優勢體現在&#xff1a; 純Python腳本&#xff1a;用熟悉的語言定義用戶行為&#xff0c;支持條件判斷和復雜邏輯分布式擴展&#xff1a;單節點支持數千并發…

Redis數據類型與內部編碼

在Redis中通常普遍認為&#xff0c;使用redis的能進行查詢&#xff0c;插入&#xff0c;刪除&#xff0c;修改操作都是O(1)是因為他是利用hash表實現的&#xff0c;但是&#xff0c;背后的實現不一定是一個標準的hash表&#xff0c;它內部的數據類型還會有變數&#xff0c;不過…

03-netty基礎-多路復用select、poll、epoll

1 什么是多路復用多路復用&#xff08;Multiplexing&#xff09; 是一種讓單個線程同時處理多個 I/O 通道的技術&#xff0c;核心是通過系統調用將 I/O 狀態查詢的工作交給操作系統內核&#xff0c;應用程序只需等待內核通知哪些通道就緒。多路&#xff1a;指的是多個socket網絡…

網易大模型算法面經總結第一篇

網友一 MHA的原理&#xff0c;是如何進行加速的&#xff0c;用的什么框架推理。 回答&#xff1a; ①先答一下什么是MHA&#xff1a;Multi-Head Attention&#xff08;MHA&#xff09;是 Transformer 的核心機制&#xff0c;并行地關注輸入序列中不同位置的多種信息 ②回答MHA的…

Vue3 面試題及詳細答案120道(91-105 )

《前后端面試題》專欄集合了前后端各個知識模塊的面試題&#xff0c;包括html&#xff0c;javascript&#xff0c;css&#xff0c;vue&#xff0c;react&#xff0c;java&#xff0c;Openlayers&#xff0c;leaflet&#xff0c;cesium&#xff0c;mapboxGL&#xff0c;threejs&…

SAP-MM-物料進銷存表

ABAP庫存進銷存報表程序摘要 該ABAP程序是一個完整的庫存進銷存報表系統,主要功能包括: 報表類型選擇: 物料庫存進銷存 批次庫存進銷存 寄售庫存進銷存 供應商庫存進銷存 原料庫存進銷存 主要功能: 從歷史數據表(MARDH, MSKAH, MSLBH, MCHBH等)獲取期初庫存 處理物料移動數…