【數據挖掘】時間序列預測-時間序列預測策略

時間序列預測策略

      • (1)單步預測與多步預測
      • (2)直接多步預測
      • (3)遞歸多步預測
      • (4)直接+遞歸的混合預測
      • (5)多輸入多輸出預測

(1)單步預測與多步預測

  • 單步預測:每次預測時,輸入窗口僅預測未來一個值。

  • 多步預測:每次預測時,輸入窗口預測未來n個值(也叫n步)。

單步預測和多步預測都是時間序列預測中常見的算法,根據其原理演化出了很多種優秀的算法,本節我們介紹四種非常實用的算法。

在做時間序列預測的時候,我們往往會預測未來多個時間步。但是,我們又沒有未來的數據做訓練,這時候就會引入一個概念:

  • N階滯后特征:訓練和預測數據用到了N天之前的數據特征

舉個例子:假設我們有10天的數據,現在要預測未來3天的數據。我們可以通過構造N階滯后特征來實現這個目標。

已知序列:[1,2,3,4,5,6,7,8,9,10],目標序列:[11,12,13]

單步預測:構造1階滯后特征lag(t-1)作為訓練數據,當前已知序列作為訓練目標。下表中,綠色區域為訓練過程,黃色區域為預測過程。當模型訓練完成后,用第10天的數據可以預測第11天的數據,第11天預測第12天,第12天預測第13天。

在這里插入圖片描述

多步預測:構造多輸出模型,一次預測3個未來值。下圖示例中input長度選取為3,實際應用中input長度通常遠大于output長度。

在這里插入圖片描述

參考文檔:時間序列:多步預測的方法以及序列問題的分類

(2)直接多步預測

定義:直接多步預測(Direct Multi-Step Forecasting),構建n個模型預測未來n個值,每個模型預測1個值。這種方法本質是一種單步預測法。

我們繼續用之前的示例模型:已知序列:[1,2,3,4,5,6,7,8,9,10],目標序列:[11,12,13]。

為了預測3個時間點的數值,我們需要構建3個模型,分別預測3個數值。

model1:[1,2,3,4,5,6,7,8,9,10],[11],構建1階滯后序列訓練模型

model2:[1,2,3,4,5,6,7,8,9,10],[12],構建2階滯后序列訓練模型

model3:[1,2,3,4,5,6,7,8,9,10],[13],構建3階滯后序列訓練模型

3個模型的訓練過程如下所示:

在這里插入圖片描述

算法優點:

  • 直接多步預測能夠直接預測未來的多個步驟,無需依賴單步預測的結果。這意味著它可以快速給出多步的預測值,無需進行多次迭代或疊加訓練。
  • 直接多步預測不依賴單步預測的結果,因此可以避免由于單步預測誤差累積而導致的長期預測精度下降的問題。

算法缺點:

  • 直接多步預測法需要為每個預測步長訓練一個模型,這意味著如果預測步長很長,那么需要訓練的模型數量會非常多,這增加了計算成本和模型管理的復雜性。

參考文檔:時間序列多步預測的五種策略

(3)遞歸多步預測

定義:遞歸多步預測(Recursive Multi-Step Forecasting),用單個模型進行訓練,通過使用模型已預測出的時間步的值作為輸入,來預測下一個時間步的值,這個過程是遞歸進行的。

我們繼續用之前的示例模型:已知序列:[1,2,3,4,5,6,7,8,9,10],目標序列:[11,12,13]。

預測3個時間點的數值,我們只需構建1個模型,來遞歸預測3個未來數值。

當序列數據[8,9,10]預測出第11個數據值時,我們需要將這個預測值當做特征[9,10,11]去預測第12個數據。以此類推,遞歸迭代,直到預測過程全部完成。

模型的訓練過程如下所示:

在這里插入圖片描述

算法優點:

  • 遞歸多步預測只需要建立單步預測模型,不需要考慮復雜的多步預測關系式。這種方法使得預測的實現過程相對簡單。
  • 遞歸多步預測通過利用時間序列數據之間的相關性,使用前一個時間步的預測結果來對下一個時間步進行預測,這有助于捕捉時間序列數據中的動態變化。

算法缺點:

  • 遞歸多步預測的主要缺點是誤差累積。由于它是基于之前步驟的預測結果來進行下一步的預測,因此任何一步的預測誤差都會被帶入到后續的預測中,導致誤差的累積。隨著預測步數的增加,誤差累積效應會變得更加嚴重,從而影響預測結果的準確性。

(4)直接+遞歸的混合預測

定義:直接+遞歸的混合預測(Direct-Recursive Hybrid Forecasting),結合直接策略和遞歸策略,構建n個模型預測未來n個值,但是每個模型都可以使用上一個模型預測出的結果繼續預測。n個模型可以是同構的(相同的lag),也可以是異構的(不同的lag)。

我們繼續用之前的示例模型:已知序列:[1,2,3,4,5,6,7,8,9,10],目標序列:[11,12,13]。

我們構建了3個模型(異構模型)。

model1(用1階滯后特征訓練),預測出的第11個點數值,作為model2(用2階滯后特征訓練)的訓練數據,預測出的第12個點數值,作為model3(用3階滯后特征訓練)的訓練數據,繼續預測第13個點的數值。

在這里插入圖片描述

算法優點:

  • 直接多步預測方法雖然避免了遞歸方法中因使用預測值作為輸入而導致的誤差累積問題,但遞歸方法能夠利用時間序列的相關性。混合預測方法通過結合兩者的特性,可以在一定程度上減少誤差累積,特別是在需要預測多個時間步長時。
  • 遞歸方法通過利用前一個時間步的預測結果來預測下一個時間步,從而能夠充分利用時間序列的相關性。混合預測方法保留了這一特性,使得預測結果更加準確。

算法缺點:

  • 混合預測方法需要同時訓練直接預測模型和遞歸預測模型,這增加了模型的復雜度。在實際應用中,可能需要更多的計算資源和時間來訓練和優化模型。

(5)多輸入多輸出預測

定義:多輸入多輸出預測MIMO(Multiple Input Multiple Output),在一個模型里輸出多個預測值,其本質是一種多輸出模型。

我們繼續用之前的示例模型:已知序列:[1,2,3,4,5,6,7,8,9,10],目標序列:[11,12,13]。

我們構建了1個模型,3個輸入特征,3個輸出預測值。

在這里插入圖片描述

算法優點:

  • 由于模型能夠同時預測多個未來的數值,因此可以顯著提高預測的效率。這對于需要快速響應或處理大量數據的場景非常有用。
  • 在多步預測中,傳統的遞歸預測方法可能會因為每一步的預測誤差累積而導致預測結果逐漸偏離真實值。而多輸出序列預測算法可以一次性預測多個時間點的值,從而減少了誤差累積的可能性。

算法缺點:

  • 與單步預測相比,多輸出序列預測算法需要同時處理多個時間點的預測任務,因此計算復雜度通常較高。這可能導致預測速度變慢,尤其是在處理大規模數據集時。
  • 為了訓練一個準確的多輸出序列預測模型,通常需要大量的歷史數據來捕捉時間序列的復雜性和動態性。如果數據量不足或質量不高,可能會導致預測結果不準確。

本文來自互聯網用戶投稿,該文觀點僅代表作者本人,不代表本站立場。本站僅提供信息存儲空間服務,不擁有所有權,不承擔相關法律責任。
如若轉載,請注明出處:http://www.pswp.cn/diannao/81729.shtml
繁體地址,請注明出處:http://hk.pswp.cn/diannao/81729.shtml
英文地址,請注明出處:http://en.pswp.cn/diannao/81729.shtml

如若內容造成侵權/違法違規/事實不符,請聯系多彩編程網進行投訴反饋email:809451989@qq.com,一經查實,立即刪除!

相關文章

【LLM】deepseek R1之GRPO訓練筆記(持續更新)

note 相關框架對比: 需微調模型且資源有限 → Unsloth;本地隱私優先的小規模推理 → Ollama;復雜邏輯或多模態任務 → SGLang;高并發生產環境 → vLLM 微調SFT和GRPO是確實能學到新知識的四種格式(messages、sharegpt…

【數據結構】--- 單鏈表的增刪查改

前言: 經過了幾個月的漫長歲月,回頭時年邁的小編發現,數據結構的內容還沒有寫博客,于是小編趕緊停下手頭的活動,補上博客以洗清身上的罪孽 目錄 前言 概念: 單鏈表的結構 我們設定一個哨兵位頭節點給鏈…

【JAVA】數據類型與變量:深入理解棧內存分配(4)

核心知識點詳細解釋 Java 的基本數據類型和引用數據類型 基本數據類型 Java 有 8 種基本數據類型,它們可以分為 4 類: 整數類型:byte(1 字節)、short(2 字節)、int(4 字節&#…

ReentrantLock實現公平鎖和非公平鎖

在 Java 里,公平鎖和非公平鎖是多線程編程中用于同步的兩種鎖機制,它們的主要差異在于獲取鎖的順序規則。下面是對二者的詳細介紹: 公平鎖 公平鎖遵循 “先來先服務” 原則,也就是線程獲取鎖的順序和請求鎖的順序一致。先請求鎖…

一篇擼清 Http,SSE 與 WebSocket

HTTP,SSE 和WebSocket都是網絡傳輸的協議,本篇快速介紹三者的概念和比較。 SSE(Server-Sent Events) 是什么? SSE(Server-Sent Events),服務器發送事件, 是一種基于 HTTP 的輕量級協議,允許服務器主動向客戶端(如瀏覽器)推送實時數據。它設計用于單向通信(服務器到…

5個重要的財務指標講解

1)凈資產收益率 2)銷售凈利率 3) 銷售毛利率 4)銷售成本率 5) 期間費用率 好的,我將通過一個假設的案例(某公司2023年數據)逐步解釋這些財務指標,并用具體數字演示計算…

PISI:眼圖1:眼圖相關基本概念

0 英文縮寫 TIE(Time Interval Error)時間間隔誤差,UI(Unit Interval)單位間隔PDF(Probability Density Function)概率密度函數BER(Bit Error Rate)誤碼率TJ&#xff08…

前端八股 CSS 2 選擇器

選擇器功能:選中特定 DOM節點進行渲染 原始方法 getElementById() getElementByName() 現在方法選擇器 分類: id選擇器 類選擇器 標簽選擇器 邏輯與選擇器 其他類型選擇器: 偽類選擇器: :link:未被訪問的鏈接…

算法競賽進階指南.闇の連鎖

目錄 題目算法標簽: 樹上差分, L C A LCA LCA, 倍增思路代碼 題目 352. 闇の連鎖 算法標簽: 樹上差分, L C A LCA LCA, 倍增 思路 對于一個無向圖, 第一次切斷樹邊, 第二次切非樹邊, 一共多少種方案使得圖不連通, 點數和邊數都很大, 時間復雜度不能是 O ( n 2 ) O(n ^ 2…

ActiveMQ 與其他 MQ 的對比分析:Kafka/RocketMQ 的選型參考(二)

ActiveMQ、Kafka 和 RocketMQ 詳細對比 性能對比 在性能方面,Kafka 和 RocketMQ 通常在高吞吐量場景下表現出色,而 ActiveMQ 則相對較弱。根據相關測試數據表明,Kafka 在處理大規模日志數據時,單機吞吐量可以達到每秒數十萬條甚…

Electron 從零開始:構建你的第一個桌面應用

🖥? Electron 從零開始:構建你的第一個桌面應用 Electron 是一個可以使用 HTML、CSS 和 JavaScript 構建跨平臺桌面應用的框架。它將 Chromium 和 Node.js 融合到一個環境中,使 Web 開發者也能輕松開發原生桌面應用。 🚀 什么是 …

相向雙指針-16. 最接近的三數之和

16. 最接近的三數之和 題目描述思路講解代碼展示復雜度分析相關標簽 題目描述 思路講解 思路和 15. 三數之和 類似,排序后,枚舉 nums[i] 作為第一個數,那么問題變成找到另外兩個數,使得這三個數的和與 target 最接近,…

C 語 言 - - - 文 件 操 作

C 語 言 - - - 文 件 操 作 文 件文 件 名文 件 操 作fopenfclose 文 件 的 順 序 讀 寫fputcfgetcfputsfgetsfprintffscanffwritefread 流文 件 的 隨 機 讀 寫fseekftellrewind 總結 💻作 者 簡 介:曾 與 你 一 樣 迷 茫,現 以 經 驗 助 你…

Walrus 與 Pudgy Penguins 達成合作,為 Web3 頭部 IP 引入去中心化存儲

以將深受喜愛的數字藏品賦予生命而聞名的 IP 與品牌開發公司 Pudgy Penguins,現已集成 Walrus,用于存儲和管理其日益增長的數字媒體資源庫,包括在其產品和社區體驗中使用的貼紙和 GIF。團隊將率先通過 Tusky(Walrus 的用戶友好型文…

2019ICPC陜西省賽暨陜西邀請賽題解 BCDEF HIJKL

共111支隊伍,獲獎情況(大概) 銅牌66 —— 3 296 銀牌33 —— 4 391 金牌 11 —— 6 808 題目難度(過題)L F E B C I J D K H Problem - L - Codeforces 思路:注意到答案是連乘,只要有0…

5塊錢的無憂套餐卡可以變成流量卡嗎

電信的 5 塊錢無憂套餐卡理論上可以變成流量卡,但會受到一些條件限制,以下是具體介紹: 中國電信無憂卡簡介 中國電信無憂卡是電信推出的低月租套餐,月租僅 5 元,包含 200M 國內流量、來電顯示和 189 郵箱,全…

SpringBoot校園失物招領平臺源碼開發實現

概述 實用的??SpringBoot校園失物招領平臺??完整項目源碼,幫助開發者快速構建校園失物招領系統。該項目采用SpringBootVue前后端分離架構,包含完整的注冊登錄、信息發布、認領管理等模塊,是學習企業級項目開發的優秀范例 主要內容 1. …

如何在純C中實現類、繼承和多態(小白友好版)

基本實現原理 /* 通過結構體函數指針模擬類 */ typedef struct {// 成員變量int x; // 成員方法(函數指針) void (*print)(void* self); } MyClass;/* 成員函數實現 */ void my_print(void* self) {MyClass* obj (MyClass*)self;p…

51單片機入門教程——每個音符對應的重裝載值

前言 本教程基于B站江協科技課程進行個人學習整理,專為擁有C語言基礎的零基礎入門51單片機新手設計。既幫助解決因時間差導致的設備迭代調試難題,也助力新手快速掌握51單片機核心知識,實現從C語言理論到單片機實踐應用的高效過渡 。

股票單因子的檢驗方法有哪些?

股票單因子的檢驗方法主要包括以下四類方法及相關指標: 一、統計指標檢驗 IC值分析法 定義:IC值(信息系數)衡量因子值與股票未來收益的相關性,包括兩種計算方式: Normal IC:基于Pearson相關系數…