【arXiv2024】時間序列|TimesFM-ICF:即插即用!時間序列預測新王者!吊打微調!

圖片
論文地址:https://arxiv.org/pdf/2410.24087
代碼地址:https://github.com/uctb/TSFM


為了更好地理解時間序列模型的理論與實現,推薦參考UP “ThePPP時間序列” 的教學視頻。該系列內容系統介紹了時間序列相關知識,并提供配套的論文資料與代碼示例,有助于理論與實踐相結合。
圖片

摘要

本研究提出了一種時間序列基礎模型的上下文微調方法。本研究設計了一個預訓練的基礎模型,可以在推理時使用多個時間序列示例作為提示,以便預測目標時間序列的未來值。本研究的基礎模型經過專門訓練,可以利用上下文窗口中來自多個相關時間序列的示例(以及目標時間序列的歷史記錄)來幫助其在推理時適應目標領域的特定分布。本研究表明,這種在推理時使用上下文示例的基礎模型,在流行的預測基準測試中,與監督深度學習方法、統計模型以及其他時間序列基礎模型相比,可以獲得更好的性能。有趣的是,本研究的上下文微調方法甚至可以與在目標領域上明確微調的基礎模型的性能相媲美
圖片

引言

本研究關注時間序列預測領域,特別是時間序列基礎模型的上下文微調方法。時間序列數據在零售、金融、制造、醫療和自然科學等領域無處不在,時間序列預測在這些領域中至關重要,例如零售預測、氣候和天氣預測以及交通預測等應用。深度學習方法在預測領域已變得流行,其性能通常優于ARIMA等統計方法。然而,直到最近,用于預測的深度學習方法仍遵循傳統的監督機器學習框架,即必須先在特定任務的訓練數據上訓練預測模型,然后才能對該任務執行預測。另一方面,在自然語言處理(NLP)領域,大型語言模型(LLM)展現了基礎模型的潛力:單個預訓練模型可以在推理時以零樣本或少樣本方式很好地執行并適應翻譯、代碼生成、文本摘要等任務。

受NLP領域成功的啟發,近年來時間序列基礎模型預測領域的研究工作顯著增加,范圍涵蓋直接將LLM重新用于預測,在時間序列數據上微調預訓練的LLM,以及從頭開始預訓練時間序列基礎模型。其中,從頭預訓練的方法已被證明可以獲得強大的零樣本精度,甚至可以與專門針對目標數據集訓練的最佳監督模型相媲美。一些研究表明,通過在目標數據集上微調預訓練模型可以進一步提高精度。然而,這種方法打破了零樣本范式,而零樣本范式正是這些時間序列基礎模型吸引那些不想構建訓練流程的實踐者的原因。這就提出了一個自然而然的問題:能否通過在推理時提供來自目標數據集的示例來恢復微調時間序列基礎模型的優勢?

同時,這些基礎模型的早期版本缺乏LLM在上下文學習方面的一些理想特性:LLM的零樣本性能可以通過在推理時使用其上下文窗口進行諸如少樣本、思維鏈或指令微調等提示技術來極大地提高。這些研究已經證明了LLM涌現的上下文學習能力。特別是,如果用相關的示例、演示和指令提示它們,然后提出一個專門的問題,模型能夠對當前的問題進行類似的推理。

本研究探索了一種方法,使時間序列基礎模型能夠具備類似的上下文能力,即能夠使用來自目標領域的時序數據示例對模型進行提示,并恢復特定領域微調的優勢。本研究將此稱為上下文微調。本研究訓練了一個基礎模型,該模型不僅可以在其上下文窗口中提供時間序列的歷史值,還可以提供來自其他相關時間序列的示例,以幫助模型在推理時適應目標時間序列的分布。例如,考慮一個高速公路交通預測系統,該系統存儲過去一周的每小時數據,以便預測特定高速公路未來的每小時交通流量。假設一個時間序列基礎模型在預訓練中沒有見過能夠捕捉此交通數據中時間模式的數據。那么,僅用該高速公路前一周的交通時間序列提示模型可能不足以獲得準確的零樣本性能。然而,在提示中添加來自其他高速公路和幾周的歷史交通數據,可能有助于模型更好地適應交通數據分布,并顯著提高目標精度。

本研究的主要貢獻如下:(1)引入了時間序列基礎模型的上下文微調研究,并提出了使用提示的方法,該提示不僅包括用于預測的目標時間序列的通常歷史記錄,還包括上下文中的相關時間序列示例。(2)預訓練了一個能夠有效利用上述上下文時間序列示例的時間序列基礎模型。本研究的訓練是僅解碼器的,可以適應任何上下文、預測范圍對(不超過某個最大上下文),以及任何數量的補充時間序列示例(同樣不超過某個最大示例數)。經過適當訓練的模型可以學習借鑒這些相關示例中的模式,從而在原始預測任務上做得更好。(3)使用本研究的基礎模型,通過在流行的預測基準上進行評估,經驗證明了上下文微調的優勢。結果表明,與監督深度學習方法、統計模型以及其他基礎模型相比,上下文微調可以顯著提高流行預測基準上的零樣本性能。特別是,它比最先進的時間序列基礎模型以及其他監督深度學習和統計基線獲得了高達 25% 的性能提升。令人驚訝的是,它甚至略微優于專門針對目標數據集進行微調的時間序列基礎模型

論文創新點

本研究提出了時間序列基礎模型的上下文微調方法論。該方法論的核心在于,在推理階段,通過在模型的上下文窗口中提供多個相關的歷史時間序列樣本來提示預訓練基礎模型,以預測目標時間序列的未來值。

  1. ? 引入上下文微調概念: ?

    • 與傳統的微調方法需要在目標數據集上進行顯式訓練不同,本研究提出的方法允許模型在推理時利用上下文中的示例進行自適應。
    • 這避免了額外的訓練過程,并保留了零樣本預測的優勢。
  2. 🌠 設計專用訓練基礎模型: 🌠

    • 該模型能夠有效地利用上下文窗口中的多個相關時間序列示例。
    • 除了目標時間序列的歷史數據外,模型還能利用上下文中的其他示例來學習目標領域的特定分布,從而提高預測的準確性。
  3. 🔧 改進模型架構設計: 🔧

    • 使其能夠更好地處理上下文示例中的分隔符、跨示例注意力和位置編碼。
    • 采用了改進的TimesFM模型架構,并引入了可學習的分隔符標記來區分不同的上下文示例,同時允許Transformer模型對所有先前的標記(包括分隔符標記)進行因果注意。
    • 此外,本研究采用了無位置編碼(NoPE)的設計,以提高模型的長度泛化能力,并避免在繼續預訓練階段出現位置編碼含義不一致的問題。
  4. 🧩 獨特的預訓練數據生成策略: 🧩

    • 包括上下文生成和數據集混合。
    • 在上下文生成階段,本研究采用了兩種分組方式:時間序列級別分組和數據集級別分組,以確保分組的示例具有相似的模式,以便模型從中學習。
    • 在數據集混合階段,本研究使用了除Wiki數據集之外的所有預訓練數據集來生成上下文示例,并為時間序列級別和數據集級別的示例賦予相同的權重。
  5. 🏆 驗證有效性: 🏆

    • 通過在Monash和ETT等流行的預測基準數據集上進行評估,驗證了上下文微調方法的有效性。
    • 實驗結果表明,與監督深度學習方法、統計模型以及其他時間序列基礎模型相比,上下文微調可以顯著提高零樣本預測的性能。
    • 尤其值得一提的是,本研究的上下文微調方法甚至略微優于在目標數據集上進行顯式微調的基礎模型,這突顯了該方法在實際應用中的巨大潛力。

論文實驗

圖片
圖片
圖片
圖片

本文來自互聯網用戶投稿,該文觀點僅代表作者本人,不代表本站立場。本站僅提供信息存儲空間服務,不擁有所有權,不承擔相關法律責任。
如若轉載,請注明出處:http://www.pswp.cn/news/909507.shtml
繁體地址,請注明出處:http://hk.pswp.cn/news/909507.shtml
英文地址,請注明出處:http://en.pswp.cn/news/909507.shtml

如若內容造成侵權/違法違規/事實不符,請聯系多彩編程網進行投訴反饋email:809451989@qq.com,一經查實,立即刪除!

相關文章

從0開始學習語言模型--Day02-如何最大化利用硬件

如何利用硬件 這個單元分為內核、并行處理和推理。 內核(Kernels) 我們說的內核一般指的就是GPU,這是我們用于計算的地方,一般說的計算資源就指的是GPU的大小。我們模型所用的數據和參數一般存儲在內存里,假設把內存…

ElasticSearch配置詳解:設置內存鎖定的好處

什么是內存鎖定 "bootstrap": {"memory_lock": "true" }內存鎖定是指將Elasticsearch的JVM堆內存鎖定在物理內存中,防止操作系統將其交換(swap)到磁盤。 內存交換是操作系統的虛擬內存管理機制,當…

成功解決 ValueError: Unable to find resource t64.exe in package pip._vendor.distlib

解決問題 我們在本地的命令行中運行指令"python -m pip install --upgrade pip"的時候,報了如下的錯誤: 解決思路 我們需要重新安裝一下pip。 解決方法 步驟1: 通過執行下面的指令刪除本地的pip: python -m pip uninstall pip…

倉庫物資出入庫管理系統源碼+uniapp小程序

一款基于ThinkPHPuniapp開發的倉庫物資出入庫管理系統,適用于單位內部物資采購、發放管理的庫存管理系統。提供全部無加密源碼,支持私有化部署。 更新日志: 新增 基于UNIAPP開發的手機端,適配微信小程序 新增 字典管理 新增頁面…

基于機器學習的逐巷充填開采巖層運動地表沉降預測

基于機器學習的逐巷充填開采巖層運動地表沉降預測 1. 項目概述 本報告詳細介紹了使用Python和機器學習技術預測逐巷充填開采過程中地表沉降的方法。通過分析地質參數、開采參數和充填參數,構建預測模型評估地表沉降風險。 # 導入必要的庫 import numpy as np import pandas…

MotleyCrew ——拋棄dify、coze,手動搭建多agent工作流

1. MotleyCrew 核心組件 - 協調器: Crew MotleyCrew 的核心是一個 “Crew” 對象,即多代理系統的指揮者。Crew 持有一個全局的知識圖譜(使用 Kuzu 圖數據庫),用于記錄所有任務、任務單元和其執行狀態。 Cr…

掌握這些 Python 函數,讓你的代碼更簡潔優雅

在 Python 編程世界里,代碼的簡潔性與可讀性至關重要。簡潔優雅的代碼不僅便于自己后期維護,也能讓其他開發者快速理解邏輯。而 Python 豐富的內置函數和一些實用的第三方庫函數,就是實現這一目標的有力武器。接下來,就為大家介紹…

簡說ping、telnet、netcat

簡說 ping 和 telnet 命令的作用、用法和區別,方便理解它們在網絡診斷中的用途。 🌐 ping 命令 ? 作用: ping 用于檢測網絡連通性。它通過向目標主機發送 ICMP Echo 請求 并等待回應,從而判斷目標主機是否可達,并測…

基于STM32的超聲波模擬雷達設計

一、雷達概述 雷達(Radio Detection and Ranging,無線電探測與測距)是一種利用電磁波探測目標位置、速度等信息的主動式傳感器系統。其基本原理是發射電磁波并接收目標反射的回波,通過分析回波的時間差、頻率變化等參數&#xff0…

飛書多維表格利用 Amazon Bedrock AI 能力賦能業務

背景 飛書多維表格是一款功能強大的在線數據管理與協作工具。它打破傳統表格局限,將電子表格與數據庫特性融合,支持看板、甘特圖、表單等多種視圖自由切換,可根據項目進度、任務管理等不同場景靈活展示數據。其豐富的字段類型能精準適配各類…

表格對比工具推薦,快速比對Excel文件

軟件介紹 今天為大家推薦一款專為Excel用戶設計的表格比較工具,簡單易用,零基礎也能快速掌握。 輕量高效的辦公助手 Excel比較工具體積僅為11MB,占用空間小,運行流暢,適合各類電腦配置使用。 簡潔明了的操作界面 軟…

深入探究其內存開銷與JVM布局——Java Record

Java 14引入的Record類型如同一股清流,旨在簡化不可變數據載體的定義。它的核心承諾是:??透明的數據建模??和??簡潔的語法??。自動生成的equals(), hashCode(), toString()以及構造器極大地提升了開發效率。 當我們看到這樣的代碼: …

Vue 3 九宮格抽獎系統,采用優雅的 UI 設計和流暢的動畫效果

九宮格抽獎 預覽地址 項目簡介 這是一個基于 Vue 3 開發的現代化九宮格抽獎系統,采用優雅的 UI 設計和流暢的動畫效果,為用戶提供極致的抽獎體驗。系統支持多種獎品配置,實時抽獎記錄展示,以及完整的活動說明功能。 核心功能 …

無縫對接大疆算力平臺:基于Coovally的無人機AI模型端到端優化方案

【導讀】 隨著無人機應用場景的快速拓展,企業對于定制化AI解決方案的需求日益迫切。大疆算力開放平臺為開發者提供了專業的模型量化與部署環境,幫助開發者將訓練好的AI模型高效部署至大疆無人機平臺。 然而,要實現完整的AI開發閉環&#xf…

ubuntu下載CUDA cuDNN

nivida-smi查看顯卡驅動版本 (一)安裝CUDA cuda官網 cuda官網 下載對應版本的cuda 這個官網真不錯啊,下面附上了指令 wget https://developer.download.nvidia.com/compute/cuda/repos/ubuntu2404/x86_64/cuda-ubuntu2404.pin sudo mv c…

FreeRTOS定時器

目錄 1.特性2.運行環境2.1 守護任務2.2 回調函數2.3 內部源碼 3.和Linux對比4.ID5.數據傳輸6.操作函數6.1 創建6.2 刪除6.3 啟動6.4 停止6.5 復位(重置)6.6 修改周期6.7 注意事項 7.示例:一般使用8.示例:定時器防抖 1.特性 定時器…

JavaScript中的迭代器模式:優雅遍歷數據的“設計之道”

JavaScript中的迭代器模式:優雅遍歷數據的“設計之道” 一、什么是迭代器模式? 在編程世界中,迭代器模式(Iterator Pattern)是一種經典的設計模式,它的核心思想是:為集合對象提供一種統一的訪…

Debian/Ubuntu systemd coredump調試程序Crash

程序是通過systemd監管,當程序出現crash的時候,需要保存crash的日志,也就是coredump日志,按照一般做法設置coredump。而在安裝有systemd服務的系統中一般都有systemd-coredump服務。 systemd-coredump 是 systemd 子系統中的一個工…

【圖片轉 3D 模型】北大·字節跳動·CMU攜手——單圖15 秒生成結構化3D模型!

??引言:單圖生成結構化 3 D 模型的技術突破? ? PartCrafter 由北京大學、字節跳動與卡耐基梅隆大學聯合研發,是全球首個??端到端生成結構化 3 D 網格??的模型。它僅需單張 RGB 圖像,即可在 34 秒內生成帶語義分解的 3 D 部件&#xf…

零基礎RT-thread第二節:按鍵控制

我這里依然使用的是野火開發板,F767芯片。 這一節寫一下按鍵控制LED亮滅。 這是按鍵以及LED的原理圖。 按鍵對應的引腳不按下時是低電平,按下后是高電平。 LED是在低電平點亮。 接下來是key.c: /** Copyright (c) 2006-2021, RT-Thread Development T…