LLMTIME: 不用微調!如何用大模型玩轉時間序列預測?

今天是端午節,端午安康!值此傳統佳節之際,我想和大家分享一篇關于基于大語言模型的時序預測算法——LLMTIME。隨著人工智能技術的飛速發展,利用大型預訓練語言模型(LLM)進行時間序列預測成為一個新興且極具潛力的研究方向。LLMTIME通過將數值數據轉化為文本格式,借助語言模型強大的模式學習能力,實現了對復雜時間序列的高效預測和不確定性建模。

接下來,我將深入對這篇論文展開全面解讀。和以往一樣,我會嚴格依照論文的結構框架,從研究背景、核心論點、實驗設計到最終結論,逐一對文章的各個關鍵部分進行細致剖析 ,力求為大家呈現這篇時間序列預測論文的全貌,挖掘其中的研究價值與創新點。

1. Abstract

通過將時間序列編碼為數字字符串,可以將時間序列預測重新表述為文本中的“下一個 token 預測”問題。在這一思路基礎上,本文發現大型語言模型(LLMs),如 GPT-3 和 LLaMA-2,竟然能夠在零樣本(zero-shot)條件下進行時間序列外推,其表現與為下游任務專門設計的時間序列模型相當,甚至更優。為了實現這種性能,提出了一些方法,用于有效地對時間序列數據進行 token 化,并將模型輸出的離散 token 分布轉化為對連續數值的高靈活度密度分布。作者認為,LLMs 在時間序列任務中取得成功,源于它們能夠自然表示多峰分布(multimodal distributions),以及它們在訓練中表現出的對簡潔性重復性的偏好——這正與許多時間序列中的顯著特征(如周期性趨勢的重復)高度一致。作者還展示了 LLMs 如何無需插值就能自然地處理缺失數據(通過非數值文本進行處理),如何融合文本型輔助信息,以及如何通過問答形式解釋預測結果。雖然發現模型規模的增加通常會帶來時間序列任務性能的提升,但也觀察到 GPT-4 的表現可能低于 GPT-3,原因包括其對數字的 token 化方式不理想,以及其不佳的不確定性校準能力。這些問題可能是由于諸如強化學習人類反饋(RLHF)等對齊干預所造成的。

2.?Introduction

盡管與其他序列建模問題(如文本、音頻或視頻)存在相似之處,時間序列具有兩個特別具有挑戰性的屬性。與視頻或音頻通常具有一致的輸入尺度和采樣率不同,聚合的時間序列數據集通常包含來自截然不同來源的序列,有時還存在缺失值。此外,時間序列預測的常見應用,例如天氣或金融數據,需要從僅包含極少部分可能信息的觀測中進行外推,這使得準確的點預測幾乎不可能,而不確定性估計則尤為重要。盡管大規模預訓練已成為視覺和文本中訓練大型神經網絡的關鍵要素,使性能能夠直接隨著數據可用性擴展而提高,但在時間序列建模中通常并不使用預訓練,因為缺乏共識的無監督目標以及缺少大型、統一的預訓練數據集。因此,在一些流行的基準測試中,簡單的時

完整文章鏈接:LLMTIME: 不用微調!如何用大模型玩轉時間序列預測??

本文來自互聯網用戶投稿,該文觀點僅代表作者本人,不代表本站立場。本站僅提供信息存儲空間服務,不擁有所有權,不承擔相關法律責任。
如若轉載,請注明出處:http://www.pswp.cn/pingmian/83114.shtml
繁體地址,請注明出處:http://hk.pswp.cn/pingmian/83114.shtml
英文地址,請注明出處:http://en.pswp.cn/pingmian/83114.shtml

如若內容造成侵權/違法違規/事實不符,請聯系多彩編程網進行投訴反饋email:809451989@qq.com,一經查實,立即刪除!

相關文章

在VirtualBox中打造高效開發環境:CentOS虛擬機安裝與優化指南

🔥「炎碼工坊」技術彈藥已裝填! 點擊關注 → 解鎖工業級干貨【工具實測|項目避坑|源碼燃燒指南】 一、為何選擇VirtualBox CentOS組合? 對于程序員而言,構建隔離的開發測試環境是剛需。VirtualBox憑借其跨平臺支持(W…

LeeCode 98. 驗證二叉搜索樹

給你一個二叉樹的根節點 root ,判斷其是否是一個有效的二叉搜索樹。 有效 二叉搜索樹定義如下: 節點的左子樹只包含 小于 當前節點的數。節點的右子樹只包含 大于 當前節點的數。所有左子樹和右子樹自身必須也是二叉搜索樹。 提示: 樹中節…

Python簡易音樂播放器開發教程

📚 前言 編程基礎第一期《12-30》–音樂播放器是日常生活中常用的應用程序,使用Python和pygame庫可以輕松實現一個簡易的音樂播放器。本教程將詳細講解如何開發一個具有基本功能的音樂播放器,并解析其中涉及的Python編程知識點。 &#x1f6e…

ssh連接斷開,保持任務后臺執行——tmux

目錄 **核心用途****基礎使用方法**1. **安裝 tmux**2. **啟動新會話**3. **常用快捷鍵(需先按 Ctrlb 前綴)**4. **會話管理命令**5. **窗格操作進階** **典型工作流****注意事項****配置文件(~/.tmux.conf)** tmux( …

3D Gaussian splatting 04: 代碼閱讀-提取相機位姿和稀疏點云

目錄 3D Gaussian splatting 01: 環境搭建3D Gaussian splatting 02: 快速評估3D Gaussian splatting 03: 用戶數據訓練和結果查看3D Gaussian splatting 04: 代碼閱讀-提取相機位姿和稀疏點云3D Gaussian splatting 05: 代碼閱讀-訓練整體流程3D Gaussian splatting 06: 代碼…

每日c/c++題 備戰藍橋杯(P1204 [USACO1.2] 擠牛奶 Milking Cows)

P1204 [USACO1.2] 擠牛奶 Milking Cows - 詳解與代碼實現 一、題目背景 三個農民每天清晨[……](簡要介紹題目背景,與官網描述類似) 二、問題分析 輸入要求 :讀取 N 個農民的擠奶時間區間,計算兩個值:最…

保持本地 Git 項目副本與遠程倉庫完全同步

核心目標: 保持本地 Git 項目副本與 GitHub 遠程倉庫完全同步。 關鍵方法: 定期執行 git pull 命令。 操作步驟: 進入項目目錄: 在終端/命令行中,使用 cd 命令切換到你的項目文件夾。執行拉取命令: 運行…

Flutter 4.x 版本 webview_flutter 嵌套H5

踩坑早期版本 使用 WebView 代碼如下 import package:flutter/material.dart; import package:webview_flutter/webview_flutter.dart;class HomePage extends StatelessWidget {const HomePage({super.key});overrideWidget build(BuildContext context) {return Scaffold(ap…

rtpinsertsound:語音注入攻擊!全參數詳細教程!Kali Linux教程!

簡介 2006年8月至9月期間,我們創建了一個用于將音頻插入指定音頻(即RTP)流的工具。該工具名為rtpinsertsound。 該工具已在Linux Red Hat Fedora Core 4平臺(奔騰IV,2.5 GHz)上進行了測試,但預…

跑步前熱身動作

跑前熱身的核心目標是升高體溫、激活肌肉、預防損傷 ,同時通過動態動作提升運動表現。熱身(步驟關節→肌肉→心肺)和針對性動作(如抱膝抬腿)能有效降低受傷風險,建議每次跑步前嚴格執行。 推薦跑前熱身動作…

GIT命令行的一些常規操作

放棄修改 git checkout . 修改commit信息 git commit --amend 撤銷上次本地commit 1、通過git log查看上次提交的哈希值 2、git reset --soft 哈希值 分支 1.創建本地分支 git branch 分支名 2.切換本地分支 git checkout mybranch; 3.創建一個新分支并…

RAGFlow從理論到實戰的檢索增強生成指南

目錄 前言 一、RAGFlow是什么?為何需要它? 二、RAGFlow技術架構拆解 三、實戰指南:從0到1搭建RAGFlow系統 步驟1:環境準備 步驟2:數據接入 步驟3:檢索與生成 四、優化技巧:讓RAGFlow更精…

軟件工程方法論:在確定性與不確定性的永恒之舞中尋找平衡

當我們談論“軟件工程”時,“工程”二字總暗示著某種如橋梁建造般的精確與可控。然而,軟件的本質卻根植于人類思維的復雜性與需求的流變之中。軟件工程方法論的發展史,并非線性進步的凱歌,而是一部在確定性的渴望與不確定性的現實…

Python打卡訓練營Day41

DAY 41 簡單CNN 知識回顧 數據增強卷積神經網絡定義的寫法batch歸一化:調整一個批次的分布,常用與圖像數據特征圖:只有卷積操作輸出的才叫特征圖調度器:直接修改基礎學習率 卷積操作常見流程如下: 1. 輸入 → 卷積層 →…

開源版 PyMOL 如何繪制 Galidesivir 分子結構 ?

參閱:開源版PyMol安裝保姆級教程 百度網盤下載 提取碼:csub pip show pymol 簡介: PyMOL是一個Python增強的分子圖形工具。它擅長蛋白質、小分子、密度、表面和軌跡的3D可視化。它還包括分子編輯、射線追蹤和動畫。 先從 www.python.org 下載 python-…

【FPGA】Vivado 保姆級安裝教程 | 從官網下載安裝包開始到安裝完畢 | 每步都有詳細截圖說明 | 支持無腦跟裝

安裝包下載:Xilinx_Vivado Download Link(下好后可直接安裝) 目錄 (有安裝包后,可直接跳轉至 Step5,免得去官網下了,比較麻煩) Step1:進入官網 Step2:注冊…

純html,js創建一個類似excel的表格

后臺是php,表中數據可編輯,可刪除,可提交到數據庫 <!DOCTYPE html> <html> <head><meta charset="utf-8"><style>body {font-family: Arial, sans-serif;margin: 20px;background-color: #fff;}.toolbar {margin-bottom: 10px;disp…

密碼編碼器使用指南

密碼編碼器概述 通過第三章的學習,您應該已經對UserDetails接口及其多種實現方式有了清晰認識。如第二章所述,在認證授權流程中,不同參與者負責管理用戶憑證的表示形式,其中UserDetailsService和PasswordEncoder等組件都提供了默認實現。本節將重點分析PasswordEncoder的核…

《數據結構初階》【番外篇:二路歸并的外排史詩】

【番外篇&#xff1a;多路歸并的外排史詩】目錄 前言&#xff1a;---------------介紹---------------一、實際情景二、外部排序什么是外部排序&#xff1f; 三、多路歸并排序什么是多路歸并排序&#xff1f; ---------------實現---------------四、文件歸并文件二路歸并排序思…

DDP與FSDP:分布式訓練技術全解析

DDP與FSDP:分布式訓練技術全解析 DDP(Distributed Data Parallel)和 FSDP(Fully Sharded Data Parallel)均為用于深度學習模型訓練的分布式訓練技術,二者借助多 GPU 或多節點來提升訓練速度。 1. DDP(Distributed Data Parallel) 實現原理 數據并行:把相同的模型復…