頂會ICLR2024論文Time-LLM:基于大語言模型的時間序列預測

在這里插入圖片描述

文青松
松鼠AI首席科學家、AI研究院負責人

美國佐治亞理工學院(Georgia Tech)電子與計算機工程博士,人工智能、決策智能和信號處理方向專家,在松鼠AI、阿里、Marvell等公司超10年的技術和管理經驗,近100篇文章發表在人工智能相關的頂會與頂刊,多篇文章被AI頂會(NeurIPS, ICLR等)評選為Oral/Spotlight論文,兩次入選IJCAI最具影響力論文并排名第一,兩次獲得AAAI人工智能系統部署應用獎,獲得ICASSP Grand Challenge冠軍。近期研究興趣為智能時序與AI教育, 也是AI頂會 (AAAI, IJCAI, KDD, ICDM等) Workshop on AI for Time Series, Workshop on AI for Education的主要組織者之一。個人主頁為: https://sites.google.com/site/qingsongwen8

論文:
Time-LLM: Time Series Forecasting By Reprogramming Large Language Models
Time-LLM:通過重編程大型語言模型進行時間序列預測
論文鏈接
論文(arXiv):https://arxiv.org/abs/2310.01728
論文(ICLR’24):https://openreview.net/forum?id=Unb5CVPtae
代碼:
https://github.com/KimMeen/Time-LLM


以下內容是根據松鼠AI首席科學家、AI研究院負責人文青松團隊成員在2023 CCF國際AIOps挑戰賽決賽暨“大模型時代的AIOps”研討會閃電論文分享環節上的演講整理成文。

大家好,我是來自莫納什大學的博士生金明(個人主頁:https://mingjin.dev/),今天很榮幸能和大家分享我們團隊的研究成果,介紹的內容是Time-LLM,主要探討的是如何重編程大語言模型來實現時間序列預測。

背 景

在這里插入圖片描述

和傳統的任務導向學習與基準模型預訓練相比,模型重編程所需要的訓練樣本和待學習的參數都很少。與典型的遷移學習相比,模型重編程在域內和跨域泛化等方面,都顯示出了較好的有效性。在技術層面模型重編程只需要訓練外部的輸入變換層和輸出映射層,而不涉及任何對預訓練模型本身的更新。

目 的

在這里插入圖片描述

我們的工作內容主要是研究如何從編程大語言模型時期可以輕松的用于時間序列相關任務。

比方說預測,我們將大語言模型重編程定義為兩部分,第一是Adaptation,目的在于打通兩個短鏈之間的隔閡,使大語言模型能夠將時間序列作為輸入和對應輸出。其次是Alignment,也就是我們常說的對齊,目的是進一步消除短鏈之間的間隔。

此外我們還發現重編程大語言模型可以讓其在時間序列任務上更有效。比如通過Prompts的形式引入外部的專家知識和具體的任務描述。

架 構

在這里插入圖片描述

上圖中展示的是我們方法的架構圖,其中第1、第2、第5步是Adaptation相關的設計,然后第3、第4步是對齊相關的設計。在第3步里也就是Patch Reprogramming,我們通過使用Word Embedding來表示不同時間序列,進而對齊兩個不同的模態即自然語言和時間序列。

第4步,我們通過將外部知識做前綴這個方法,進一步幫助大語言模型在時序數據上做有效的推理,外部知識可以是一些專家知識或者具體的實訓任務的描述。

圖片

圖片中的a部分,我們進一步描述了Patch reprogramming的核心思想。在這個例子中,我們展示了如何使用自然語言刻畫時間序列片段 (Patch),比如Patch 5的語義信息其實可以描述成兩個具體過程:先短暫上升再平穩下降。因此我們可以用綠色和紫色兩個不同的Text prototypes來表示它,進而打通如圖所示的兩個不同的數據模態/信息域。

圖片

在圖片中的b部分,我們對比了兩種結合文本Prompt的范式,其中我們提出來的Prompt-as-Prefix(PaP)方法具有兩個比較直接的優勢:一是無需構建特定的多模態指令訓練集,二是規避了大語言模型本身在生成輸出時間序列方面存在的一些挑戰,例如有限的上下文窗口,較低的高精度數字敏感度,和不同分詞策略對結果產生的未知影響。

結 果

在這里插入圖片描述

接下來展示實驗的結果。如圖所示,我們的Time-LLM方法顯示出了非常好的有效性。上圖是標準的長程預測結果在8個基準數據集上的對比,下圖是標準短程預測在M4比賽數據集上的結果對比。

圖片

圖片中上半部分展示的是部分Few-shot和Zero-show的預測結果的對比,下半部分展示的是主要的消融實驗和訓練效率相關的實驗結果,均顯示了本文提出方法的有效性。

總 結

在這里插入圖片描述

最后是一個簡短的總結。

我們的研究工作一是探索使用大語言模型做時序分析任務的可能性,提出了對大語言模型做重編程的概念。二是發現和驗證了時序任務本身可以抽象成一種能夠被大語言模型解決的特殊語言任務。最后是我們的一些啟發和展望,比如說做多模態的時序分析,以及通用的時序GPT。

我的分享到此結束,謝謝大家。


更多LLM for Time Series相關資料:

  1. (時序與時空大模型, 綜述): Large Models for Time Series and Spatio-Temporal Data: A Survey and Outlook, in arXiv, Oct. 2023.

Authors: Ming Jin, Qingsong Wen*, Yuxuan Liang, Chaoli Zhang, Siqiao Xue, Xue Wang, James Zhang, Yi Wang, Haifeng Chen, Xiaoli Li (IEEE Fellow), Shirui Pan*, Vincent S. Tseng (IEEE Fellow), Yu Zheng (IEEE Fellow), Lei Chen (IEEE Fellow), Hui Xiong (IEEE Fellow)

Link: https://arxiv.org/abs/2310.10196

2.(LLM for Time Series, Position Paper): What Can Large Language Models Tell Us about Time Series Analysis, in arXiv, Feb. 2024.

Authors: Ming Jin, Yifan Zhang, Wei Chen, Kexin Zhang, Yuxuan Liang*, Bin Yang, Jindong Wang, Shirui Pan, Qingsong Wen*

Link: https://arxiv.org/abs/2402.02713

本文來自互聯網用戶投稿,該文觀點僅代表作者本人,不代表本站立場。本站僅提供信息存儲空間服務,不擁有所有權,不承擔相關法律責任。
如若轉載,請注明出處:http://www.pswp.cn/news/716142.shtml
繁體地址,請注明出處:http://hk.pswp.cn/news/716142.shtml
英文地址,請注明出處:http://en.pswp.cn/news/716142.shtml

如若內容造成侵權/違法違規/事實不符,請聯系多彩編程網進行投訴反饋email:809451989@qq.com,一經查實,立即刪除!

相關文章

Cloud整合Zookeeper代替Eureka

微服務間通信重構與服務治理筆記-CSDN博客 Zookeeper是一個分布式協調工具,可以實現注冊中心功能 安裝Zookeeper 隨便 就用最新版本吧 進入Zookeeper 包目錄 cd /usr/local/develop/ 解壓 tar -zxvf apache-zookeeper-3.9.1-bin.tar.gz -C /usr/local/develop 進入配置文件…

uniapp 獲取頁面來源

獲取當前頁面棧的實例,以數組形式按棧的順序給出,數組中的元素為頁面實例,第一個元素為首頁,最后一個元素為當前頁面。 let pages getCurrentPages(); if (pages.length > 1) { // 若頁面棧長度大于1則表示不止一個頁面被打開…

在 JavaScript 中用 var, let, 以及 const 有什么差別?什么時候該用哪個?

「在 JavaScript 中用 var, let, 以及 const 有什么差別?」是在前端、JavaScript 面試中常見的考題。在面試時可以先大方向地列點說出異同之處,然后再針對每一個點進行深入說明。以下是以第一人稱撰寫的參考擬答。 var, let, 以及 const 都是在 JavaScript 用來做變數宣告的…

前端導入導出

1、將后端excel二進制文件導出excel下載 import { read, utils, writeFileXLSX } from "xlsx";const useExportExcel (excelData: string, fileName: string) > {const wb read(excelData);const ws wb.Sheets[wb.SheetNames[0]];// 從工作表生成數據行const …

Android 將圖片網址url轉化為bitmap

1. 圖片網址url轉化為bitmap 1.1. 方法一 通過 HttpURLConnection 請求 要使用一個線程去訪問,因為是網絡請求,這是一個一步請求,不能直接返回獲取,要不然永遠為null,在這里得到BitMap之后記得使用Hanlder或者EventBu…

React之useState hook

實現useState js實現一個useState,簡單的原理就是賦值然后更新渲染,大概偽代碼如下: function useState(initValue) {let value initValue;function setValue(v) {if (typeof v "function") {value v(initValue);} else {value…

StarRocks實戰——首汽約車實時數倉實踐

目錄 前言 一、引入背景 二、OLAP引擎選型 三、架構演進 四、實時數倉構建 五、業務實踐價值未來規劃 原文大佬的這篇首汽約車實時數倉實踐有借鑒意義,這里摘抄下來用作學習和知識沉淀。 前言 首汽約車(以下簡稱“首約”)是首汽集團打造…

物體檢測-系列教程20:YOLOV5 源碼解析10 (Model類前向傳播、forward_once函數、_initialize_biases函數)

😎😎😎物體檢測-系列教程 總目錄 有任何問題歡迎在下面留言 本篇文章的代碼運行界面均在Pycharm中進行 本篇文章配套的代碼資源已經上傳 點我下載源碼 14、Model類 14.2 前向傳播 def forward(self, x, augmentFalse, profileFalse):if augm…

MySQL 8.0 架構 之錯誤日志文件(Error Log)(2)

文章目錄 MySQL 8.0 架構 之錯誤日志文件(Error Log)(2)MySQL錯誤日志文件(Error Log)錯誤日志相關參數log_errorlog_error_services過濾器(Filter Error Log Components)寫入/接收器…

Vue+SpringBoot打造大學計算機課程管理平臺

目錄 一、摘要1.1 項目介紹1.2 項目錄屏 二、功能模塊2.1 實驗課程檔案模塊2.2 實驗資源模塊2.3 學生實驗模塊 三、系統設計3.1 用例設計3.2 數據庫設計3.2.1 實驗課程檔案表3.2.2 實驗資源表3.2.3 學生實驗表 四、系統展示五、核心代碼5.1 一鍵生成實驗5.2 提交實驗5.3 批閱實…

131. 分割回文串(力扣LeetCode)

文章目錄 131. 分割回文串題目描述回溯代碼 131. 分割回文串 題目描述 給你一個字符串 s,請你將 s 分割成一些子串,使每個子串都是 回文串 。返回 s 所有可能的分割方案。 回文串 是正著讀和反著讀都一樣的字符串。 示例 1: 輸入&#xf…

Android 架構MVI、MVVM、MVC、MVP

目錄 一、MVC(Model-View-Controller) 二、 MVP(Model-View-Presenter) 三. MVVM(Model-View-ViewModel) 四. MVI(Model-View-Intent) 五.MVI簡單實現 先簡單了解一下MVC、MVP和…

索引使用規則6——單列索引聯合索引

1、單列索引 單列索引:即一個索引只包含單個列 舉個例子 1.1、給phone和那么建立索引 create index index_name on tb_qianzhui(name); create index index_phone on tb_qianzhui(phone);1.2、查詢發現可能的索引有好幾個,但是最終選擇了phone的索引…

軟考 系統分析師系列知識點之詳細調查(2)

接前一篇文章:軟考 系統分析師系列知識點之詳細調查(1) 所屬章節: 第10章. 系統分析 第2節. 詳細調查 在系統規劃階段,通過初步調查,系統分析師已經對企業的組織結構、系統功能等有了大致的了解。但是&…

蘿卜大雜燴 | 提高數據科學工作效率的 8 個 Python 庫

本文來源公眾號“蘿卜大雜燴”,僅用于學術分享,侵權刪,干貨滿滿。 原文鏈接:提高數據科學工作效率的 8 個 Python 庫 在進行數據科學時,可能會浪費大量時間編碼并等待計算機運行某些東西。所以我選擇了一些 Python 庫…

Vue3中的Hooks詳解

vue3帶來了Composition API,其中Hooks是其重要組成部分。之前我寫過一篇關于vue3 hooks的文章比較簡單 Vue3從入門到刪庫 第十一章(自定義hooks) 所以本文將深入探討Vue3中Hooks,幫助你在Vue3開發中更加得心應手。 一、Vue3 Hoo…

貪吃蛇(C語言)步驟講解

一:文章大概 使用C語言在windows環境的控制臺中模擬實現經典小游戲 實現基本功能: 1.貪吃蛇地圖繪制 2.蛇吃食物的功能(上,下,左,右方向控制蛇的動作) 3.蛇撞墻死亡 4.計算得分 5.蛇身加…

[C語言]——C語言常見概念(1)

目錄 一.C語言是什么、 二.C語言的歷史和輝煌 三.編譯器的選擇(VS2022為例) 1.編譯和鏈接 2.編譯器的對比 3.VS2022 的優缺點 四.VS項目和源文件、頭文件介紹 五.第?個C語言程序 ??????? 一.C語言是什么、 ?和?交流使?的是?然語?&…

【python】爬取鏈家二手房數據做數據分析【附源碼】

一、前言、 在數據分析和挖掘領域中,網絡爬蟲是一種常見的工具,用于從網頁上收集數據。本文將介紹如何使用 Python 編寫簡單的網絡爬蟲程序,從鏈家網上海二手房頁面獲取房屋信息,并將數據保存到 Excel 文件中。 二、效果圖&#…

【JS】解構賦值注意點,解構賦值報錯

報錯代碼 const 小明 { email: 6, pwd: 66 } const 小剛 { email: 9, pwd: 99 }const { email } 小明 const { email } 小剛 報錯圖 原因 2個常量重復,重復在同一個作用域內是不能重復的,例如大括號內{const a 1; const a 2} 小伙伴A提問 問&…