TimeDP Learning to Generate Multi-Domain Time Series with Domain Prompts論文閱讀筆記

TimeDP Learning to Generate Multi-Domain Time Series with Domain Prompts

摘要

在跨域時序數據生成任務中,提出使用”時間序列語義原型“模塊定義時間序列原型來表示時間序列基,每個原型向量作為“詞”表示一些基本的時間序列特征。應用原型分配模塊提取提取域特定的原型權值,以學習域提示作為生成條件。在采樣過程中,從目標域中提取少量采樣的“域提示”,并以域提示為條件生成時間序列樣本。

引言

跨域時間序列生成是一個非常復雜的挑戰,因為它需要在不依賴現有歷史記錄的情況下跨各個域創建新數據

  • 一種直接方法是在訓練過程中使用預定義的域標簽。該方法依賴于明確的領域標簽來進行條件生成。當面對不可見的領域,即領域標簽沒有明確可用時,則會面臨巨大的挑戰

  • 另一種方法通過使用自然語言描述域,將跨域時間序列生成框架為條件生成任務。特定于領域的細微差別通常難以準確地表達,從而導致嘈雜、不完整或模糊的提示。此外,對于全新的或發展中的領域,制作這些領域描述符可能是不切實際的

為了解決這些挑戰,本文提出了一種無標簽、無文本的方法,該方法學習時間序列原型作為基本元素來構建域提示,以生成具有擴散模型的時間序列,稱為TimeDP。通過訓練,原型學習表示時間序列基,作為具有時間序列語義的“文字描述”。對每個訓練樣本應用原型分配模塊,構建生成該樣本的特定“提示符”。在采樣過程中,從目標域中提取少量樣本的“提示符”來構造域提示符的總體,并以域提示符為條件生成時間序列樣本。

主要貢獻:

  • 我們提出了一種多域時間序列生成模型TimeDP,該模型通過學習一組時間序列原型和原型分配模塊來構造域提示,其中域提示作為時間序列擴散模型的條件
  • 我們首先提出了一種使用無標簽、無文本條件作用機制的多域時間序列生成模型
  • 實驗表明,該方法具有較好的域內生成質量和較強的不可見域生成能力

相關工作與背景

時間序列生成

  • GAN:通過監督目標和對抗目標來聯合優化學習嵌入空間,使得網絡學習到時間動態信息
  • VAE:考慮了時間數據的趨勢和季節分解,設計了特定的解碼器結構。首先引入矢量量化技術和雙向變壓器,以更好地捕獲時間一致性
  • 另一類被認為是混合型方法,將GAN、flows和ODE結合在一起
  • DDPM:去噪擴散概率模型,涉及到無條件和條件擴散模型生成數據

跨域時間序列模型

  • 兩階段模型:在大量多域數據上預訓練表征學習模型,第二階段為任務特定模型進行微調
  • 單階段模型:使用補丁標記器對端到端變壓器模型進行預訓練,用于時間序列預測

這些方法采用實例規范化來基于歷史數據生成預測,而不顯式地處理領域差異。與這些方法相比,本文方法建議使用時間序列原型,構造域提示來明確區分域并橋接它們

去噪概率擴散模型 (DDPM)

擴散概率模型需要學習反轉馬爾可夫鏈的過程,該過程被稱為反向過程。其正向過程為擴散過程,該過程逐漸向數據添加噪聲,最終信號收斂到某個特定分布

具體公式見https://blog.csdn.net/weixin_45180140/article/details/150556555?spm=1001.2014.3001.5501的DDPMs部分

問題描述

DiT={x∈RT}Ni,??x=(x1,x2,...,xT)D_i^T = \{\pmb{x}\in\mathbb{R}^T\}^{N_i},\;\pmb{x}=(x_1, x_2,...,x_T)DiT?={xRT}Ni?,x=(x1?,x2?,...,xT?)定義了一個有NiN_iNi?個樣本的時間序列數據集,且屬于領域iii,其中每個樣本具有TTT個序列值。

單領域時間序列預測模型對每一個數據集獨立的利用參數θi\theta_iθi?擬合時間步的聯合分布p(x1,x2,...,xT)p(x_1, x_2,...,x_T)p(x1?,x2?,...,xT?),定義為pθ(x1,x2,...,xT)p_\theta(x_1, x_2,...,x_T)pθ?(x1?,x2?,...,xT?)

在本文中,作者探索了一個域統一設置,其中MMM個序列長度為TTT的域數據集的混合表示為DT=?i=1MDiD^T=\bigcup_{i=1}^MD_iDT=?i=1M?Di?。且作者的目標是利用一組參數來表示多個領域的聯合分布pθ(x1,x2,...,xT∣i)p_\theta(x_1, x_2,...,x_T|i)pθ?(x1?,x2?,...,xT?i)

方法

在訓練過程中,由于來自所有數據域的序列混合在一起,潛在表示中的所有時間序列特征都是糾纏在一起的,沒有明確的方法來區分特定的時間序列數據域。雖然利用領域標簽作為訓練時間序列生成模型的類標簽可以為識別特定領域提供指導,但這種方法隱含了一個假設,即所有領域都是相互獨立的,忽略了領域對之間的不同相似程度。因此,在考慮各領域之間的相互關系的同時,使模型具備在所選領域內生成時間序列的能力是一項挑戰。為了克服這一挑戰,關鍵是建立跨域時間序列模型的觸發機制,控制模型從特定域生成時間序列數據。受提示技術在可控內容生成方面最新進展的啟發,本文提出構建域提示來控制跨域模型。

在這里插入圖片描述

域提示詞

與文本和圖像模態不同,文本和圖像模態的生成目標可以用自然語言表達或分類為離散類,而時間序列很難用單詞或類標簽來明確表示。受到廣泛采用的提取“基”技術的啟發,“基”是時間序列的基本特征,這些基可以作為不同域之間的共享“字典”,每個域對時間序列編碼不同的語義特征。

語義“基”模塊

每個基代表時間序列數據樣本中可能存在的某些基本時間序列特征,如趨勢和季節性。假設不同的個體時間序列樣本共享相同的基集合,但反映集合的不同子集。因此,每個時間序列得到這些底層特征的唯一實現,類似于對所有基進行可變加權分配。基于這一假設,引入一組潛在陣列作為時間序列原型P∈RNp×d\mathcal{P}\in\mathbb{R}^{N_p\times d}PRNp?×d,用于表示跨域時間序列的共同知識。其中,每個原型向量P∈R1×d\mathcal{P}\in\mathbb{R}^{1\times d}PR1×d作為時間序列基的表示。在實踐中,時間序列原型P\mathcal{P}P是用隨機正交向量初始化,然后凍結。

“基”分配模塊

假設每個時間序列樣本對應于所有基的一個不同的分配,需要建立從時間序列樣本到分配的映射,以便明確地識別每個時間序列實例的重要原型以及區分域。本文提出為每個時間序列實例提取一個原型分配作為每個時間序列對每個原型的重要權重,然后將原型分配作為生成模型的條件。

具體來說,每個輸入序列x\pmb{x}x被映射到一個權重向量,其維度等于使用權重提取器?\phi?的原型數量,這是一個神經網絡。向量?(x)\phi(\pmb{x})?(x)定義了在PPP中每個向量的權重,其該權重被用來模擬跨域機制中的注意力權重,因此預測的噪聲僅以指定的原型為條件。因此,來自不同域的序列由共享的同一組時間序列原型的不同mmm加權組合來表示。為了保證原型分配的稀疏性,在進行原型分配時,所有的負權都被丟棄。形式上,原型賦值mmm用以下公式提取:

m=?(x0)?I?(x0)≤0?∞ m=\phi(x_0)-\pmb{I}_{\phi(x_0)\leq0}\cdot\infty m=?(x0?)?I?(x0?)0??
其中,I.≤0\pmb{I}_{.\leq0}I.0?為負元素的指示函數

域統一訓練

我們不是為每個特定數據集訓練單個模型,而是同時使用來自多個數據集的數據訓練一個模型,以生成不同的領域數據。在這里,我們將每個數據集視為一個單獨的域。雖然來自每個領域的數據僅代表可能數據分布的有限部分,但利用來自其他領域的數據可以幫助模型捕獲更多樣化的時間序列數據分布。

在條件去噪概率擴散模型中,通過空間注意將這些條件納入到噪聲預測網絡的中間層:
Q(i)=z(i?1)?WQ(i)K(i)=P?WK(i)V(i)=P?Wv(i)z(i)=FF(softmax(Q(i)K(i)Td)?V(i)) \pmb{Q}^{(i)}=z^{(i-1)}\cdot\pmb{W}^{(i)}_{Q}\\ \pmb{K}^{(i)}=\pmb{P}\cdot\pmb{W}^{(i)}_{K}\\ \pmb{V}^{(i)}=\pmb{P}\cdot\pmb{W}^{(i)}_{v}\\ z^{(i)} = FF(softmax(\frac{\pmb{Q}^{(i)}\pmb{K}^{(i)T}}{\sqrt{d}})\cdot\pmb{V}^{(i)}) Q(i)=z(i?1)?WQ(i)?K(i)=P?WK(i)?V(i)=P?Wv(i)?z(i)=FF(softmax(d?Q(i)K(i)T?)?V(i))
FF為前向傳播網絡,注意力輸出zfinalz^{final}zfinal是通過另一個前向傳播網絡獲取?^=FF(zfinal)\hat{\epsilon}=FF(z^{final})?^=FF(zfinal)

利用上述的條件去噪機制,使用??parameterization\epsilon-parameterization??parameterization去噪目標可以寫成并簡化為:
Lcond=E[∣∣???^∣∣2]=Ex0∈DT,?~N(0,I),n[∣∣???θ,P(xn,n,m∣∣2] L_{cond} = \mathbb{E}[||\pmb{\epsilon}-\hat{\pmb{\epsilon}}||^2]\\ =\mathbb{E}_{\pmb{x}_0\in D^T,\pmb{\epsilon}\sim\mathcal{N}(\pmb{0},\pmb{I}),n}[||\pmb{\epsilon}-\pmb{\epsilon}_\theta,\pmb{P}(x_n,n,\pmb{m}||^2] Lcond?=E[∣∣???^2]=Ex0?DT,?N(0,I),n?[∣∣???θ?,P(xn?,n,m2]
由于跨域的訓練樣本數量不平衡,本文采用重權采樣的方法,使每個域的樣本訓練的概率相等。設NiN_iNi?表示數據集i中樣本序列的個數,將該數據集每個樣本的采樣權值設為wi=1Ni×∣D∣w_i=\frac{1}{N_i\times|D|}wi?=Ni?×D1?,使得每個數據集的采樣序列的概率是平衡的。訓練算法的偽代碼見算法1。

在這里插入圖片描述

基于域提示的生成過程

為了在多個數據集上進行領域統一訓練后生成所選領域的時間序列樣本,我們首先在選擇的域中抽取一小部分隨機訓練樣本的領域特定原型賦值,然后將它們分組到表示所選域的域提示符分布中。設KKK表示從數據集iii中選擇的樣本個數,域提示符用mDi={m1i,...,mKi}\pmb{m}^{D_i}=\{\pmb{m}^i_1,...,\pmb{m}^i_K\}mDi?={m1i?,...,mKi?}?。通過構造條件輸入,該模型生成符合所選域的樣本,而不受所選樣本中顯示的一般時間模式的約束。當期望生成的樣本數量大于KKK時,我們在KKK個樣本中使用每次分配重復生成的策略,直到期望樣本數量滿足。采樣算法描述為算法2。

在這里插入圖片描述

未見領域的生成

由于原型提供了基于時間序列的表示,因此它們的表示能力不局限于訓練集中的域。因此,它們可以用來表示未見過的域或數據集。對于相對于訓練集的任何未知數據集或域DjD_jDj?,我們可以使用提取的“少量”樣本x1i,...,xKi\pmb{x}^i_1,...,\pmb{x}^i_Kx1i?,...,xKi?,構造域提示mDj={m1j,...,mKi}\pmb{m}^{D_j} = \{\pmb{m}^j_1,...,\pmb{m}^i_K\}mDj?={m1j?,...,mKi?},然后將它們作為條件輸送到模型中,以生成所需數據集的新樣本。

實驗

在這里插入圖片描述
在這里插入圖片描述

在這里插入圖片描述

本文來自互聯網用戶投稿,該文觀點僅代表作者本人,不代表本站立場。本站僅提供信息存儲空間服務,不擁有所有權,不承擔相關法律責任。
如若轉載,請注明出處:http://www.pswp.cn/diannao/97496.shtml
繁體地址,請注明出處:http://hk.pswp.cn/diannao/97496.shtml
英文地址,請注明出處:http://en.pswp.cn/diannao/97496.shtml

如若內容造成侵權/違法違規/事實不符,請聯系多彩編程網進行投訴反饋email:809451989@qq.com,一經查實,立即刪除!

相關文章

Ubuntu安裝NVIDIA顯卡驅動

清理舊驅動 sudo apt purge nvidia* libnvidia* sudo apt autoremovesudo find /etc -name *nvidia* -exec sudo rm -rf {} sudo rm -rf /usr/local/cuda*禁用 nouveau echo blacklist nouveau options nouveau modeset0 | sudo tee /etc/modprobe.d/blacklist-nouveau.conf…

硬件工程師成長之路:從入門到精通的技術旅程

文章目錄前言第一階段:基礎知識的積累理論知識儲備動手實踐第二階段:專業技能的提升PCB設計嵌入式系統開發第三階段:專業方向的選擇射頻(RF)工程電源設計高速數字電路FPGA/ASIC設計第四階段:工程管理與視野…

PyTorch 張量(Tensor)詳解:從基礎到實戰

1. 引言在深度學習和科學計算領域,張量(Tensor) 是最基礎的數據結構。PyTorch 作為當前最流行的深度學習框架之一,其核心計算單元就是張量。與 NumPy 的 ndarray 類似,PyTorch 張量支持高效的數值計算,但額…

CPTS---Hospital

端口掃描 nmap -A -p- -n -Pn -T4 10.10.11.241 22/tcp open ssh OpenSSH 9.0p1 Ubuntu 1ubuntu8.5 (Ubuntu Linux; protocol 2.0) | ssh-hostkey: | 256 e1:4b:4b:3a:6d:18:66:69:39:f7:aa:74:b3:16:0a:aa (ECDSA) |_ 256 96:c1:dc:d8:97:20:95:e7:01:5…

【貪心算法】day5

📝前言說明: 本專欄主要記錄本人的貪心算法學習以及LeetCode刷題記錄,按專題劃分每題主要記錄:(1)本人解法 本人屎山代碼;(2)優質解法 優質代碼;&#xff…

軟考中級【網絡工程師】第6版教材 第4章 無線通信網 (上)

考點分析: 重要程度:??? 選擇題考查1 ~ 3分,案例分析可能考查填空和簡答 高頻考點:802.11信道與頻段、CSMA/CA、無線網絡優化、無線認證、無線配置步驟 新教材變化:新增4G/5G、刪除無線城域網 本章將詳述蜂窩移動通信系統、無線局域網以及無線個人網的體系結構和實用技…

vscode+EIDE+Clangd環境導入keil C51以及MDK工程

我最近一直在使用vscodeclangd的編譯環境替代了vscode自帶的c/c插件。感覺clangd的環境更加優秀,能夠更好找到函數、全局變量等定義調用等。如果使用keil C51以及MDK環境開發51單片機或者STM32單片機就需要使用到了EIDE這個插件這個插件現在能夠自動生成compile_com…

FTP - 學習/實踐

1.應用場景 主要用于學習和使用FTP服務,同時研究其架構實現, 以及日常開發中的使用。 FTP(文件傳輸協議)是一種用于網絡文件傳輸的標準協議,基于客戶端-服務器模型運行,通過控制通道(端口21)和…

【瑞吉外賣】手機號驗證碼登錄(用QQ郵件發送代替)

目錄 介紹 一、獲取授權碼 二、前端代碼修改 三、后端代碼修改 ①pom依賴 ②yml配置 ③控制層 ④業務層 ⑤工具類 介紹 本文介紹了QQ郵箱驗證碼登錄功能的實現步驟: 獲取QQ郵箱授權碼并配置;前端修改登錄頁面,增加驗證碼發送接口調…

為什么要用 Markdown?以及如何使用它

在處理大量文檔時,尤其是在構建知識庫、進行文檔分析或訓練大語言模型(LLM)時,將各種格式的文件(如 PDF、Word、Excel、PPT、HTML 等)轉換為統一的 Markdown 格式,能夠顯著提高處理效率和兼容性…

訂餐后臺管理系統-day06菜品分類模塊

菜品分類顯示我們需要先實現分類操作,因為沒有菜品分類,我們無法準確知道當前菜品屬于哪個分類,在前端顯示時,需要根據分類顯示數據先顯示分類列表頁面準備路由manage_bp.route(/food/cat/list) def food_cat_list():# 默認頁面從…

More Effective C++ 條款20:協助完成返回值優化(Facilitate the Return Value Optimization)

More Effective C 條款20:協助完成返回值優化(Facilitate the Return Value Optimization)核心思想:返回值優化(RVO)是編譯器消除函數返回時臨時對象的一種重要優化技術。通過編寫適合RVO的代碼&#xff0c…

《HelloGitHub》第 113 期

興趣是最好的老師,HelloGitHub 讓你對開源感興趣!簡介HelloGitHub 分享 GitHub 上有趣、入門級的開源項目。github.com/521xueweihan/HelloGitHub這里有實戰項目、入門教程、黑科技、開源書籍、大廠開源項目等,涵蓋多種編程語言 Python、Java…

萌寶喂養日志-我用AI做喂養記錄小程序1-原型設計

準備工作 首先,注冊硅基流動賬號,并配置Trae開發工具。 ↓現在注冊有2000 萬 Tokens 的免費額度↓。 硅基流動統一登錄 具體可以看我這篇文章:Trae接入自有Deepseek模型,不再排隊等待-CSDN博客 實踐 設計原型圖 我想開發一…

工業產品營銷:概念、原理、流程與實踐指南

摘要 工業產品營銷是針對B2B市場的專業化推廣活動,旨在滿足企業客戶的生產和運營需求。本文詳細闡述了工業產品營銷的概念與特點,分析其核心原理,包括客戶需求驅動、價值傳遞和關系管理。營銷過程涵蓋市場調研、細分定位、策略制定、執行、轉化及售后服務六個步驟,并提供品…

【讀書筆記】《人體微生物的奧秘》

Follow Your Gut:人體微生物的奧秘 引言:從蚊子到微生物 夏天來臨,許多人又開始糾結為什么有些人特別招蚊子。有人說是血型問題,有人說是皮膚嫩度,還有人歸結于基因。但今天要分享的一本書,雖然標題看似討論…

【Matplotlib學習】駕馭畫布:Matplotlib 布局方式從入門到精通完全指南

目錄駕馭畫布:Matplotlib 布局方式從入門到精通完全指南一、 核心理念:理解 Figure 和 Axes二、 布局方式大全:從簡單到復雜類別一:自動創建與基礎單圖布局類別二:規律網格布局 - 主力軍類別三:復雜網格布局…

【C#】在一個任意旋轉的矩形(由四個頂點定義)內繪制一個內切橢圓

核心點:在一個任意旋轉的矩形(由四個頂點定義)內繪制一個內切橢圓 實現步驟 計算矩形中心:作為旋轉中心點 創建橢圓路徑:在未旋轉狀態下定義橢圓 應用旋轉變換:使用矩陣繞中心點旋轉路徑 繪制變換后的路…

洛谷 P2052 [NOI2011] 道路修建-普及/提高-

P2052 [NOI2011] 道路修建 題目描述 在 W 星球上有 nnn 個國家。為了各自國家的經濟發展,他們決定在各個國家之間建設雙向道路使得國家之間連通。但是每個國家的國王都很吝嗇,他們只愿意修建恰好 n?1n - 1n?1 條雙向道路。 每條道路的修建都要付出一定…

springboot連接不上redis,但是redis客戶端是能連接上的

除了常規排查,還有一個就是檢查配置文件格式。這個舊版本格式會導致讀取不到配置,spring:# 對應 RedisProperties 類redis:host: 127.0.0.1port: 6379 # password: 123456 # Redis 服務器密碼,默認為空。生產中,一定要設置 Red…