1 背景與動機
在高頻、多尺度且非平穩的時序場景(如新能源產能預測、金融行情、用戶行為流分析)中,單一網絡分支 往往難以同時捕獲
-
長程依賴(Transformer 長距離建模優勢)
-
局部細粒信息(循環網絡對短期波動敏感)
將 Transformer 與 雙向 GRU(BiGRU) 以并行支路組合,并引入
-
Global Attention —— 強化對全局趨勢的重要性重加權
-
Cross Attention —— 顯式對齊兩條特征序列、互補信息
可在不顯著增加推理時延的前提下,提高復雜時序任務的精度與魯棒性。
2 模型整體框架
組件 | 作用 | 關鍵超參 |
---|---|---|
Tr |