F10.7 Daily Forecast Using LSTM Combined With VMD Method
??F10.7?? solar radiation flux is a well-known parameter that is closely linked to ??solar activity??, serving as a key index for measuring the level of solar activity. In this study, the ??Variational Mode Decomposition (VMD)?? and ??Long Short-term Memory (LSTM)?? network are combined to construct a ??VMD-LSTM model?? for predicting ??F10.7?? values. The F10.7 sequence is decomposed into several ??intrinsic mode functions (IMF)?? by ??VMD??, then the ??LSTM neural network?? is utilized to forecast each ??IMF??. All ??IMF prediction results?? are aggregated to obtain the ??final F10.7 value??. The data sets from ??1957 to 2008?? are used for ??training?? and the data sets from ??2009 to 2019?? are used for ??testing??. The results show that the ??VMD-LSTM model?? achieves an ??annual average root mean square error?? of only ??4.47 sfu?? and an ??annual average correlation coefficient (R)?? of ??0.99?? during ??solar cycle 24??, which is significantly better than the accuracy of the ??LSTM model?? (W. Zhang et al., 2022), the ??AR model?? (Du, 2020), and the ??BP model?? (Xiao et al., 2017). The ??VMD-LSTM model?? exhibits ??strong predictive capability?? for the ??F10.7 index?? during solar cycle 24.
F10.7 太陽輻射通量??是一個眾所周知的參數,與太陽活動密切相關,是衡量太陽活動水平的關鍵指標。在本研究中,??變分模態分解 (VMD)?? 和 ??長短期記憶 (LSTM)?? 網絡被結合起來,構建了一個 ??VMD-LSTM 模型?? 用于預測 F10.7 值。F10.7 序列首先通過 VMD 分解為??多個本征模態函數 (IMF)??,然后利用 LSTM 神經網絡對每個 IMF 進行預測。將所有 IMF 的預測結果??聚合??,即可得到最終的 F10.7 預測值。??1957 年至 2008 年的數據集用于訓練,2009 年至 2019 年的數據集用于測試??。結果表明,??在太陽活動第 24 周期間,VMD-LSTM 模型的年平均均方根誤差 (RMSE) 僅為 4.47 sfu,年平均相關系數 (R) 達到 0.99??。該精度??顯著優于?? LSTM 模型 (W. Zhang et al., 2022)、AR 模型 (Du, 2020) 和 BP 模型 (Xiao et al., 2017) 的精度。??VMD-LSTM 模型在太陽活動第 24 周期間對 F10.7 指數表現出強大的預測能力。?
Key Points
The Variational Mode Decomposition (VMD) algorithm can effectively address nonlinear problems of?F10.7?sequence
The VMD algorithm can significantly improve the prediction accuracy of single Long Short-term Memory (LSTM) model
In solar cycle 24, the VMD-LSTM model has stronger predictive capability than other classical models
1 Introduction
F10.7 指數??(也稱為渥太華指數或科溫頓指數)測量的是波長為 10.7 厘米(頻率為 2800 MHz)的太陽輻射通量。它被認為是表征太陽活動水平的最佳指標之一,反映了日冕上所有源區的總射電輻射通量值,其單位為太陽通量單位(??sfu??)(1 sfu = 10?22 W·m?2·Hz?1)。在大多數情況下,F10.7 指數的值范圍在 50 到 300 之間 (Svalgaard, 2016)。
F10.7 指數在確定和預測??空間天氣??方面具有非常重要的價值。它已廣泛應用于眾多??高層大氣模型??(例如,Hedin, 1988; Picone et al., 2002)和??電離層模型??(例如,Adebiyi et al., 2016; Benoit & Petry, 2021)中。其長期數據記錄為六個太陽周期提供了氣候信息。此外,由于 F10.7 可以在任何天氣條件下從地面進行??準確可靠的測量??,因此它是一個非常可靠的數據集,幾乎沒有數據缺失或校準問題。
目前,許多研究采用了不同的方法來預測 F10.7 指數。Henney 等人 (2012) 利用??通量輸運模型??生成的全球太陽磁場來預測 F10.7 指數,提前一天的預測斯皮爾曼相關系數達到 ??0.97??。Liu 等人 (2018) 結合了??兩個太陽表面通量輸運模型??(Worden & Harvey, 2000; Yeates et al., 2007)來估算太陽磁場并預測 F10.7 指數,其提前 3 天預測的斯皮爾曼相關系數高于 ??0.95??。Lei 等人 (2019) 基于太陽極紫外圖像中 F10.7 觀測值與 ??PSR??(該指數由太陽 EUV 圖像的強度值定義)之間的關系建立了一個??經驗預測模型??。與 2012 年至 2013 年期間 54 階自回歸模型的預測結果相比,該經驗模型的誤差降低了 ??12.54%??。
隨著??機器學習和人工智能??的發展,各種機器學習技術已被用于預測 F10.7 指數的??非線性和周期性變化模式??。例如,Chatterjee (2001) 使用??多層前饋神經網絡??,以過去 11 天的歷史值作為模型輸入,提前一天預測 F10.7 指數,獲得了約 ??0.93?? 的相關系數。C. Huang 等人 (2009) 應用??支持向量回歸(Support Vector Regression)?? 預測了 2002 年至 2006 年的 F10.7 指數值,其平均絕對百分比誤差在 ??2.71% 到 5.56%?? 之間。Warren 等人 (2017) 提出了一種 F10.7 的??線性預測模型??。Wang 等人 (2018) 建立了一個結合??相關性??和??不同滯后項??(注:原文 "different parties" 結合上下文應為 "different lags" 或類似含義)的線性多步預測模型,以增強 F10.7 指數的多步預測性能。這些機器學習模型可以在特定情況下解決一些問題,但它們中的大多數通常只在??淺層進行訓練??,無法充分提取數據中的隱藏信息,尤其是??復雜的時間周期性變化??。
然而,深度學習方法能夠通過深入且廣泛的訓練來充分優化損失函數,從而學習時間數據的周期性變化 (Kingma & Ba, 2014)。?? Xiao 等人 (2017) 采用??反向傳播神經網絡 (Back Propagation Neural Network)?? 預測 F10.7 指數,與其他模型相比,該模型表現出??更好的短期預測精度??。Luo 等人 (2022) 將??卷積神經網絡 (Convolutional Neural Networks)?? 與??長短期記憶網絡 (LSTM)?? 相結合,預測了 2003 年至 2014 年期間未來 27 天的 F10.7 值。Gao 等人 (2022) 將??太陽黑子數??整合到 LSTM 中,基于 54 天的太陽輻射通量指數,建立了一種預測未來 7 天 F10.7 的短期預測方法,其??均方根誤差 (RMSE)?? 比美國空間天氣預報中心 (SWPC) 的模型??低 11%??。W. Zhang 等人 (2022) 使用 LSTM 模型對 F10.7 指數進行短期預測,并驗證了 ??LSTM 模型優于普通神經網絡模型??。
??與此同時,VMD 算法已在許多工作中得到廣泛應用。?? Niu 等人 (2018) 建立了 ??VMD-ARIMA-HGWO-SVR 模型??以提高集裝箱吞吐量預測的穩定性和準確性。誤差分析和模型比較結果表明,??VMD 比 CEEMD 和 WD 等其他分解方法更有效??。Abdoos (2016) 將 ??VMD 與極限學習機 (Extreme Learning Machines)?? 結合用于短期風速預測,與先前報道的方法相比,該方法在??精確預測和節省計算時間方面具有優勢??。Y. Zhang 等人 (2019) 提出了一種基于 ??VMD-小波變換 (VMD-WT)?? 和??主成分分析-反向傳播篩選-徑向基函數神經網絡 (PCA-BP-RBF)?? 的混合模型用于短期風速預測。實驗結果表明,??VMD-WT 能更好地解決模態混疊和端點效應問題??,使得本征模態函數 (IMF) 的??周期性特征更加明顯??,從而??提高了預測性能??。
??目前,F10.7 指數的預測模型具有良好的預測性能。然而,以往的模型很少考慮預測序列本身的非線性問題,預測精度仍有提升空間。?? 為了提高 F10.7 指數的預測精度,本研究引入 ??VMD 算法??對 F10.7 指數進行分解以重構預測。??VMD 算法能有效解決時間序列數據的周期性和強非線性問題。?? 同時,??LSTM 神經網絡在低復雜度和低非線性的時間序列上表現出良好的預測能力。?? 因此,??將 VMD 方法與 LSTM 模型相結合??,構建了一個用于 F10.7 指數的 ??VMD-LSTM 預測模型??,以期??進一步提高 F10.7 指數的預測精度??。
2. Method
2.1 VMD (Variational Mode Decomposition)
變分模態分解 (VMD)?? 方法最初由 Dragomiretskiy 和 Zosso (2014) 提出。它能夠??平滑非平穩信號??并將其分解以獲得??不同本征模態函數 (IMF)?? 的分量。使用這種方法,可以將??非平穩和非線性信號分解??成具有??不同時間尺度的平穩信號??。??初始的 IMF 分量代表原始信號的高頻部分??。隨著分解層級的增加,??對應的 IMF 頻率變小,周期變大?? (Sain & Stephan, 1997)。
與??經驗模態分解算法 (EMD)?? (N. Huang et al., 1998) 的??遞歸分解模式??不同,??VMD 算法將信號分解轉化為變分分解模式??。通過??多個自適應 Wiener 濾波器組??,分解出的分量可以被??自適應地分割??。這??非常有效地克服了分解中出現的模式混淆現象??,即同一分量出現在不同頻帶,或不同分量出現在同一頻帶。
VMD 的具體實現步驟如下:
- 對信號進行 ??Hilbert 變換??后,分析得到的??解析信號??,并計算其??單邊頻譜??。
- 然后將其乘以??中心帶調制??,將其移至相應的??基帶??。
- 計算??解調信號梯度的范數??,并??估計每個模態的信號帶寬??。
- 約束變分問題表述如下:
為了將??約束變分問題轉化為無約束變分問題??,引入一個??拉格朗日乘子算子 λ?? 和一個??二次懲罰因子 α??。在存在高斯噪聲的情況下,??α 確保信號重建的準確性??并??保持約束的嚴格性??,以獲得約束變分問題的??最優解??。表達式如下:
其中:
- ??
u_k
?代表每個模態函數??, - ??
ω_k
?是每個模態的中心頻率??, k = 1, 2, …, N
。- ??
λ
?是拉格朗日乘子??, - ??
δ
?是 Dirac 分布(狄拉克函數)??, - ??
f(t)
?是解析信號??。
然后,使用??乘法算子交替方向法 (multiplicative alternating direction algorithm)?? 來解決上述問題,并??不斷更新分量及其中心頻率??以獲得最優解。
??總的來說,VMD 是一種將待分解信號轉換為非遞歸和變分模式的分解方法??,能夠很好地分解噪聲信號。??VMD 的整體框架是一個變分問題??。它??假設每個模態具有有限帶寬且具有不同的中心頻率??。在噪聲信號被分解后,通過使用乘法算子的交替方向法不斷更新每個模態及其對應的中心頻率,即可獲得每個變分模態分量及其中心頻率。
2.2?GA (Genetic Algorithm)
在信號處理中使用??變分模態分解(VMD)??時,分解結果??顯著受分解模態數(K)和懲罰參數(α)??的影響。如果??K值過高??,可能會產生??虛假分量??;而如果??K值過小??,則可能??丟失相關分量??。另一方面,??α值??影響分解后的??本征模態函數(IMF)的帶寬??——??較高的α值導致較窄的帶寬??,而??較低的α值導致較寬的帶寬??。因此,??優化參數K和α至關重要??。
為了確定VMD中的??最優參數K和α??,本研究選擇了一種名為??遺傳算法(GA)??的流行方法進行VMD參數優化。與其他優化算法(如蟻群算法和粒子群算法)相比,GA因其??普適性、搜索效率和強大的全局優化能力??而被選用(Chen et al., 2023)。GA是一種基于自然選擇和遺傳原理的??非線性全局優化算法??。使用GA優化VMD參數的過程涉及六個主要步驟:??編碼、種群初始化、適應度評估、選擇、交叉和變異??。其中,??適應度評估步驟尤為關鍵??,它指導優化過程,需要定義一個??合適的適應度函數??來評估個體接近最優值的程度。
在本研究中,采用??GA優化VMD的模態數K和懲罰因子α??。選擇的適應度函數是??包絡熵(Ep)??,它表征了原始信號的??稀疏特性??。??包絡熵值越高??,表明IMF中??噪聲越多,特征信息越少??;反之亦然。信號x(i) (i = 1,2, …, N)
的包絡熵(Ep)
可以用公式(9)表示。公式中的a(i)
是通過對VMD分解的第k
個模態分量進行??希爾伯特(Hilbert)解調??得到的??包絡信號??,ε(i)
是通過計算a(i)
的歸一化得到的??概率分布序列??,N
是??采樣點數??。概率分布序列ε(i)
的熵值即為包絡熵Ep
。
在??GA優化的VMD??背景下,參數設置定義如下:??K的范圍為[2, 10]??,??α的范圍為[0, 5000]??,??迭代次數設為50??,??種群大小為30??,??交叉概率為0.9??,??變異概率為0.1??。?本文首先使用??1957年至2008年的訓練數據??優化VMD的超參數,然后將此優化過程獲得的最佳VMD超參數應用于分解??1957年至2008年的訓練數據??和??2009年至2019年的測試數據??。這樣做是為了確保模型僅基于訓練集內的信息構建,并計算了個體對應的包絡熵。使用適當的收斂因子進行迭代更新,直到滿足終止條件,從而確定??最優的VMD參數??。
2.3 VMD-LSTM
作為增強型循環神經網絡,LSTM 網絡不僅能有效解決傳統 RNN 面臨的長距離依賴問題,還能解決神經網絡中常見的梯度爆炸或消失問題(Graves, 2012; Tan et al., 2018)。它在處理序列數據方面非常有效。它可以通過分解來降低序列的非線性和復雜性。??因此,???本文將 LSTM 神經網絡模型與 VMD 算法相結合,以提前一天預測 F10.7 指數。這種組合方法被稱為 VMD-LSTM 模型。??
??1. 分別應用 VMD 算法分解了 1957 年至 2008 年的訓練數據和 2009 年至 2019 年的測試數據,得到了三個分量和一個殘差。??
??2. 這些分解后的分量使用一個具有兩個隱藏層、每層 50 個神經元的堆疊式 LSTM 模型進行獨立訓練。在完成 LSTM 模型的訓練后,?可以獲得每個分量的預測結果。??
??3. 最后,通過將每個分量提前一天的預測結果累加起來,就能得到提前一天的 F10.7 預測值。?
Figure 3
Prediction process of combined Variational Mode Decomposition algorithm-Long Short Term Memory neural network model for?F10.7?index.
VMD-LSTM 是一個滾動預測模型,其時間步長為 7 天。這意味著提前 1 天的 F10.7 值是通過前 7 天的歷史值來預測的。??數據采用??最小-最大歸一化 (Min-Max Normalization)?? 方法進行處理。該方法將數據縮放到一個指定的范圍內,??通常為 0 到 1 之間??。最小-最大歸一化的公式為:
此處,X?是 F10.7 數據,Xnormalized??是歸一化后的值,Xmin??是數據集中的最小值,Xmax??是數據集中的最大值。
??預測模型由一個雙層 LSTM 網絡構成。??它使用 ??Adam 優化器??,??批大小 (batch size) 設置為 32??。同時,??學習率 (learning rate) 設置為 0.001??,??訓練輪數 (epochs) 設置為 100??。
在本研究中,選擇了兩個評估指標來衡量模型的性能,即??相關系數 (R)?? 和 ??均方根誤差 (RMSE)??。
其中,N?是樣本數量,Xi??是預測值,Yi??是觀測值,Xˉ?是?Xi??的平均值,Yˉ?是?Yi??的平均值。
- ??R?代表觀測值與預測值之間的相關性。該值越接近 1,表示預測值與觀測值匹配得越好。??
- ??RMSE?反映了預測值與觀測值之間的偏差。該值越小,表示預測模型越好。?
3 Results
3.1 Analysis of Decomposition Results
GA-VMD 方法要求首先使用遺傳算法 (GA) 找到與信號對應的最優參數組合。?? 優化過程中適應度隨迭代次數的變化如圖 4 所示。如圖 4 所示,??最佳適應度在第 25 次迭代時達到??。通過算法的搜索過程,??找到了最優參數組合 (K, α) = (3, 2626)??。在確定了最優參數組合后,??根據最優參數使用 VMD 對信號進行分解,以達到最佳分解效果??。圖 5 展示了 VMD 分解后得到的本征模態函數 (IMF) 分量,按從低頻到高頻排列。
Figure 4
Genetic algorithm for Variational Mode Decomposition parameter optimization results.
Figure 5
Decomposition results of the Variational Mode Decomposition method for the?F10.7?index.
對于 VMD 后得到的序列,??利用樣本熵 (Sample Entropy) 來評估序列的復雜度,并利用總諧波失真 (Total Harmonic Distortion, THD) 來評估其非線性程度??。失真的程度取決于非線性水平 (N. Huang et al., 1998)。樣本熵由 Richman 和 Moorman (2000) 提出,是分析非平穩時間序列的綜合指標。其核心原理涉及量化序列內生成新子序列的可能性。??時間序列的復雜度通過評估信號內產生新模式的概率來衡量,產生新模式的概率越高,表明序列的復雜度越高??。諧波失真是指當音頻信號被放大時,由于系統并非完全線性,輸出信號中出現了輸入信號中不存在的額外諧波分量。??本文通過計算新增加的總諧波分量的均方根值占原始信號均方根值的百分比來量化 THD??。
表 1 給出了 F10.7 數據集的樣本熵和 THD 結果。從表 1 可以觀察到,??F10.7 原始信號的樣本熵 (2.33) 高于其 IMF 分量的樣本熵??。這表明原始信號相對更復雜。??IMF1、IMF2 和 IMF3 的樣本熵依次增加,殘差 (RES) 的樣本熵為 1.50??。同時,??IMF3 的 THD 最低 (1.09),其次是 IMF2 (2.87)、RES (6.97) 和 IMF1 (28.34),而 F10.7 原始信號的 THD 最高 (28.37)??。??THD 值越高,表明信號內非線性因素的影響越顯著??。總體而言,??F10.7 信號顯示出較高的樣本熵,表明其復雜度較高且可能存在新的模式??。另一方面,??高 THD 表明信號內存在顯著的非線性影響,尤其是在 F10.7 原始信號和 IMF1 分量中??。
Table 1.?Gives the Sample Entropy and Total Harmonic Distortion Obtained for the?F10.7?Data Set
F10.7 | IMF1 | IMF2 | IMF3 | RES | |
---|---|---|---|---|---|
Sample Entropy | 2.33 | 0.52 | 0.84 | 0.95 | 1.50 |
THD | 28.37 | 28.34 | 2.87 | 1.09 | 6.97 |
3.2 Prediction Results
本研究評估了 LSTM 和 VMD-LSTM 模型在太陽活動低年和高年預測 F10.7 指數方面的性能。?? 選取 2009 年和 2014 年進行分析。結果表明,??VMD-LSTM 模型在 RMSE 和 R 值方面均優于 LSTM 模型??。對于 2009 年,LSTM 模型的 RMSE 和 R 值分別為 1.13 sfu 和 0.93,而 VMD-LSTM 模型的 RMSE 和 R 值分別為 ??0.89 sfu 和 0.95??。同樣,對于 2014 年,LSTM 模型的 RMSE 和 R 值分別為 9.89 sfu 和 0.94,而 VMD-LSTM 模型的 RMSE 和 R 值分別為 ??8.20 sfu 和 0.95??。圖 6 和圖 7 顯示,??VMD-LSTM 模型的預測偏差低于 LSTM 模型,并且與觀測值相對一致??。然而,隨著太陽活動增強,兩種模型的預測值之間的偏差也會增大。在大多數情況下,??VMD-LSTM 模型的預測偏差低于 LSTM 模型??。總之,VMD-LSTM 模型的預測值比 LSTM 模型更接近觀測值。LSTM 模型通常以端到端的方式進行訓練,將時間序列的所有信息映射到一個向量中。該向量整合了不同維度的信息,使其容易過擬合并對序列中的噪聲更敏感。經過 VMD 分解后,F10..7 序列被分解為多個子序列。與原始序列相比,每個子序列包含的不同維度信息更少,從而降低了序列的非線性和復雜性。同時,這種分解方法有效解決了 EMD 方法中常見的端點效應和模態分量混疊等問題。因此,VMD-LSTM 模型能夠取得更好的預測結果。
Figure 6
The comparison of the Variational Mode Decomposition algorithm-Long Short Term Memory neural network prediction values with the observations in 2009 and 2014.
Figure 7
The difference obtained by subtracting the predicted values of Variational Mode Decomposition algorithm-Long Short Term Memory neural network (LSTM) from the observed values, and the difference obtained by subtracting the predicted values of LSTM from the observed values in 2009 and 2014.
表 2 展示了 LSTM 模型和 VMD-LSTM 模型對未來一天 F10.7 指數的預測結果。VMD-LSTM 模型的 RMSE 低于 LSTM 模型??,在第 24 太陽活動周期間,VMD-LSTM 的平均 RMSE 為 ??4.47 sfu??,而 LSTM 的平均 RMSE 為 ??5.71 sfu??,這表明 ??VMD-LSTM 的 RMSE 降低了 21.72%??。此外,??在相關系數方面,VMD-LSTM 模型也表現出優于 LSTM 模型的性能??,在整個太陽活動周內的相關系數達到 ??0.99??,??證明了 VMD-LSTM 模型在預測 F10.7 指數方面的有效性??。
Table 2.?Prediction Results of Long Short-Term Memory and Variational Mode Decomposition Algorithm-Long Short Term Memory Neural Network for the?F10.7?Index in Solar Cycle 24
Year RMSE R LSTM VMD-LSTM Error reduction (%) LSTM VMD-LSTM 2009 1.13 0.89 21.24 0.93 0.95 2010 2.53 1.72 32.02 0.91 0.94 2011 5.53 4.56 17.54 0.97 0.98 2012 7.13 5.40 24.26 0.93 0.96 2013 6.17 4.66 24.47 0.97 0.97 2014 9.89 8.20 17.09 0.94 0.95 2015 9.57 7.32 23.51 0.88 0.93 2016 3.76 2.60 30.85 0.96 0.97 2017 5.57 3.85 30.88 0.89 0.94 2018 1.21 0.89 26.45 0.93 0.96 2019 1.21 0.90 25.62 0.91 0.95 All 5.71 4.47 21.72 0.98 0.99
模型在高太陽活動期間預測 F10.7 指數的性能如何呢?
?? 這里,選取了 2014 年 6 月 24 日至 8 月 2 日期間的 F10.7 指數案例進行分析。圖 8 顯示了在此期間兩種模型(LSTM, VMD-LSTM)的預測結果與觀測結果的對比。如圖 6 所示,??VMD-LSTM 模型的預測值在大多數點上更接近 F10.7 指數的觀測值??。這表明 VMD 可以有效提高預測能力,并且 ??VMD-LSTM 模型能夠基于訓練集樣本信息的分析,準確預測 F10.7 指數的后續值??。
Figure 8
The comparison of the Variational Mode Decomposition algorithm-Long Short Term Memory Neural Network model prediction with the observations from 24 June to 2 August 2014.
3.3 Compared Results
為了更好地評估 VMD-LSTM 模型的預測性能,本文將其結果與 LSTM 模型 (W. Zhang et al., 2022)、BP 模型 (Xiao et al., 2017) 和 AR 模型 (Du, 2020) 的結果進行了比較。BP 模型使用輸出誤差來估計輸出層中直接前導層的誤差,然后用該誤差估計前一層的誤差。重復此過程以獲得所有其他層的誤差估計。AR 模型利用預測目標的歷史時間序列與其在不同時期的值之間的依賴關系建立回歸方程進行預測。LSTM 模型通過引入記憶單元和三個門控機制(遺忘門、輸入門和輸出門)來解決長期依賴問題。記憶單元負責存儲序列信息,三個門控機制控制記憶單元的讀取、寫入和保留程度。這三種模型通常用于處理時間序列。與前兩種神經網絡模型不同,AR 模型是一種專為處理時間序列數據而設計的統計方法。結果如表 3 所示,??VMD-LSTM 模型在大多數年份的 RMSE 值低于 LSTM、AR 和 BP 模型??,表明其在預測 F10.7 指數方面具有強大的性能。然而,在某些年份,VMD-LSTM 模型的性能可能略遜于其他模型,這可能是由于數據的特定特征所致。需要進一步的研究和分析來探討這一點。
Table 3.?Comparison of Root Mean Square Error Between the Variational Mode Decomposition Algorithm-Long Short Term Memory Neural Network and Other Models (1-Day Prediction)
Year VMD-LSTM LSTM BP AR 2009 0.89 1.20 1.07 – 2010 1.72 – – – 2011 4.56 5.52 – 5.29 2012 5.40 – – – 2013 4.66 – – – 2014 8.20 9.40 – 7.92 2015 7.32 – – – 2016 2.60 3.23 – 2.99 2017 3.85 – – – 2018 0.89 – – – 2019 0.90 1.36 – 1.27
此外,本文應用相同的方法對 F10.7 指數進行了 ??7 天預測??,結果總結在表 4 中。該表清楚地表明,??VMD-LSTM 模型生成的 7 天預測結果優于 SWPC 以及 Gao 等人 (2022) 最近開發的具有多輸入的 LSTM 模型(M-LSTM)??。在 Gao 等人的研究中,LSTM 方法基于其線性關系用于 F10.7 的 7 天預測。在 2009 年至 2019 年期間,??VMD-LSTM 模型的 RMSE 始終顯著低于 M-LSTM 和 SWPC 模型??,這證實了其??為 F10.7 指數提供高精度 7 天預測的能力??。值得注意的是,在 2014 年,VMD-LSTM 模型的 RMSE 與 M-LSTM 模型非常接近,但 ??VMD-LSTM 模型仍保持輕微優勢??,突顯了其在 7 天預測中的競爭優勢。總之,??VMD-LSTM 模型在預測 F10.7 指數的 7 天預報方面表現出卓越的性能??,特別是與其他模型相比時。這一進展對太陽活動和空間天氣預報的準確預測具有重要意義。
Table 4.?Comparison of Root Mean Square Error Between the Variational Mode Decomposition Algorithm-Long Short Term Memory Neural Network and Other Models (7-Day Prediction)
Year RMSE VMD-LSTM M-LSTM SWPC 2009 1.82 2.40 2.37 2010 4.51 5.28 5.35 2011 7.63 15.82 17.57 2012 7.97 16.60 17.71 2013 9.95 18.22 19.86 2014 11.75 23.31 – 2015 9.71 19.94 – 2016 4.46 8.95 – 2017 5.24 11.46 – 2018 1.29 2.89 – 2019 1.25 2.62 –
4 Summary
本研究提出了一種??VMD-LSTM模型??用于??F10.7?的短期預測??,該模型將??VMD算法??與??LSTM網絡??相結合。首先,應用VMD算法將F10.7?數據分解為多個??子分量??,然后使用LSTM網絡對每個子分量進行預測。最后,將各子分量的預測值??求和??得到最終的F10.7?指數預測值。本文將VMD-LSTM模型的性能與LSTM、AR和BP模型進行了比較。結果表明,??VMD-LSTM模型在預測精度上優于LSTM、AR和BP模型??。具體而言,在第24太陽活動周期間,VMD-LSTM模型每年的RMSE和R值均優于同年的LSTM模型。在整個太陽活動周期間,LSTM模型的RMSE和R值分別為5.71和0.98,而VMD-LSTM模型的RMSE和R值分別為??4.47??和??0.99??,??RMSE降低了21.72%??。VMD-LSTM模型的高精度歸因于VMD算法在??有效降低F10.7?數據序列的非線性和復雜性??方面的作用,這有助于LSTM網絡捕捉序列變化的內部規律。
??遺憾的是,提出的模型目前無法實現實時預測??。在未來,無法對未知數據進行分解以實現實時預測過程。因此,有必要使用??滾動預測方法 (rolling forecast methods)??:每次預測一個數據點,然后將該數據點添加到已知的歷史數據中。接著使用新的歷史數據預測下一個數據點,并依此??重復該過程??。同時,也需要??持續更新預測模型中的參數??以逐步適應新的輸入。此外,可以參考Stevenson等人的工作(Stevenson et al., 2022),將VMD-LSTM模型用于??中期預報。