說明:這是一個機器學習實戰項目(附帶數據+代碼+文檔+視頻講解),如需數據+代碼+文檔+視頻講解可以直接到文章最后獲取。
1.項目背景
動態因子模型(Dynamic Factor Models, DFM)是一種統計學和計量經濟學中用于處理大量相關時間序列數據的建模框架。在DFM中,模型試圖捕捉影響多個經濟變量或觀測值的一組不可觀測的、共同變動的核心驅動力,這些驅動力被稱為“因子”。這些因子通常代表了宏觀經濟活動的基本趨勢、周期性波動或其他系統性的影響因素。通過估算因子及其對各個變量的影響系數,DFM可以簡化高維數據并提取其中的主要信息。?
本項目通過DynamicFactor算法來構建時間序列分析動態因子模型。??????
2.數據獲取
本次建模數據來源于網絡(本項目撰寫人整理而成),數據項統計如下:
編號 | 變量名稱 | 描述 |
1 | DATE | 日期 |
2 | indprod | 工業生產指數 |
3 | income | 國民收入 |
4 | sales | 銷售額 |
5 | emp | 就業人數 |
數據詳情如下(部分展示):
3.數據預處理
3.1?用Pandas工具查看數據
使用Pandas工具的head()方法查看前五行數據:
關鍵代碼:
3.2 數據缺失查看
使用Pandas工具的info()方法查看數據信息:
??????
從上圖可以看到,總共有4個變量,數據中無缺失值,共432條數據。
關鍵代碼:?
3.3?數據描述性統計
通過Pandas工具的describe()方法來查看數據的平均值、標準差、最小值、分位數、最大值。?
關鍵代碼如下: ???
4.探索性數據分析
4.1?變量直方圖
用Matplotlib工具的hist()方法繪制直方圖:
從上圖可以看到,變量主要集中在45~100之間。 ?
4.2 相關性分析
從上圖中可以看到,數值越大相關性越強,正值是正相關、負值是負相關。
4.3?變量折線圖
4.4?數據標準化
5.構建動態因子模型
主要使用DynamicFactor算法,用于時間序列分析動態因子模型。???
5.1 構建模型
編號 | 模型名稱 | 參數 |
1 | 動態因子模型 | k_factors=1 |
2 | factor_order=2 | |
3 | error_order=2 |
5.2 模型摘要信息
6.模型評估
6.1?因子估計結果圖
對第一個因子進行繪圖:
6.2?決定系數圖
7.結論與展望
綜上所述,本文采用了DynamicFactor算法來構建時間序列分析動態因子模型,最終證明了我們提出的模型效果良好。此模型可用于日常產品的預測。
# 本次機器學習項目實戰所需的資料,項目資源如下:# 項目說明:# 獲取方式一:# 項目實戰合集導航:https://docs.qq.com/sheet/DTVd0Y2NNQUlWcmd6?tab=BB08J2# 獲取方式二:鏈接:https://pan.baidu.com/s/1XmzJBnZE1RTypc-CzXcTzw
提取碼:ehor