一、問題背景與數據概覽
在城市交通管理系統中,準確預測道路通行時間對于智能交通調度和路徑規劃具有重要意義。本文基于真實道路傳感器數據,構建了一個結合時間序列分解與機器學習模型的預測框架。數據源包含三個核心部分:
-
道路通行數據(new_gy_contest_traveltime_training_data_second.txt)
-
時間區間、路段ID、通行時間等字段
-
時間粒度為2分鐘級別
-
-
道路屬性數據(gy_contest_link_info.txt)
-
包含道路長度、寬度等靜態特征
-
-
拓撲關系數據(gy_contest_link_top.txt)
-
記錄路網的連接關系
-
二、數據預處理關鍵技術
2.1 異常值處理
采用分層分位數修剪方法,對每條道路每日數據:
def quantile_clip(group):
group[group < group.quantile(.05)] = group.quantile(.05)
group[group > group.quantile(.95)] = group.quantile(.95)
r