二手車交易價格預測
- 數據來源
- 數據特征探索
- 構建模型
- 參考
數據來源
天池 https://tianchi.aliyun.com/competition/entrance/231784/information
數據特征探索
目標特征工程做好之后,能同時進行 lightgbm catboost 神經網絡等模型,所以盡量都轉換為數值類特征。 如果僅僅是使用catboost模型,則直接保留類別類特征。
-
使用ydata_profiling 生成數據探索報告
雖然快速,但是個人還是偏向自己寫代碼逐步探索 是否有缺失 數據分布情況 等 -
逐步探索
加載數據
import pandas as pd
train_data =