1.背景介紹
數據集來自Kaggle網站上公開的Hotel booking demand項目
該數據集包含了一家城市酒店和一家度假酒店的預訂信息,包括預訂時間、入住時間、成人、兒童或嬰兒數量、可用停車位數量等信息。
數據集容量約為12萬×32
本次數據分析主要包含如下內容:
- 總覽數據,完成對數據的數據預處理
- 利用數據集對酒店運營狀況/市場情況/客戶畫像進行數據分析
- 根據數據集建立預測模型,預測客戶是否會取消預訂
2.數據概覽以及數據預處理
2.1 數據概覽
首先導入需要的庫,并且設置了后面的代碼塊不需要再重復導入庫
import numpy as np
import pandas as pd
import matplotlib.pyplot as plt
import seaborn as sns
import p