1、數據初步了解

2.數據清洗
2.1 重復值處理
直接刪除重復值。
2.2 缺失值處理
通過上面觀察數據發現sale_count,comment_count 存在缺失值,先觀察存在缺失值的行的基本情況
存在的缺失值很可能意味著售出的數量為0或者評論的數量為0,所以我們用0來填補缺失值。
2.3 數據挖掘尋找新的特征
給出各個關鍵詞的分類類別
由title新生成兩列類別
3.數據分析及可視化
接下來考慮各個類別的銷售情況
接下來用seaborn包給出每個店鋪各個大類以及各個小類的銷量銷售額
關于性別
對評論數進行分析