一、項目背景:雙 11 美妝數據的價值所在
每年的 “雙 11” 購物節都是電商行業的盛宴,而美妝品類作為消費熱門領域,蘊含著豐富的用戶行為與市場趨勢信息。該項目聚焦雙 11 期間的美妝電商數據,旨在通過數據分析揭示以下核心問題:
- 美妝品類的熱銷商品特征是什么?
- 不同品牌、不同品類的銷售表現有何差異?
- 如何從海量商品標題中提取關鍵信息,輔助產品定位與營銷策略制定?
這些問題的答案不僅能為商家提供運營參考,也能幫助消費者更清晰地了解市場動態。
核心分析工具與技術亮點
在數據分析過程中,項目巧妙運用了中文自然語言處理與數據清洗技術,其中最關鍵的工具便是jieba 分詞庫—— 中文文本處理的 “利器”。
二、數據初步了解
三、數據清洗
1.?重復值處理

2.?缺失值處理

3. 數據挖掘尋找新的特征
給出各個關鍵詞的分類類別
對是否是男性專用進行分析并新增一列
對每個產品總銷量新增銷售額這一列

四、數據分析及可視化
通過圖表不難看出以下幾點:
--悅詩風吟的商品數量遙遙領先,然而其商品銷量只排在第三位,總銷售額只排在第五位。
--SKII,玉蘭油,植村秀商品數量大概都在500-1500的范圍,而銷量為0。
--相宜本草商品數量也只屬于中游,但其銷量銷售額均排在第一位,由于其銷量是第二名的大約兩倍,而銷售額遠不到兩倍,所以銷售額/銷量,也就是每一單的均價也是一個值得研究的新指標。
通過加入平均每單單價之后,觀察銷售額較高的幾個品牌相宜本草,歐萊雅,佰草集,悅詩風吟,雅詩蘭黛。其中相宜本草,悅詩風吟,歐萊雅都是平均單價200元以下的,佰草集為200-300元區間,雅詩蘭黛為大于500元區間。是否能夠判斷價格親民的品牌的銷售額會相對來說更高?下面根據這里的數據先把平均單價分為幾個區間,其中0-100元記為A類,100-200元記為B類,200-300元記為C類,300元及以上記為D類。
各個類別的銷售情況
用seaborn包給出每個店鋪各個大類以及各個小類的銷量銷售額
電商雙11美妝數據分析 - Heywhale.com