1.接下來用seaborn包給出每個店鋪各個大類以及各個小類的銷量銷售額
先觀察銷量,各店小類中銷量最高的是相宜本草的補水類商品以及妮維雅的清潔類商品,這兩類銷量很接近。而銷售額上,相宜本草的補水類商品比妮維雅的清潔類商品要高得多,這顯然是商品平均單價不同所導致的。由于不同的類別使用量也不同,銷量自然也會有所區別,所以相對于比較每個店鋪的不同類別的銷售量,比較每個不同類別的各店鋪的銷售量應該更有價值
事實上可以看出相宜本草在面霜、乳液、精華、補水、化妝水、眼部護理以及防曬類中都是銷量最高的。美寶蓮在口紅、眼部彩妝也都是賣的最好的。而妮維雅在清潔類中一騎絕塵。在這里我們就可以用上之前提取出的新特征-是否男性專用。因為清潔類顯然是有男性市場的。
2.關于性別
顯然,在沒有區分性別的情況下,由于清潔類是男性女性通用,所以占得銷量最高是理所應當的。而非男士專用中,女性消費者較多,所以補水類一躍成為最高銷量。盡管就整個銷量而言,男士專用的占比不高,但是這也說明男性市場是一個值得發展急需拓寬的點。如果增加更多關于男性護膚品的推廣,有可能會吸引更多的男性消費者從而增加銷量。所以進一步分析,各個店鋪的男性專用商品的銷量
男士專用護膚品的銷售量前三名分別是:妮維雅,歐萊雅,相宜本草。所有男士商品主要銷量來自于護膚品。對于其他類這里暫時不進行分析,因為其產生大概率是basic_data也就是我們的分類集不完善導致的。觀察一下男用化妝品的數據,如下:
可以看出基本都是男用唇膏。因為將唇膏歸于了口紅類,而口紅類歸于了化妝品類。接下來看看各個店鋪的男士專用商品的總銷量銷售額是怎樣的
不難看出,歐萊雅和妮維雅占據了男性專用商品的絕大部分市場,不管是銷量還是銷售額。這一點在不區分是否男性專用的商品中是有所出入的。歐萊雅在無論在哪個方面都表現的很好,雖然銷量在非男士專用商品里屬于一般水平,但銷售額都名列前茅。而妮維雅在非男士專用商品里的銷售情況就很差了,這說明妮維雅主打的就是男士專用商品。而相宜本草在非男士專用商品的表現還是遙遙領先,其在男士專用商品中也排在第三位,雖然和前兩名都有比較大的差距
3.關于時間
4.對評論數進行分析
5.總結
? ? ? ? 1)平均每單價格低的店鋪的總銷量、銷售額都高于均價更高的。價格便宜是消費者考慮的最多的一個點。銷量最高的相宜本草的均價就很低,同時它的銷售額也是最高額的。而均價較高的類中,只有雅詩蘭黛的銷售額相對客觀。對于一些中高端商品,可以考慮適當降價來吸引更多消費者。而一些低端商品可以考慮多推廣來提高知名度獲取銷量。
? ? ? ? 2)所有大類中,護膚品類的銷量最高,其次是化妝品類。所有小類中,清潔類、補水類分別是銷量的前二名。
? ? ? ? 3)男士專用的商品中,護膚品銷量最高,而化妝品類中主要是唇膏。并且妮維雅占據了男士專用的大部分市場。
? ? ? ? 4)平均每多少單一條評論這個指標,相宜本草過高了,是評論數最多的悅詩風吟的4倍。可能存在刷單等現象。
? ? ? ? 5)不同的日期銷量也不同。在雙11銷量反而有一個劇烈的下滑。原因可能是預熱活動導致了消費者提前消費,并且由于消費者往往會主觀的考慮到雙11當天的網絡、平臺會卡頓,一般都會提前下單來避免“高峰”,雖然這個高峰并不存在。而在雙11之后銷量又有了小幅度的增長,可能跟商家的持續優惠等各種活動有關。所以商家應該把目光放在雙11之前,盡量的吸引消費者消費來增加銷量,不要局限于雙11當天。在雙11之后可以通過類似雙11購物返滿減卷,來刺激二次消費。
數據讀取與預覽:運用 Python 語言,借助numpy
和pandas
庫開展數據分析工作。通過pd.read_csv()
函數讀取名為雙十一淘寶美妝數據.csv
的文件,并使用df.head()
函數查看數據集的前五行內容。數據集包含update_time
(更新時間)、id
(產品編號)、title
(產品標題)、price
(價格)、sale_count
(銷售數量)、comment_count
(評論數量)以及店名
等字段,從展示的數據來看,涉及自然堂品牌的多種美妝產品信息。
項目整體概況:此項目圍繞 2020 年雙 11 期間淘寶美妝數據展開分析,目前展示內容處于數據讀取階段,后續可能會基于這些數據開展多方面分析,比如不同品牌美妝產品的銷售趨勢、價格與銷量的關系、消費者評價反饋等,從而為美妝行業從業者提供決策依據,助力其更好地把握市場動態和消費者需求。