文章目錄
- 🏳??🌈 1. 導入模塊
- 🏳??🌈 2. Pandas數據處理
- 2.1 讀取數據
- 2.2 數據信息
- 2.3 去除訂單金額為空的數據
- 2.5 提取季度和星期
- 🏳??🌈 3. Pyecharts數據可視化
- 3.1 每月訂單量和訂單金額分布
- 3.2 各季度訂單量占比
- 3.3 每天訂單量和訂單金額分布
- 3.4 每小時訂單金額分布
- 3.5 一星期各天訂單金額分布
- 3.6 全年訂單金額日歷熱圖
- 3.7 等級I分類訂單量
- 3.8 等級II分類訂單量象形圖
- 3.9 產品名稱訂單量詞云
- 🏳??🌈 4. 可視化項目源碼+數據
大家好,我是 👉 【Python當打之年(點擊跳轉)】
本期我們利用Python分析「箱包訂單數據集」,看看:各月訂單量和訂單金額占比、各季度訂單量占比、每天訂單金額分布、每小時訂單金額分布、全年訂單金額日歷、各分類訂單量等等,希望對大家有所幫助,如有疑問或者需要改進的地方可以聯系小編。
涉及到的庫:
- Pandas— 數據處理
- Pyecharts— 數據可視化
🏳??🌈 1. 導入模塊
import pandas as pd
from pyecharts.charts import *
from pyecharts import options as opts
import warnings
warnings.filterwarnings('ignore')
🏳??🌈 2. Pandas數據處理
2.1 讀取數據
df = pd.read_excel('./箱包訂單數據.xlsx')
2.2 數據信息
df.info()
2.3 去除訂單金額為空的數據
df = df.dropna(subset=['訂單金額'])
2.4 提取年月日
df['訂單日期'] = pd.to_datetime(df['訂單日期'])
df['年'] = df['訂單日期'].dt.year
df['月'] = df['訂單日期'].dt.month
df['日'] = df['訂單日期'].dt.day
2.5 提取季度和星期
df['季度'] = df['訂單日期'].dt.quarter
df['周'] = df['訂單日期'].dt.day_name()
🏳??🌈 3. Pyecharts數據可視化
3.1 每月訂單量和訂單金額分布
def get_c1():bar1 = (Bar().add_xaxis(x_data).add_yaxis('訂單量', y_data).extend_axis(yaxis=opts.AxisOpts(type_='value',axislabel_opts=opts.LabelOpts(formatter='{value}萬元'), )).set_global_opts(title_opts=opts.TitleOpts(title='1-每月訂單量和訂單金額分布',subtitle=subtitle,pos_top='2%',pos_left='center'),))line1 = (Line().add_xaxis(x_data).add_yaxis(series_name='訂單金額',yaxis_index=1,y_axis=y_data1,))bar1.overlap(line1)
- 11月的訂單量和訂單金額最高,其次是6月和3月。
3.2 各季度訂單量占比
def get_c2():pie1 = (Pie().add('',data,radius=['40%', '70%'],center=['50%', '55%'],).set_global_opts(title_opts=opts.TitleOpts(title='2-各季度訂單量占比',subtitle=subtitle,pos_top='2%',pos_left='center',),visualmap_opts=opts.VisualMapOpts(is_show=False),legend_opts=opts.LegendOpts(is_show=False)))
- 第2季度和第4季度的訂單占比都在30%左右,相較于第1季度和第3幾度要高出10個百分點。
3.3 每天訂單量和訂單金額分布
- 月初的訂單量和訂單金額相較于月末來的更多。
3.4 每小時訂單金額分布
def get_c4():line2 = (Line().add_xaxis(x_data).add_yaxis('', y_data,areastyle_opts=opts.AreaStyleOpts(opacity=0.8)).set_global_opts(title_opts=opts.TitleOpts(title='4-每小時訂單金額分布',subtitle=subtitle,pos_top='2%',pos_left='center',),visualmap_opts=opts.VisualMapOpts(is_show=False,),))
- 晚間時段的訂單量達到高峰,集中在20:00-24:00這個時間區間內,上午時間09:00-11:00段內也出現一波小高峰
3.5 一星期各天訂單金額分布
- 周一和周三兩天的訂單金額最高,最低的是周六。
3.6 全年訂單金額日歷熱圖
3.7 等級I分類訂單量
def get_c7():bar2 = (Bar().add_xaxis(x_data).add_yaxis('', y_data,label_opts=opts.LabelOpts(position='right')).reversal_axis().set_global_opts(title_opts=opts.TitleOpts(title='7-等級I分類訂單量',subtitle=subtitle,pos_top='2%',pos_left='center',),visualmap_opts=opts.VisualMapOpts(is_show=False,),)
- 手袋、銀包類箱包訂單量排在前兩位,物料、服裝、飾品等分類的箱包訂單量排在第3-5位。
3.8 等級II分類訂單量象形圖
- 長款票夾、腰包的訂單量要遠高于其他II級分類箱包。
3.9 產品名稱訂單量詞云
def get_c9():wordcloud1 = (WordCloud().add('',words,word_size_range=[30,70]).set_global_opts(title_opts=opts.TitleOpts(title='9-產品名稱訂單量詞云',pos_top='2%',pos_left="center",),visualmap_opts=opts.VisualMapOpts(is_show=False,)))
🏳??🌈 4. 可視化項目源碼+數據
點擊跳轉:【全部可視化項目源碼+數據】
以上就是本期為大家整理的全部內容了,趕快練習起來吧,原創不易,喜歡的朋友可以點贊、收藏也可以分享(注明出處)讓更多人知道。