【61 Pandas+Pyecharts | 基于Apriori算法及帕累托算法的超市銷售數據分析可視化】

文章目錄

  • 🏳??🌈 1. 導入模塊
  • 🏳??🌈 2. Pandas數據處理
    • 2.1 讀取數據
    • 2.2 數據信息
    • 2.3 數據去重
    • 2.4 訂單日期處理提取年份
    • 2.5 產品名稱處理
  • 🏳??🌈 3. Pyecharts數據可視化
    • 3.1 每年銷售額和利潤分布
    • 3.2 各地區銷售額和利潤分布
    • 3.3 各省訂單量分布
    • 3.4 各省銷售額分布
    • 3.5 各類別產品訂單量
    • 3.6 客戶類別占比
    • 3.7 Apriori算法關聯分析
    • 3.8 帕累托分析
  • 🏳??🌈 4. 可視化項目源碼+數據

大家好,我是 👉 【Python當打之年(點擊跳轉)】

本期我們利用Python分析「超市銷售數據集」,看看:每年銷售額和利潤分布、各地區銷售額和利潤分布、各省訂單量分布、各省銷售額分布、各類別產品訂單量、客戶類別占比等等,希望對大家有所幫助,如有疑問或者需要改進的地方可以聯系小編。

涉及到的庫:

  • Pandas— 數據處理
  • Pyecharts— 數據可視化

🏳??🌈 1. 導入模塊

import pandas as pd
from pyecharts.charts import *
from pyecharts import options as opts
import warnings
warnings.filterwarnings('ignore')

🏳??🌈 2. Pandas數據處理

2.1 讀取數據

df = pd.read_excel('超市銷售數據.xlsx')

在這里插入圖片描述

2.2 數據信息

df.info()

在這里插入圖片描述

2.3 數據去重

df = df.drop_duplicates()

2.4 訂單日期處理提取年份

df['年'] = df['訂單日期'].dt.year

2.5 產品名稱處理

在這里插入圖片描述

🏳??🌈 3. Pyecharts數據可視化

3.1 每年銷售額和利潤分布

defget_chart1():chart = (Bar().add_xaxis(x_data).add_yaxis('銷售額', y_data1,gap='5%',label_opts=opts.LabelOpts(formatter='{c}萬')).add_yaxis('利潤', y_data2,gap='5%',label_opts=opts.LabelOpts(formatter='{c}萬')).set_global_opts(title_opts=opts.TitleOpts(title='1-每年銷售額和利潤分布',subtitle=subtitle,pos_top='2%',pos_left='center'),legend_opts=opts.LegendOpts(pos_top='15%')))

在這里插入圖片描述

  • 銷售額和利潤均呈現逐年增長的趨勢。

3.2 各地區銷售額和利潤分布

在這里插入圖片描述

  • 華東大區的銷售額最高,反映出當地消費能力較高,中南和東北地區緊隨其后,利潤方面來看,中南地區和華東地區的利潤要遠高于其他地區。

3.3 各省訂單量分布

在這里插入圖片描述

  • 沿海地區的訂單量要明顯高于內地,尤其是廣東、山東、江蘇、遼寧。

3.4 各省銷售額分布

在這里插入圖片描述

3.5 各類別產品訂單量

在這里插入圖片描述

  • 辦公用品類商品需求量最大,占比超過了50%,技術類和家具類各占20%左右。

3.6 客戶類別占比

在這里插入圖片描述

  • 客戶類別以個體消費者為主,其次是公司和小型企業。

3.7 Apriori算法關聯分析

# 轉換為算法可接受模型(布爾值)
te = TransactionEncoder()
d_data = te.fit(data_am).transform(data_am)
df_t = pd.DataFrame(d_data,columns=te.columns_)
# 設置支持度求頻繁項集
frequent_itemsets = apriori(df_t,min_support=0.04,use_colnames= True)
rules = association_rules(frequent_itemsets,metric = 'confidence',min_threshold = 0.1)
# 設置最小提升度, 一般認為提升度大于1的關聯規則才有商業價值
rules = rules.drop(rules[rules.lift <1].index)
# 設置標題索引并打印結果
rules.rename(columns = {'antecedents':'from','consequents':'to','support':'sup','confidence':'conf'},inplace = True)
rules = rules[['from','to','sup','conf','lift']].sort_values('sup',ascending=False).reset_index(drop=True)

結果:
在這里插入圖片描述

在這里插入圖片描述

3.8 帕累托分析

帕累托分析模型(Pareto Analysis),又稱80/20法則、ABC分析法或主次因素分析法,是一種基于“關鍵少數與次要多數”原理的決策工具,用于識別和優先處理對結果影響最大的關鍵因素。

defget_chart8():bar = (Bar().add_xaxis(x_data).add_yaxis("銷售額", y_data1,itemstyle_opts=opts.ItemStyleOpts(color=range_color[-1]),label_opts=opts.LabelOpts(is_show=False),).extend_axis(yaxis=opts.AxisOpts(max_=120,)).set_global_opts(title_opts=opts.TitleOpts(title='8-帕累托分析',subtitle=subtitle,pos_top='2%',pos_left='center',),xaxis_opts=opts.AxisOpts(axislabel_opts=opts.LabelOpts(rotate=60,font_size=10)),legend_opts=opts.LegendOpts(pos_top='12%')))line = (Line().add_xaxis(x_data).add_yaxis("累積利潤占比",y_data2,z=10,yaxis_index=1,label_opts=opts.LabelOpts(is_show=False),))

在這里插入圖片描述

🏳??🌈 4. 可視化項目源碼+數據

點擊跳轉:【全部可視化項目源碼+數據】


以上就是本期為大家整理的全部內容了,趕快練習起來吧,原創不易,喜歡的朋友可以點贊、收藏也可以分享注明出處)讓更多人知道。

本文來自互聯網用戶投稿,該文觀點僅代表作者本人,不代表本站立場。本站僅提供信息存儲空間服務,不擁有所有權,不承擔相關法律責任。
如若轉載,請注明出處:http://www.pswp.cn/pingmian/84801.shtml
繁體地址,請注明出處:http://hk.pswp.cn/pingmian/84801.shtml
英文地址,請注明出處:http://en.pswp.cn/pingmian/84801.shtml

如若內容造成侵權/違法違規/事實不符,請聯系多彩編程網進行投訴反饋email:809451989@qq.com,一經查實,立即刪除!

相關文章

每日算法刷題Day31 6.14:leetcode二分答案2道題,結束二分答案,開始枚舉技巧,用時1h10min

7. 1439.有序矩陣中的第K個最小數組和(困難,學習轉化為373) 1439. 有序矩陣中的第 k 個最小數組和 - 力扣&#xff08;LeetCode&#xff09; 思想 1.給你一個 m * n 的矩陣 mat&#xff0c;以及一個整數 k &#xff0c;矩陣中的每一行都以非遞減的順序排列。 你可以從每一行…

springMVC-13 文件下載及上傳

文件下載-ResponseEntity<T> 說明 在SpringMVC中&#xff0c;通過返回ResponseEntity<T>的類型&#xff0c;可以實現文件下載的功能 核心代碼&#xff1a;就是設置HttpHeader 文件下載響應頭的設置 content-type 指示響應內容的格式 content…

數據庫學習筆記(十六)--控住流程與游標

前言&#xff1a; 學習和使用數據庫可以說是程序員必須具備能力&#xff0c;這里將更新關于MYSQL的使用講解&#xff0c;大概應該會更新30篇&#xff0c;涵蓋入門、進階、高級(一些原理分析);這一篇和上一篇差不多&#xff0c;當做擴展&#xff0c;用到的時候再查即可(畢竟數據…

《Origin畫百圖》之核密度圖

核密度圖&#xff08;Kernel Density Plot&#xff09; 是一種用于展示數據分布形態的可視化工具&#xff0c;它通過平滑的曲線來估計數據的概率密度函數&#xff0c;相比直方圖能更細膩地呈現數據的分布特征。 具體步驟&#xff1a; &#xff08;1&#xff09;選中數據&#…

使用Apache POI操作Word文檔:從入門到實戰

Apache POI是Java生態中最流行的Microsoft Office文檔操作庫之一&#xff0c;它為Word文檔&#xff08;包括傳統的.doc格式和現代的.docx格式&#xff09;提供了全面的API支持。本文將詳細介紹如何使用Apache POI創建、讀取和修改Word文檔。 一、Apache POI簡介與環境準備 1.…

CentOS 7.3環境中部署Kerberos集群

CentOS 7.3環境中部署Kerberos集群 文章目錄 CentOS 7.3環境中部署Kerberos集群環境安裝服務包 Kerberos MS 規劃安裝 KDC Master Server配置文件/etc/krb5.conf/var/kerberos/krb5kdc/kdc.conf/var/kerberos/krb5kdc/kadm5.acl 創建Kerberos數據庫啟動與停止服務創建管理員創建…

1 Studying《Arm A715 Software Optimization Guide》

目錄 1 Introduction 1.1 Product revision status 1.2 Intended audience 1.3 Scope 1.4 Conventions 1.5 Useful resources 2 Overview 2.1 Pipeline overview 3 Instruction characteristics 3.1 Instruction tables 3.2 Legend for reading the utilized pipeli…

第二十四章 24.QoS(CCNA)

第二十四章 24.QoS(CCNA) 介紹了switch QoS的配置方法 注釋&#xff1a; 學習資源是B站的CCNA by Sean_Ning CCNA 最新CCNA 200-301 視頻教程(含免費實驗環境&#xff09; PS&#xff1a;喜歡的可以去買下他的課程&#xff0c;不貴&#xff0c;講的很細 To be continued……

什么是穩定幣?

穩定幣&#xff08;Stablecoin&#xff09;是一種特殊的加密貨幣&#xff0c;其核心目標是維持價格穩定&#xff0c;通常與某種穩定資產&#xff08;如美元、黃金等&#xff09;掛鉤。 一、為什么需要穩定幣&#xff1f; 普通加密貨幣&#xff08;如比特幣、以太坊&#xff09…

伺服學習(IS620N)

DI 端子的基本概念 DI 端子是伺服驅動器上的數字輸入接口&#xff0c;用于接收外部開關、按鈕或PLC的24V/0V信號。每個端子的功能可通過參數靈活配置&#xff08;如啟停、限位等&#xff09;。 核心要點 功能設置&#xff1a;通過驅動器參數組&#xff08;如H03&#xff09;…

基于Python的氣象數據分析及可視化研究

目錄 一.&#x1f981;前言二.&#x1f981;開源代碼與組件使用情況說明三.&#x1f981;核心功能1. ?算法設計2. ?PyEcharts庫3. ?Flask框架4. ?爬蟲5. ?部署項目 四.&#x1f981;演示效果1. 管理員模塊1.1 用戶管理 2. 用戶模塊2.1 登錄系統2.2 查看實時數據2.3 查看天…

Excel處理控件Aspose.Cells教程:使用 C# 在 Excel 中應用數據驗證

Excel 中的數據驗證可確保用戶在工作表中僅輸入有效數據。在設計表單、收集數據或構建財務模型時&#xff0c;數據驗證有助于維護結構并最大限度地減少用戶錯誤。在本文中&#xff0c;我們將向您展示如何使用 C# 以編程方式在 Excel 中應用數據驗證。 Aspose.Cells 最新版下載…

AI應用:計算機視覺相關技術總結

計算機視覺概述 計算機視覺&#xff08;Computer Vision, CV&#xff09;是一門讓計算機從圖像或視頻中 “理解” 和 “解釋” 視覺信息的技術&#xff0c;涉及多學科交叉&#xff08;如數學、統計學、機器學習、信號處理等&#xff09;。以下從技術體系、核心任務、關鍵技術、…

人口販賣暑期威脅消解:算法協同提升安全預警

隨著暑期的到來&#xff0c;人員流動加劇&#xff0c;人口販賣等惡性犯罪活動進入高發階段&#xff0c;景區、車站、商場等公共場所成為潛在風險區域。傳統安防手段在應對此類隱蔽性強、危害性大的犯罪時顯得力不從心。為此&#xff0c;引入基于視覺分析的多維度算法技術&#…

【DSP筆記 · 第3章】數字世界的“棱鏡”:離散傅里葉變換(DFT)完全解析

數字世界的“棱鏡”&#xff1a;離散傅里葉變換&#xff08;DFT&#xff09;完全解析 在上一章&#xff0c;我們探索了Z變換和離散時間傅里葉變換&#xff08;DTFT&#xff09;。我們知道&#xff0c;DTFT是一個無比強大的理論工具&#xff0c;它能將一個時域離散序列的“基因…

卷積神經網絡的參數量及尺度變化計算

文章目錄 前言1.卷積2.參數量的計算2.1案例一2.2案例二 3.奇怪的優化思想3.1使用小核卷積替換大核卷積3.2卷積核11的應用 4.輸出圖像尺寸的計算4.1Same convolution4.2具體計算規則4.3轉置卷積 小結 前言 本篇博客主要介紹卷積基本概念&#xff0c;卷積神經網絡的參數量計算、…

OpenCV——圖像平滑

圖像平滑 一、圖像的噪聲1.1、噪聲來源1.2、噪聲類型1.3、噪聲模擬 二、濾波器三、線性濾波3.1、均值濾波3.2、方框濾波3.3、高斯濾波 四、非線性濾波4.1、中值濾波4.2、雙邊濾波 圖像在采集和傳輸過程中容易受到各種因素的影響而產生噪聲&#xff0c;而噪聲會對圖像的正確解讀…

鴻蒙系統備份恢復

鴻蒙系統嘗試者&#xff0c;在純血鴻蒙與鴻蒙4.2/4.3之前反復橫跳&#xff0c;中間折騰… 目錄 鴻蒙4.2/4.3升級鴻蒙5.0系統備份 鴻蒙5.0回退鴻蒙4.2/4.3系統備份備份恢復 華為手機助手注意 鴻蒙4.2/4.3升級鴻蒙5.0 系統備份 云空間備份手機本地備份華為手機助手備份 鴻蒙5.…

JS進階 Day03

1.兩種面向編程思想 2.構造函數實現封裝以及存在的問題 下面就引出了原型對象 3.原型對象prototype 共享原理圖&#xff1a; 4.數組擴展案例-求最大值和數組求和 <!DOCTYPE html> <html lang"en"><head><meta charset"UTF-8"><…

visual studio小番茄插件某些快捷鍵失效

問題 AltO 切換頭文件和源文件失效。 背景 最近升級了 visual studio&#xff0c;多了一些插件 原因 Alt O 快捷鍵被其他插件占用了 解決方案 工具 → 選項 → 環境 → 鍵盤 搜索這個 VAssistX.OpenCorrespondingFile&#xff08;切換頭/源文件&#xff09; 發現命令的快…