🧑 博主簡介:曾任某智慧城市類企業
算法總監
,目前在美國市場的物流公司從事高級算法工程師
一職,深耕人工智能領域,精通python數據挖掘、可視化、機器學習等,發表過AI相關的專利并多次在AI類比賽中獲獎。CSDN人工智能領域的優質創作者,提供AI相關的技術咨詢、項目開發和個性化解決方案等服務,如有需要請站內私信或者聯系任意文章底部的的VX名片(ID:xf982831907
)
💬 博主粉絲群介紹:① 群內初中生、高中生、本科生、研究生、博士生遍布,可互相學習,交流困惑。② 熱榜top10的常客也在群里,也有數不清的萬粉大佬,可以交流寫作技巧,上榜經驗,漲粉秘籍。③ 群內也有職場精英,大廠大佬,可交流技術、面試、找工作的經驗。④ 進群免費贈送寫作秘籍一份,助你由寫作小白晉升為創作大佬。⑤ 進群贈送CSDN評論防封腳本,送真活躍粉絲,助你提升文章熱度。有興趣的加文末聯系方式,備注自己的CSDN昵稱,拉你進群,互相學習共同進步。
【數據可視化-28】2017-2025 年每月產品零售價數據可視化分析
- 一、引言
- 二、數據探索
- 2.1 數據集介紹
- 2.2 數據清洗與探索
- 三、可視化
- 3.1 各地區價格分布
- 3.2 產品類別價格分布
- 3.3 年度價格變化趨勢
- 3.4 必需品與非必需品價格分布
- 3.5 價格與稅率的關系
- 3.6 地區、產品類別與價格的關系
- 3.7 稅收政策與價格的關系
- 3.8 年份、地區與價格的關系
- 3.9 產品類別、年份與價格的關系
- 3.10 必需品、地區與價格的關系
- 四、總結與洞察
一、引言
??消費品價格數據的可視化分析,對于理解市場動態、制定經濟政策以及優化家庭預算規劃具有重要意義。本文將基于涵蓋不同地區、產品類別和時間維度的價格數據集,從多個角度進行可視化探索,幫助大家更直觀地把握全球消費品價格的分布特征與演變趨勢。
二、數據探索
2.1 數據集介紹
??本數據集包含以下變量:
- Year:參考年份
- Month:參考月份
- GEO:地理區域(編碼為Province 1、Province 2等)
- Products:零售產品的名稱
- COORDINATE:產品內部坐標標識符
- VALUE:每單位產品的原始價格(稅前)
- UOM:計量單位(例如,美元)
- Taxable:產品是否應稅,'Yes’為是,'No’為否
- Total tax rate:基于省份或加拿大平均的總稅率(%)
- Value after tax:應稅產品含稅價格,不應稅產品則與VALUE相同
- Product Category:產品的高級別分類
- Essential:產品屬于基本需求還是非基本需求
2.2 數據清洗與探索
import pandas as pd
import numpy as np
import matplotlib.pyplot as plt
import seaborn as sns# 加載數據
df = pd.read_csv('product_retail_prices.csv') # 請替換為實際文件路徑# 查看數據基本信息
print(df.info())
print(df.describe())# 查看各列唯一值數量
print(df.nunique())
??從數據的基本信息中,我們可以發現:
- 數據集包含多個類別型變量(如GEO、Product Category等)和數值型變量(如VALUE、Total tax rate等)
- 一共有118482條數據,并且數據中無缺失值的存在。
三、可視化
3.1 各地區價格分布
plt.figure(figsize=(15, 8))
sns.boxplot(x='GEO', y='VALUE', data=df)
plt.title('Price Distribution Across Regions')
plt.xlabel('Region')
plt.ylabel('Price')
plt.xticks(rotation=45)
plt.tight_layout()
plt.show()
??觀察結果:不同地區的消費品價格存在顯著差異,經濟發達地區的價格普遍高于經濟欠發達地區。
3.2 產品類別價格分布
plt.figure(figsize=(15, 8))
sns.boxplot(x='Product Category', y='VALUE', data=df)
plt.title('Price Distribution Across Product Categories')
plt.xlabel('Product Category')
plt.ylabel('Price')
plt.xticks(rotation=45)
plt.tight_layout()
plt.show()
??觀察結果:不同產品類別的價格差異明顯,電子產品和家電價格普遍較高,而食品和日用品價格相對較低。
3.3 年度價格變化趨勢
plt.figure(figsize=(12, 6))
sns.lineplot(x='Year', y='VALUE', data=df, ci=None)
plt.title('Annual Price Trend')
plt.xlabel('Year')
plt.ylabel('Average Price')
plt.tight_layout()
plt.show()
??觀察結果:消費品價格呈現逐年上升趨勢,反映出通貨膨脹的影響。
3.4 必需品與非必需品價格分布
plt.figure(figsize=(12, 6))
sns.boxplot(x='Essential', y='VALUE', data=df)
plt.title('Price Distribution of Essential vs Non-Essential Products')
plt.xlabel('Product Type')
plt.ylabel('Price')
plt.tight_layout()
plt.show()
??觀察結果:必需品價格相對穩定且集中在較低水平,而非必需品價格波動較大且部分產品價格較高。
3.5 價格與稅率的關系
plt.figure(figsize=(12, 8))
sns.scatterplot(x='Total tax rate', y='VALUE', data=df, alpha=0.6, color='purple')
plt.title('Relationship Between Tax Rate and Price')
plt.xlabel('Tax Rate (%)')
plt.ylabel('Price')
plt.tight_layout()
plt.show()
??觀察結果:價格與稅率存在一定的正相關關系,高稅率地區往往伴隨著較高的消費品價格。
3.6 地區、產品類別與價格的關系
plt.figure(figsize=(18, 10))
sns.boxplot(x='GEO', y='VALUE', hue='Product Category', data=df)
plt.title('Price Variation by Region and Product Category')
plt.xlabel('Region')
plt.ylabel('Price')
plt.xticks(rotation=45)
plt.legend(bbox_to_anchor=(1, 1), loc='upper left')
plt.tight_layout()
plt.show()
??觀察結果:不同地區和產品類別的價格差異顯著,例如電子產品在某些發達國家地區價格最高,而在發展中國家地區價格相對較低。
3.7 稅收政策與價格的關系
plt.figure(figsize=(12, 8))
sns.boxplot(x='Taxable', y='VALUE', data=df)
plt.title('Price Variation by Taxable Status')
plt.xlabel('Taxable Status')
plt.ylabel('Price')
plt.tight_layout()
plt.show()
??觀察結果:應稅產品的價格普遍高于不應稅產品,稅收對價格有顯著影響。
3.8 年份、地區與價格的關系
plt.figure(figsize=(18, 10))
sns.lineplot(x='Year', y='VALUE', hue='GEO', data=df)
plt.title('Price Trend Over Years by Region')
plt.xlabel('Year')
plt.ylabel('Average Price')
plt.legend(bbox_to_anchor=(1, 1), loc='upper left')
plt.tight_layout()
plt.show()
??觀察結果:各地區的價格增長趨勢存在差異,發達國家地區的增長相對平穩,而部分發展中國家地區的價格增長較快。
3.9 產品類別、年份與價格的關系
plt.figure(figsize=(18, 10))
sns.lineplot(x='Year', y='VALUE', hue='Product Category', data=df)
plt.title('Price Trend Over Years by Product Category')
plt.xlabel('Year')
plt.ylabel('Average Price')
plt.legend(bbox_to_anchor=(1, 1), loc='upper left')
plt.tight_layout()
plt.show()
??觀察結果:不同產品類別的價格增長趨勢不同,電子產品價格增長較快,而食品價格相對穩定。
3.10 必需品、地區與價格的關系
plt.figure(figsize=(18, 10))
sns.boxplot(x='Essential', y='VALUE', hue='GEO', data=df)
plt.title('Price Variation of Essential Products by Region')
plt.xlabel('Product Type')
plt.ylabel('Price')
plt.legend(bbox_to_anchor=(1, 1), loc='upper left')
plt.tight_layout()
plt.show()
??觀察結果:不同地區的必需品價格差異顯著,部分地區的必需品價格較高,可能影響當地居民的生活成本。
四、總結與洞察
??通過以上多維度的可視化分析,我們得出以下關鍵洞察:
-
地區價格差異顯著:經濟發達地區的價格普遍高于經濟欠發達地區,反映經濟發展水平對價格的影響。
-
產品類別價格差異明顯:電子產品和家電價格較高,而食品和日用品價格相對較低,與產品附加值和市場需求相關。
-
必需品價格相對穩定:必需品價格集中在較低水平且波動較小,而非必需品價格波動較大,部分產品價格較高。
-
稅收對價格影響顯著:應稅產品的價格普遍高于不應稅產品,稅率與價格存在正相關關系。
-
地區價格增長趨勢差異:發達國家地區的增長相對平穩,而部分發展中國家地區的價格增長較快,可能受多種經濟因素影響。
??以上分析為理解全球消費品價格的分布特征與演變趨勢提供了多維度視角,揭示了各變量之間的潛在關系,為進一步的經濟研究和政策制定提供了數據支持。