目錄
- 專欄導讀
- 項目簡介
- 功能特性
- 📊 數據處理功能
- 📈 統計分析功能
- 🎨 可視化功能
- 📋 報告生成
- 項目結構
- 安裝和使用
- 環境要求
- 安裝步驟
- 使用自己的數據
- 依賴包說明
- 輸出文件說明
- 靜態圖表(PNG格式)
- 交互式圖表(HTML格式)
- 分析報告
- 核心類和方法
- ProductAnalyzer類
- 自定義和擴展
- 添加新的圖表類型
- 修改分析指標
- 常見問題
- Q: 運行時出現中文顯示問題
- Q: Excel文件讀取失敗
- Q: 圖表不顯示
專欄導讀
🌸 歡迎來到Python辦公自動化專欄—Python處理辦公問題,解放您的雙手
🏳??🌈 博客主頁:請點擊——> 一晌小貪歡的博客主頁求關注
👍 該系列文章專欄:請點擊——>Python辦公自動化專欄求訂閱
🕷 此外還有爬蟲專欄:請點擊——>Python爬蟲基礎專欄求訂閱
📕 此外還有python基礎專欄:請點擊——>Python基礎學習專欄求訂閱
文章作者技術和水平有限,如果文中出現錯誤,希望大家能指正🙏
?? 歡迎各位佬關注! ??
項目簡介
-
本項目是一個完整的商品數據分析系統,能夠讀取Excel格式的商品數據,進行數據清洗、統計分析和可視化展示。項目包含了多種圖表類型和交互式可視化功能,適用于電商、零售等行業的商品數據分析需求。
功能特性
📊 數據處理功能
- Excel文件讀取和解析
- 數據清洗和預處理
- 缺失值和異常值檢測
- 數據類型轉換和格式化
📈 統計分析功能
- 描述性統計分析
- 相關性分析
- 分類變量統計
- 數值變量分布分析
🎨 可視化功能
-
靜態圖表:
- 柱狀圖(商品類別分布、平均價格對比)
- 餅圖(類別占比)
- 散點圖(價格與銷量關系)
- 熱力圖(變量相關性)
- 水平柱狀圖(品牌銷量對比)
- 直方圖(評分分布)
-
交互式圖表:
- 交互式散點圖(支持縮放、篩選)
- 交互式柱狀圖(動態數據展示)
- 交互式箱線圖(價格分布分析)
📋 報告生成
- 自動生成Markdown格式分析報告
- 包含基本統計信息和類別分析
- 支持自定義報告內容
項目結構
7-Python實現商品讀取Excel進行可視化分析/
├── requirements.txt # 項目依賴包
├── create_sample_data.py # 示例數據生成腳本
├── product_analysis.py # 主要分析腳本
├── 商品數據.xlsx # 示例商品數據
├── README.md # 項目說明文檔
├── 商品分析報告.md # 生成的分析報告
├── 靜態圖表/ # 生成的PNG格式圖表
│ ├── 商品類別分布.png
│ ├── 價格銷量關系.png
│ ├── 各類別平均價格.png
│ ├── 相關性熱力圖.png
│ ├── 各品牌銷量對比.png
│ └── 評分分布.png
└── 交互式圖表/ # 生成的HTML格式交互圖表├── 交互式價格銷量圖.html├── 交互式類別銷量圖.html└── 交互式價格分布圖.html
安裝和使用
環境要求
- Python 3.7+
- Windows/macOS/Linux
安裝步驟
-
克隆或下載項目
git clone <項目地址> cd 7-Python實現商品讀取Excel進行可視化分析
-
安裝依賴包
pip install -r requirements.txt
-
生成示例數據(可選)
python create_sample_data.py
-
運行分析
python product_analysis.py
使用自己的數據
-
準備Excel文件,確保包含以下列:
- 商品ID
- 商品名稱
- 類別
- 品牌
- 價格
- 銷量
- 庫存
- 評分
- 上架日期
- 成本
- 利潤
- 利潤率
-
修改
product_analysis.py
中的文件路徑:analyzer = ProductAnalyzer('你的數據文件.xlsx')
-
運行分析腳本
依賴包說明
包名 | 版本 | 用途 |
---|---|---|
pandas | >=1.5.0 | 數據處理和分析 |
matplotlib | >=3.6.0 | 靜態圖表繪制 |
seaborn | >=0.12.0 | 統計圖表美化 |
numpy | >=1.24.0 | 數值計算 |
openpyxl | >=3.1.0 | Excel文件讀寫 |
xlrd | >=2.0.0 | Excel文件讀取 |
scipy | >=1.10.0 | 科學計算 |
plotly | >=5.15.0 | 交互式圖表 |
jupyter | >=1.0.0 | Jupyter Notebook支持 |
輸出文件說明
靜態圖表(PNG格式)
商品類別分布.png
- 展示各類別商品數量和占比
價格銷量關系.png
- 分析價格與銷量的相關性
各類別平均價格.png
- 對比不同類別的平均價格
相關性熱力圖.png
- 顯示數值變量間的相關系數
各品牌銷量對比.png
- 比較各品牌的總銷量
評分分布.png
- 展示商品評分的分布情況
交互式圖表(HTML格式)
交互式價格銷量圖.html
- 可交互的價格銷量散點圖
交互式類別銷量圖.html
- 可交互的類別銷量柱狀圖
交互式價格分布圖.html
- 可交互的價格分布箱線圖
分析報告
商品分析報告.md
- 包含完整統計信息的Markdown報告
核心類和方法
ProductAnalyzer類
class ProductAnalyzer:def __init__(self, excel_file) # 初始化分析器def load_data(self) # 讀取Excel數據def data_cleaning(self) # 數據清洗def descriptive_statistics(self) # 描述性統計def correlation_analysis(self) # 相關性分析def create_visualizations(self) # 創建靜態圖表def create_interactive_charts(self) # 創建交互式圖表def generate_report(self) # 生成分析報告def run_complete_analysis(self) # 運行完整分析流程
自定義和擴展
添加新的圖表類型
在 create_visualizations()
方法中添加新的圖表代碼:
# 示例:添加新的圖表
plt.figure(figsize=(10, 6))
# 你的圖表代碼
plt.savefig('新圖表.png', dpi=300, bbox_inches='tight')
plt.show()
修改分析指標
在 descriptive_statistics()
方法中添加新的統計指標:
# 示例:添加新的統計指標
custom_stats = self.df.groupby('類別')['新字段'].agg(['mean', 'std'])
print(custom_stats)
常見問題
Q: 運行時出現中文顯示問題
A: 確保系統安裝了中文字體,或修改代碼中的字體設置:
plt.rcParams['font.sans-serif'] = ['SimHei', 'Microsoft YaHei']
Q: Excel文件讀取失敗
A: 檢查文件路徑是否正確,確保Excel文件未被其他程序占用
Q: 圖表不顯示
A: 如果在服務器環境運行,可能需要設置matplotlib后端:
import matplotlib
matplotlib.use('Agg')
注意:本項目僅供學習和研究使用,請根據實際需求進行調整和優化。
-
希望對初學者有幫助;致力于辦公自動化的小小程序員一枚
-
希望能得到大家的【??一個免費關注??】感謝!
-
求個 🤞 關注 🤞 +?? 喜歡 ?? +👍 收藏 👍
-
此外還有辦公自動化專欄,歡迎大家訂閱:Python辦公自動化專欄
-
此外還有爬蟲專欄,歡迎大家訂閱:Python爬蟲基礎專欄
-
此外還有Python基礎專欄,歡迎大家訂閱:Python基礎學習專欄