Python 數據分析重點知識點
本系列不同其他的知識點講解,力求通過例子讓新同學學習用法,幫助老同學快速回憶知識點
可視化系列:
- Python基礎
- 數據分析工具
- 數據處理與分析
- 數據可視化
- 機器學習基礎
四、數據可視化
圖表類型與選擇
- 根據數據特點和分析目的選合適圖表類型。
圖形大全解析 非常全面
可視化技巧
- ①設置中文字體
# 設置中文字體
matplotlib.rcParams['font.sans-serif'] = ['SimHei']
matplotlib.rcParams['font.family']='sans-serif'
- ②通過subplots函數創建多個子圖,并調整布局
# subplots詳解
import matplotlib
import matplotlib.pyplot as plt
import numpy as np
# 設置中文字體
matplotlib.rcParams['font.sans-serif'] = ['SimHei']
matplotlib.rcParams['font.family']='sans-serif'
# 創建數據
# 生成從0到10的等間距數組,共100個數值
x = np.linspace(0, 10, 100)
y1 = np.sin(x)
y2 = np.cos(x)
y3 = np.tan(x)
y4 = np.exp(x / 10)# 創建2x2的子圖網格
fig, axs = plt.subplots(2, 2, figsize=(10, 8))# 在第一個子圖中繪制正弦曲線
axs[0, 0].plot(x, y1, label='sin(x)')
axs[0, 0].set_title('正弦曲線')
axs[0, 0].legend() #用于生成圖例# 在第二個子圖中繪制余弦曲線
axs[0, 1].plot(x, y2, label='cos(x)', color='r')
axs[0, 1].set_title('余弦曲線')
axs[0, 1].legend()# 在第三個子圖中繪制正切曲線
axs[1, 0].plot(x, y3, label='tan(x)', color='g')
axs[1, 0].set_title('正切曲線')
axs[1, 0].legend()# 在第四個子圖中繪制指數曲線
axs[1, 1].plot(x, y4, label='exp(x/10)', color='m')
axs[1, 1].set_title('指數曲線')
axs[1, 1].legend()# 自動調整布局
plt.tight_layout()# 顯示圖表
plt.show()
fig, axs = plt.subplots(2, 2, figsize=(10, 8)) 是 Matplotlib
庫中的一個函數調用,用于創建一個包含多個子圖(subplot)的圖形對象。這個函數返回兩個對象:
fig:這是一個 Figure 對象,表示整個圖形或畫布。你可以使用它來設置圖形的整體屬性,比如標題、大小等。
axs:這是一個包含多個 Axes 對象的數組。每個 Axes 對象代表一個子圖。在這個例子中,axs 是一個 2x2的數組,因此共有四個子圖。
- ③使用Echarts結合Python
-
使用Python進行數據處理:可以使用Pandas、NumPy等庫來處理和分析數據。
-
將處理后的數據轉換為JSON格式:ECharts支持JSON格式的數據輸入,因此需要將Python中的數據轉換為JSON格式。
-
使用ECharts生成圖表:在HTML文件中引入ECharts庫,并使用JavaScript代碼來加載和顯示圖表。
-
將Python和ECharts集成:可以通過Web框架(如Flask或Django)來集成Python和ECharts,或者使用Jupyter Notebook中的IPython顯示模塊來直接在Notebook中顯示ECharts圖表。