數據分析-Pandas數據如何圖示規律
數據分析和處理中,難免會遇到各種數據,那么數據呈現怎樣的規律呢?不管金融數據,風控數據,營銷數據等等,莫不如此。如何通過圖示展示數據的規律?
數據表,時間序列數據在數據分析建模中很常見,例如天氣預報,空氣狀態監測,股票交易等金融場景。數據分析過程中重新調整,重塑數據表是很重要的技巧,此處選擇Titanic數據,以及巴黎、倫敦歐洲城市空氣質量監測 N O 2 NO_2 NO2?數據作為樣例。
數據分析
數據分析-Pandas如何轉換產生新列
數據分析-Pandas如何統計數據概況
數據分析-Pandas如何輕松處理時間序列數據
數據分析-Pandas如何選擇數據子集
數據分析-Pandas如何重塑數據表-CSDN博客
經典算法
經典算法-遺傳算法的python實現
經典算法-模擬退火算法的python實現
經典算法-粒子群算法的python實現-CSDN博客
本文用到的樣例數據:
Titanic數據
樣例代碼:
源代碼參考 Pandas如何重塑數據表
源代碼參考 python數據分析-數據表讀寫到pandas
導入關鍵模塊
import pandas as pd
import numpy as np
import matplotlib.pyplot as pltplt.close("all")
畫圖有幾種方式:
1、使用matplotlib的 pyplot模塊
2、直接使用序列數據畫圖,實質上也是調用pyplot模塊
3、直接使用Dataframe數據畫圖,實質上也是調用pyplot模塊
探究序列數據展示
當使用的是序列數據時,如何把序列數據展示為曲線呢?
該例使用隨機生成數據來舉例,需要指定index,使用時間刻度。
# serial plot vs date time
np.random.seed(123456)ts = pd.Series(np.random.randn(1000), index=pd.date_range("1/1/2000", periods=1000))
ts = ts.cumsum()ts.plot()
plt.show()
plt.close("all")
當使用時間日期數據,其實調用的是 gcf().autofmt_xdate()
函數格式化x軸。
探究Dataframe數據展示
有時候使用的是dataframe數據類型,如何把dataframe數據展示為曲線呢?
這樣是可以一張圖同時畫出多列數據線集中展示,需要比較數據:
# dataframe plot 畫圖
df = pd.DataFrame(np.random.randn(1000, 4), index=ts.index, columns=list("ABCD"))df = df.cumsum()
df.plot();
plt.show()plt.close("all")
探究列之間的數據關系
有時候,Boss突發奇想,看看兩列的關系呢?如何展示?
當然除了都放在一張圖以外,還可以畫出兩列之間的關系,只要在plot函數指定x,y參數。
df3 = pd.DataFrame(np.random.randn(1000, 2), columns=["B", "C"]).cumsum()df3["A"] = pd.Series(list(range(len(df))))df3.plot(x="A", y="B");
以上代碼只是一個簡單示例,示例代碼中的表達式可以根據實際問題進行修改。
后面介紹下除了畫線以外的展示形式。
df.plot.area df.plot.barh df.plot.density df.plot.hist df.plot.line
df.plot.bar df.plot.box df.plot.hexbin df.plot.kde df.plot.pie
df.plot.scatter
覺得有用 收藏 收藏 收藏
點個贊 點個贊 點個贊
End
GPT專欄文章:
GPT實戰系列-ChatGLM3本地部署CUDA11+1080Ti+顯卡24G實戰方案
GPT實戰系列-LangChain + ChatGLM3構建天氣查詢助手
大模型查詢工具助手之股票免費查詢接口
GPT實戰系列-簡單聊聊LangChain
GPT實戰系列-大模型為我所用之借用ChatGLM3構建查詢助手
GPT實戰系列-P-Tuning本地化訓練ChatGLM2等LLM模型,到底做了什么?(二)
GPT實戰系列-P-Tuning本地化訓練ChatGLM2等LLM模型,到底做了什么?(一)
GPT實戰系列-ChatGLM2模型的微調訓練參數解讀
GPT實戰系列-如何用自己數據微調ChatGLM2模型訓練
GPT實戰系列-ChatGLM2部署Ubuntu+Cuda11+顯存24G實戰方案
GPT實戰系列-Baichuan2本地化部署實戰方案
GPT實戰系列-Baichuan2等大模型的計算精度與量化
GPT實戰系列-GPT訓練的Pretraining,SFT,Reward Modeling,RLHF
GPT實戰系列-探究GPT等大模型的文本生成-CSDN博客