數據分析-Pandas數據的直方圖探查

數據分析-Pandas數據的直方圖探查

數據分析和處理中,難免會遇到各種數據,那么數據呈現怎樣的規律呢?不管金融數據,風控數據,營銷數據等等,莫不如此。如何通過圖示展示數據的規律?

數據表,時間序列數據在數據分析建模中很常見,例如天氣預報,空氣狀態監測,股票交易等金融場景。數據分析過程中重新調整,重塑數據表是很重要的技巧,此處選擇Titanic數據,以及巴黎、倫敦歐洲城市空氣質量監測 N O 2 NO_2 NO2?數據作為樣例。

數據分析

數據分析-Pandas如何轉換產生新列

數據分析-Pandas如何統計數據概況

數據分析-Pandas如何輕松處理時間序列數據

數據分析-Pandas如何選擇數據子集

數據分析-Pandas如何重塑數據表-CSDN博客

經典算法

經典算法-遺傳算法的python實現

經典算法-模擬退火算法的python實現

經典算法-粒子群算法的python實現-CSDN博客

本文用到的樣例數據:

Titanic數據

空氣質量監測 N O 2 NO_2 NO2?數據

樣例代碼:

源代碼參考 Pandas如何重塑數據表

源代碼參考 python數據分析-數據表讀寫到pandas

導入關鍵模塊

import pandas as pd
import numpy as np
import matplotlib.pyplot as pltplt.close("all")

很多時候數據的比例總和能否為1,有可能不成立,比如它們如果是不同的屬性,那是沒有辦法的。但是又需要探查哪個屬性的出行頻度,比例關系,這時候可以試試直方圖。它是不同數值的出現頻度,也就是計數,或者計數的比例關系。

探究數據的數值頻度關系

直方圖在圖像處理中很常見,查看像素的亮度數值,如何把數值的分布展示呢?比如,想知道一幅圖像的亮度的數值多少和比例。

該例使用隨機生成數據來舉例。

np.random.seed(36)df4 = pd.DataFrame({"a": np.random.randn(1000) + 1,"b": np.random.randn(1000),"c": np.random.randn(1000) - 1,},columns=["a", "b", "c"],
)plt.figure();
df4.plot.hist(alpha=0.5);

在這里插入圖片描述

多組直方圖堆疊關系

各列數值的和是統計對象,但是各列其實是分類的分組,例如醫學里面的常見藥物效果對照,一組是服藥,一組是安慰劑,想查看它們之間的關系,需要在一幅圖展示,怎么辦?

當然,只需要設定參數 stacked=True,此處為了更多細節,設置了bins參數

plt.figure();df4.plot.hist(stacked=True, bins=20);

在這里插入圖片描述

累積直方圖

累積直方圖就是小于該數值的數量都累加,最后的數值為總量,如果是比例關系的話,就是1.0。

只要設置 cumulative參數就行,當然,如果需要躺平,也可以設置方向參數orientation。

plt.figure();df4["a"].plot.hist( cumulative=True);plt.figure();df4["a"].plot.hist(orientation="horizontal", cumulative=True);

在這里插入圖片描述
在這里插入圖片描述

多列直方圖

df4 = pd.DataFrame({"a": np.random.randn(1000) + 1,"b": np.random.randn(1000),"c": np.random.randn(1000) - 1,"d": np.random.randn(1000) + 2,},columns=["a", "b", "c", "d"],
)df4.diff().hist(color="k", alpha=0.5, bins=50);

在這里插入圖片描述

分組直方圖

data = pd.Series(np.random.randn(1000))
data.hist(by=np.random.randint(0, 4, 1000), alpha=0.5, bins=20, figsize=(6, 4));

在這里插入圖片描述

data = pd.DataFrame({"a": np.random.choice(["x", "y", "z"], 1000),"b": np.random.choice(["e", "f", "g"], 1000),"c": np.random.randn(1000),"d": np.random.randn(1000) - 1,},
)
data.plot.hist(by=["a", "b"], alpha=0.5, bins=20, figsize=(10, 10));

在這里插入圖片描述

以上代碼只是一個簡單示例,示例代碼中的表達式可以根據實際問題進行修改。

后面介紹下其他的展示形式。

df.plot.area     df.plot.barh     df.plot.density  df.plot.hist     df.plot.line 
df.plot.bar      df.plot.box      df.plot.hexbin   df.plot.kde      df.plot.pie
df.plot.scatter

覺得有用 收藏 收藏 收藏

點個贊 點個贊 點個贊

End

GPT專欄文章:

GPT實戰系列-ChatGLM3本地部署CUDA11+1080Ti+顯卡24G實戰方案

GPT實戰系列-LangChain + ChatGLM3構建天氣查詢助手

大模型查詢工具助手之股票免費查詢接口

GPT實戰系列-簡單聊聊LangChain

GPT實戰系列-大模型為我所用之借用ChatGLM3構建查詢助手

GPT實戰系列-P-Tuning本地化訓練ChatGLM2等LLM模型,到底做了什么?(二)

GPT實戰系列-P-Tuning本地化訓練ChatGLM2等LLM模型,到底做了什么?(一)

GPT實戰系列-ChatGLM2模型的微調訓練參數解讀

GPT實戰系列-如何用自己數據微調ChatGLM2模型訓練

GPT實戰系列-ChatGLM2部署Ubuntu+Cuda11+顯存24G實戰方案

GPT實戰系列-Baichuan2本地化部署實戰方案

GPT實戰系列-Baichuan2等大模型的計算精度與量化

GPT實戰系列-GPT訓練的Pretraining,SFT,Reward Modeling,RLHF

GPT實戰系列-探究GPT等大模型的文本生成-CSDN博客

本文來自互聯網用戶投稿,該文觀點僅代表作者本人,不代表本站立場。本站僅提供信息存儲空間服務,不擁有所有權,不承擔相關法律責任。
如若轉載,請注明出處:http://www.pswp.cn/news/715178.shtml
繁體地址,請注明出處:http://hk.pswp.cn/news/715178.shtml
英文地址,請注明出處:http://en.pswp.cn/news/715178.shtml

如若內容造成侵權/違法違規/事實不符,請聯系多彩編程網進行投訴反饋email:809451989@qq.com,一經查實,立即刪除!

相關文章

農產品質量追溯系統—功能介紹(2)

儲藏管理 儲藏信息管理對需要儲藏的農產品,記錄儲藏的相關信息,如儲藏開始時間、存放倉庫、操作人員、儲藏原因等; 倉庫信息管理物流管理 物流公司管理對相關的物流公司信息進行登記,以便于管理和追溯; 車輛管理

我的秋招數據分析崗面經分享(京東,美團,阿里,拼多多,vivo,滴滴)

節前,我們社群組織了一場技術&面試討論會,邀請了一些互聯網大廠同學、參加社招和校招面試的同學,針對新手如何入門數據分析、機器學習算法、該如何備戰面試、面試常考點分享等熱門話題進行了深入的討論。 基于社群的討論,今天…

力扣爆刷第84天之hot100五連刷6-10

力扣爆刷第84天之hot100五連刷6-10 文章目錄 力扣爆刷第84天之hot100五連刷6-10一、15. 三數之和二、42. 接雨水三、3. 無重復字符的最長子串四、438. 找到字符串中所有字母異位詞五、560. 和為 K 的子數組 一、15. 三數之和 題目鏈接:https://leetcode.cn/problem…

JAVA學習筆記13(位運算)

1.位運算 1.1 原碼、反碼、補碼 ? *規則: ? 1.二進制的最高位是符號位:0表示正數,1表示負數 ? 2.正數的原碼,反碼,補碼都一樣(三碼合一) ? 3.負數的反碼 他的原碼符號位不變&#xff…

從metashape導出深度圖,從深度圖恢復密集點云

從metashape導出深度圖,從深度圖恢復密集點云 1.從metashape導出深度圖 參考:https://blog.csdn.net/WHU_StudentZhong/article/details/123107072?spm1001.2014.3001.5502 2.從深度圖建立密集點云 首先從metashape導出blockExchange格式的xml文件&…

OpenHarmony、HarmonyOS打開編輯 PDF 等操作的三方組件使用教程

項目場景: 隨著數字化時代的發展,PDF 文檔成為廣泛應用于各行業的重要文件格式。為了提高OpenHarmony/HarmonyOS生態系統的功能性和用戶體驗,我們需要一款支持打開、編輯PDF文件的應用程序。 使用戶能夠輕松打開、瀏覽和編輯PDF文件。該應用將充分利用OpenHarmony/HarmonyO…

【NTN 衛星通信】衛星和無人機配合的應用場景

1 場景概述 衛星接入網是一種有潛力的技術,可以為地面覆蓋差地區的用戶提供無處不在的網絡服務。然而,衛星覆蓋范圍對于位于考古或采礦地點內部/被茂密森林覆蓋的村莊/山谷/靠近山丘或大型建筑物的用戶可能很稀疏。因此,涉及衛星接入和無人駕…

HarmonyOS Full SDK的安裝

OpenHarmony的應用開發工具HUAWEI DevEco Studio現在隨著OpenHarmony版本發布而發布,只能在版本發布說明中下載,例如最新版本的OpenHarmony 4.0 Release。對應的需要下載DevEco Studio 4.0 Release,如下圖。 圖片 下載Full SDK主要有兩種方式,一種是通過DevEco Studio下載…

教你用Fiddler捕獲HTTPS請求

安裝Fiddler 這里不特別說明了,網上搜索一大把,根據安裝引導一步步安裝即可。(這里采用的是fiddler v4.6) 配置Fiddler 1、打開fiddler配置Tools –>Telerik Fiddler Options。 2、打開HTTPS配置項,勾選“Captur…

【程序員養生延壽系列-萬人關注的養生指南 4 】

1.早起一杯溫水,疏通腸胃,補充水分。 2.早十點和下午三點左右活動活動身體(運動or健身),放松緊張疲憊的身體,幫助消化,給身體透個氣。 3.每天散步,好處多多(減肥健身&a…

ctf_show筆記篇(web入門---爆破)

爆破 21:直接bp抓包跑字典,需base64加密 22:可用工具跑也可用瀏覽器找還可以用網上做好的域名查找去找 23:此題需跑腳本已經附上自寫腳本 最后跑出來六個答案一個一個嘗試得到答案為3j import hashlibm "0123456789qwert…

C++_AVL樹

目錄 1、AVL的概念 2、平衡因子的調整概念 3、AVL樹的插入 3.1 調整平衡因子代碼實現 3.2 右旋操作 3.2 左旋操作 3.3 雙旋-先右旋再左旋 3.4 雙旋-先左旋再右旋 3.5 旋轉操作的小結 4、AVL的驗證與實現 結語 前言: 在C中,AVL樹是在二叉搜索…

2024中國眼博會,山東省眼科醫學技術交流大會

以展帶會,以會促展,展與會有機結合,立足山東打造具全國影響力的眼康產業發展盛會; ——隨著時代的高速發展,科技的進步,現代生活節奏的加快,青少年近視問題日益嚴重,對兒童青少年的…

舊的Spring Security OAuth已停止維護,全面擁抱新解決方案Spring SAS

Spring Authorization Server 替換 Shiro 指引 背景 Spring 團隊正式宣布 Spring Security OAuth 停止維護,該項目將不會再進行任何的迭代 目前 Spring 生態中的 OAuth2 授權服務器是 Spring Authorization Server 已經可以正式生產使用作為 SpringBoot 3.0 的最新…

如何使用naive 做一個模態框的方式

1.我的問題使用了一個table 表格&#xff0c;在表格中設置倆個按鈕 最后做出來的效果 <template><div><h1>測試文件</h1><!-- 表格 --><n-data-table :columns"columns" :data"data" :pagination"pagination" …

Linux內核隊列queue.h

文章目錄 一、簡介二、SLIST單向無尾鏈表2.1 介紹2.2 操作2.3 例子 三、STAILQ單向有尾鏈表四、LIST雙向無尾鏈表五、TAILQ雙向有尾鏈表六、CIRCLEQ循環鏈表七、queue源碼參考 一、簡介 queue.h是一個非常經典的文件&#xff0c;定義了一系列宏的操作&#xff0c;它定義了一系…

筆記72:關于IMU(慣性測量單元)傳感器的作用【不涉及公式推導】

一、IMU傳感器是什么&#xff1a; 慣性測量單元IMU&#xff08;Inertial Measurement Unit&#xff09;是一種使用【加速度計】和【陀螺儀】來測量【物體三軸姿態角&#xff08;空間姿態&#xff09;】的裝置&#xff1b;IMU在坐標系的每個坐標軸上&#xff0c;均安裝有1個陀螺…

90-子集2(回溯算法)

題目 給你一個整數數組 nums &#xff0c;其中可能包含重復元素&#xff0c;請你返回該數組所有可能的子集&#xff08;冪集&#xff09;。 解集 不能 包含重復的子集。返回的解集中&#xff0c;子集可以按 任意順序 排列。 示例 1&#xff1a; 輸入&#xff1a;nums [1,2,2] …

深入理解CSS常見選擇器

標題&#xff1a;深入理解CSS常見選擇器 在CSS中&#xff0c;選擇器是一種強大的工具&#xff0c;用于定位和樣式化HTML文檔中的元素。通過選擇器的靈活運用&#xff0c;我們能夠精準地選擇需要操作的元素&#xff0c;從而實現豐富多彩的頁面布局和設計。本文將重點介紹常見的…

Vue2:用node+express部署Vue項目

一、編譯項目 命令 npm run build執行命令后&#xff0c;我們會在項目文件夾中看到如下生成的文件 二、部署Vue項目 接上一篇&#xff0c;nodeexpress編寫輕量級服務 1、在demo中創建static文件夾 2、將dist目錄中的文件放入static中 3、修改server.js文件 關鍵配置&…