【Python】進階學習:pandas--describe()函數的使用介紹

🐍【Python】進階學習:pandas——describe()函數的使用介紹
在這里插入圖片描述

🌈 個人主頁:高斯小哥
🔥 高質量專欄:Matplotlib之旅:零基礎精通數據可視化、Python基礎【高質量合集】、PyTorch零基礎入門教程👈 希望得到您的訂閱和支持~
💡 創作高質量博文(平均質量分92+),分享更多關于深度學習、PyTorch、Python領域的優質內容!(希望得到您的關注~)


🌵文章目錄🌵

  • 📊 一、初識`describe()`函數
  • 📈 二、`describe()`函數的基本用法
  • 🔍 三、定制`describe()`函數的輸出
  • 📊 四、`describe()`函數與數據可視化
  • 💡 五、深入理解統計指標
  • 📚 六、總結與進階學習
  • 🤝 七、期待與你共同進步

📊 一、初識describe()函數

??在數據分析和處理的過程中,我們經常需要了解數據的基本統計信息,如均值、標準差、最小值、最大值等。pandas庫中的describe()函數為我們提供了這樣的功能,它可以快速生成數據集的描述性統計信息。

📈 二、describe()函數的基本用法

??describe()函數是pandas庫中DataFrame和Series對象的一個方法,它默認返回以下統計信息:

  • count:非空值的數量
  • mean:平均值
  • std:標準差
  • min:最小值
  • 25%:第一四分位數(Q1)
  • 50%:第二四分位數(中位數,Q2)
  • 75%:第三四分位數(Q3)
  • max:最大值

使用示例:

import pandas as pd# 創建一個簡單的DataFrame
data = {'A': [1, 2, 3, 4, 5],'B': [5, 4, 3, 2, 1],'C': [10, 20, 30, 40, 50]
}
df = pd.DataFrame(data)# 使用describe()函數
description = df.describe()
print(description)

輸出:

              A         B          C
count  5.000000  5.000000   5.000000
mean   3.000000  3.000000  30.000000
std    1.581139  1.581139  15.811388
min    1.000000  1.000000  10.000000
25%    2.000000  2.000000  20.000000
50%    3.000000  3.000000  30.000000
75%    4.000000  4.000000  40.000000
max    5.000000  5.000000  50.000000

🔍 三、定制describe()函數的輸出

??describe()函數提供了多個參數,允許我們定制輸出的統計信息。

  • percentiles:指定要包括的其他百分位數,例如percentiles=[.25, .5, .75]將返回第一、第二和第三四分位數。
  • include:指定要包括的數據類型,默認為'all',可以設置為'all', 'nums', 或 'object'
  • exclude:指定要排除的數據類型。

使用示例:

import pandas as pd# 創建一個簡單的DataFrame
data = {'A': [1, 2, 3, 4, 5],'B': [5, 4, 3, 2, 1],'C': [10, 20, 30, 40, 50]
}
df = pd.DataFrame(data)# 使用describe()函數定制輸出
custom_description = df.describe(percentiles=[.30, .60, .90])
print(custom_description)

輸出:

              A         B          C
count  5.000000  5.000000   5.000000
mean   3.000000  3.000000  30.000000
std    1.581139  1.581139  15.811388
min    1.000000  1.000000  10.000000
30%    2.200000  2.200000  22.000000
50%    3.000000  3.000000  30.000000
60%    3.400000  3.400000  34.000000
90%    4.600000  4.600000  46.000000
max    5.000000  5.000000  50.000000

📊 四、describe()函數與數據可視化

??describe()函數輸出的統計信息經常與數據可視化結合使用,以更直觀地了解數據的分布。例如,我們可以使用matplotlib庫來繪制箱線圖(boxplot)。

使用示例:

import pandas as pd
from matplotlib import pyplot as plt# 創建一個簡單的DataFrame
data = {'A': [1, 2, 3, 4, 5],'B': [5, 4, 3, 2, 1],'C': [10, 20, 30, 40, 50]
}
df = pd.DataFrame(data)# 使用describe()函數定制輸出
custom_description = df.describe(percentiles=[.30, .60, .90])
print(custom_description)# 繪制箱線圖
df.boxplot()
plt.show()

效果展示:

在這里插入圖片描述

💡 五、深入理解統計指標

??了解describe()函數輸出的統計指標對于正確解讀數據至關重要。例如,標準差可以告訴我們數據集的離散程度,中位數則可以告訴我們數據集的中心趨勢,而不受極端值的影響。

📚 六、總結與進階學習

??describe()函數是pandas庫中非常實用的一個函數,它可以幫助我們快速了解數據集的基本統計信息。通過定制輸出、結合數據可視化以及深入理解統計指標,我們可以更好地分析和處理數據。在進階學習中,你還可以探索其他與describe()函數相關的統計方法和可視化工具,以提高你的數據處理和分析能力。

希望這篇博客能幫助你更好地理解和使用pandas中的describe()函數!🚀📈🔍

🤝 七、期待與你共同進步

??🌱 親愛的讀者,非常感謝你每一次的停留和閱讀!你的支持是我們前行的最大動力!🙏

??🌐 在這茫茫網海中,有你的關注,我們深感榮幸。你的每一次點贊👍、收藏🌟、評論💬和關注💖,都像是明燈一樣照亮我們前行的道路,給予我們無比的鼓舞和力量。🌟

??📚 我們會繼續努力,為你呈現更多精彩和有深度的內容。同時,我們非常歡迎你在評論區留下你的寶貴意見和建議,讓我們共同進步,共同成長!💬

??💪 無論你在編程的道路上遇到什么困難,都希望你能堅持下去,因為每一次的挫折都是通往成功的必經之路。我們期待與你一起書寫編程的精彩篇章! 🎉

??🌈 最后,再次感謝你的厚愛與支持!愿你在編程的道路上越走越遠,收獲滿滿的成就和喜悅!祝你編程愉快!🎉

本文來自互聯網用戶投稿,該文觀點僅代表作者本人,不代表本站立場。本站僅提供信息存儲空間服務,不擁有所有權,不承擔相關法律責任。
如若轉載,請注明出處:http://www.pswp.cn/news/719435.shtml
繁體地址,請注明出處:http://hk.pswp.cn/news/719435.shtml
英文地址,請注明出處:http://en.pswp.cn/news/719435.shtml

如若內容造成侵權/違法違規/事實不符,請聯系多彩編程網進行投訴反饋email:809451989@qq.com,一經查實,立即刪除!

相關文章

繪圖機器 - 華為OD統一考試(C卷)

OD統一考試(C卷) 分值: 100分 題解: Java / Python / C 題目描述 繪圖機器的繪圖筆初始位置在原點(0, 0),機器啟動后其繪圖筆按下面規則繪制直線: 1)嘗試沿著橫向坐標軸…

小程序海報生成海報【vue】

文章目錄 1、創建海報的基本邏輯2、用canvas繪制文字3、繪制矩形4、繪制圓形5、繪制圓角矩形6、繪制圖片7、執行繪制8、完整的代碼 1、創建海報的基本邏輯 1、先創建dom元素 wrapperHeight是根據海報的內容計算出來海報的高度 <view class"preview-card-wrap" ta…

支持向量機 SVM | 線性可分:硬間隔模型公式推導

目錄 一. SVM的優越性二. SVM算法推導小節概念 在開始講述SVM算法之前&#xff0c;我們先來看一段定義&#xff1a; 支持向量機(Support VecorMachine, SVM)本身是一個二元分類算法&#xff0c;支持線性分類和非線性分類的分類應用&#xff0c;同時通過OvR或者OvO的方式可以應用…

長貴對趙本山說:你需要我們家大腳,我立馬給你配雙大鞋!

長貴對趙本山說&#xff1a;你需要我們家大腳&#xff0c;我立馬給你配雙大鞋&#xff01; --小品《鄉村愛情》&#xff08;中2&#xff09;的臺詞 表演者&#xff1a;趙本山 于月仙 王小利 唐鑒軍等 &#xff08;接上&#xff09; 哈哈哈 伊拉克啊 這地方也不產這玩意吧 …

Chat GPT:AI聊天機器人的革命性突破!

一、引言 近年來&#xff0c;人工智能&#xff08;AI&#xff09;技術的發展日新月異&#xff0c;其中最具代表性的成果之一便是Chat GPT。這款基于自然語言處理&#xff08;NLP&#xff09;技術的聊天機器人&#xff0c;以其高度智能、靈活多變的特點&#xff0c;迅速吸引了全…

筆記74:在SLAM建圖過程中,為什么要使用【障礙物點云配準算法】和【里程計估算算法】結合的方法

僅使用【障礙物點云配準算法】&#xff0c;很容易導致在一條長通道中&#xff0c;因為前后兩幀的雷達點云圖過于相似&#xff0c;導致特征匹配一直完全重合&#xff0c;使得機器人建圖一直停留在原地&#xff0c;但實體機器人早就沿著通道跑向遠端了&#xff1b; 使用Hector_ma…

(學習日記)2024.03.02:UCOSIII第四節:創建任務

寫在前面&#xff1a; 由于時間的不足與學習的碎片化&#xff0c;寫博客變得有些奢侈。 但是對于記錄學習&#xff08;忘了以后能快速復習&#xff09;的渴望一天天變得強烈。 既然如此 不如以天為單位&#xff0c;以時間為順序&#xff0c;僅僅將博客當做一個知識學習的目錄&a…

js 精確計算(解決js四則運算精度缺失問題)

js的小數的運算&#xff0c;可能會得到一個不精確的結果&#xff0c;因為所有的運算都要轉換成二進制去計算&#xff0c;然而&#xff0c;二進制無法精確表示1/10。 var a 0.1 0.2; console.log(a); //打印結果&#xff1a;0.30000000000000004因此需要使用以下方法實現精確…

這是開玩笑嗎?加個工具,WPS與Excel表格變成了應用系統

表格處理數據簡單快捷&#xff0c;是個人用戶的首選。然而&#xff0c;當企業長期使用&#xff0c;成本表、客戶表、銷售表等堆積如山&#xff0c;尋找所需表格如同大海撈針&#xff0c;稍有不慎便可能導致數據丟失、混亂。即便使用WPS和Excel這樣的表格軟件&#xff0c;處理大…

代碼隨想錄算法訓練營第三十六天 | LeeCode 435. 無重疊區間 ,763.劃分字母區間 , 56. 合并區間

435. 無重疊區間 - 力扣&#xff08;LeetCode&#xff09; class Solution { private:static bool cmp(const vector<int> &a,const vector<int> &b){if(a[0]b[0]) return a[1]<b[1];return a[0]<b[0];} public:int eraseOverlapIntervals(vector&l…

C#進階高級語法之LINQ:查詢操作的便利性與效率提升

引言&#xff1a; 在C#編程中&#xff0c;LINQ&#xff08;Language-Integrated Query&#xff09;是一種強大的查詢語言&#xff0c;它被集成在.NET框架中&#xff0c;允許開發者對各種數據源進行查詢和操作。LINQ的出現&#xff0c;極大地提升了C#在數據處理方面的能力&#…

回溯難題(算法村第十八關黃金挑戰)

復原 IP 地址 93. 復原 IP 地址 - 力扣&#xff08;LeetCode&#xff09; 有效 IP 地址 正好由四個整數&#xff08;每個整數位于 0 到 255 之間組成&#xff0c;且不能含有前導 0&#xff09;&#xff0c;整數之間用 . 分隔。 例如&#xff1a;"0.1.2.201" 和 &q…

IDEA中使用git提交代碼時,有.class文件怎么避免

在IDEA中使用git提交代碼時&#xff0c;git把.class文件都給我放進來了&#xff0c;而我并不想要提交.class文件 我要提交的是.java文件 應該怎么設置呢 解決方案&#xff0c;點擊整個項目的生命周期中的clean之前&#xff0c;你會發現git提交欄的.class文件都不見了。

常用LDO型號

常用LDO型號 常用LDO型號-國產&進口 常用的LDO&#xff08;低壓差線性穩壓器&#xff09;型號有以下這些&#xff1a; LM2937及LM2937-N&#xff1a;這兩款是TI&#xff08;德州儀器&#xff09;的產品&#xff0c;其中LM2937-N為低噪聲版本&#xff0c;適用于對噪聲敏感…

vue是如何監聽對象和數組變化的

Vue框架通過其響應式系統來監聽對象和數組的變化。這個系統的核心在于追蹤依賴關系&#xff0c;并在數據變化時通知所有依賴于該數據的觀察者。 1. 對象監聽 Vue使用Object.defineProperty方法來劫持各個屬性的getter和setter。當組件中的數據被讀取時&#xff0c;會觸發gette…

ROS2服務通信的實現

文章目錄 1.服務通信的概念及應用場景1.1概念1.2 應用場景 2.準備工作3.服務通信的實現3.1 服務通信接口消息3.2 服務端實現3.3 客戶端實現3.4 編譯及運行3.4.1 修改CMakeLists3.4.2 服務端運行結果3.4.2 客戶端運行結果 1.服務通信的概念及應用場景 1.1概念 服務通信也是ROS…

抖店0元入駐不交錢會怎么樣?個人店和個體店的利弊分析,開店必看

我是王路飛。 現在的抖店是可以開通個人店的。 也就是不需要營業執照、直接使用個人身份證就可以在抖音開店&#xff0c;而且也不需要繳納店鋪保證金就能開店運營了。 但真實情況是怎么樣的呢&#xff1f;新手0元入駐抖店不交這個保證金會怎么樣呢&#xff1f; 今天給想在抖…

AI大預言模型——ChatGPT在地學、GIS、氣象、農業、生態、環境應用

原文鏈接&#xff1a;AI大預言模型——ChatGPT在地學、GIS、氣象、農業、生態、環境應用 一開啟大模型 1 開啟大模型 1)大模型的發展歷程與最新功能 2)大模型的強大功能與應用場景 3)國內外經典大模型&#xff08;ChatGPT、LLaMA、Gemini、DALLE、Midjourney、Stable Diff…

ios App 發送廣播失敗解決

記錄開發 ios App 使用 c 混編時遇到的問題&#xff1a; 開發環境 macOS Sonoma&#xff08;最新版本14.3.1&#xff09; Xcode Version 15.2 ipadOS&#xff08;最新版本17.3.1&#xff09; 問題&#xff1a;在mac 上 和 ipad上測試&#xff0c;當 udp 發送廣播&#xff…

跨域引起的兩個接口的session_id不是同一個

來源場景&#xff1a; RequestMapping(“/captcha”)接口設置了SESSION_KEY&#xff0c;也能獲取到&#xff0c;但是到了PostMapping(“/login”)接口就是空的&#xff0c;由于跨域導致的兩個session_id不是同一個 /*** 系統用戶 前端控制器*/ Controller CrossOrigin(origins…