python 40位的數減個位數_Python數據分析入門教程(五):數據運算

3e40c5b0b12f2bdb347f41526f853fcf.png
作者 | CDA數據分析師

進行到這一步就可以算是開始正式的烹飪了,在這部分之前的數據操作部分我們列舉了一些不同維度的分析指標,這一章我們主要看看這些指標都是怎么計算出來的。

一、算術運算

算術運算就是基本的加減乘除,在Excel或者Python中數值類型的任意兩列可以直接進行加、減、乘、除運算,Excel中的算術運算比較簡單,這里就不展開了,下面主要介紹Python中的算術運算。

兩列相加的具體實現如下圖所示:

586a2017ed87512f2e422b85db4c3c38.png

兩列相減的具體實現如下圖所示:

0a072cefae44c2a6ba00d3e5c7b2e270.png

兩列相乘的具體實現如下圖所示:

b413ba44f0a633fdd1076f7ff5c61c18.png

兩列相除的具體實現如下圖所示:

4f5e3ca70999e4ac1c5ea2dd69e26bc1.png

任意一列加/減一個常數值,這一列中的所有值都加/減這個常數值,具體實現如下圖所示:

d2c9a79292d19f7106dcce0f0e033978.png

任意一列乘/除一個常數值,這一列中的所有值都乘/除這個常數值,具體實現如下圖所示:

356bbcac85663a9422672bc0358824f0.png

二、比較運算

比較運算和Python基礎知識中講到的比較運算一致,也是常規的大于、等于、小于之類的,只不過這里的比較是在列與列之間進行的。

在Excel中列與列之間的比較運算和Python中的方法一致,例子如下圖所示。

37d1683b082ed32f66f3d704d90a5eff.png

下面是一些Python中列與列之間比較的例子。

41ccafb7b734a33b3a92926312ba5c87.png

93535dd71a0a3608919f86c89ef13fa4.png

三、匯總運算

上面講到的算術運算和比較運算都是在列與列之間進行的,運算結果是有多少行的值就會返回多少個結果,而匯總運算是將數據進行匯總返回一個匯總以后的結果值。

1、count非空值計數

非空值計數就是計算某一個區域中非空(單元格)數值的個數。

在Excel中counta()函數用于計算某個區域中非空單元格的個數。與counta()函數類似的一個函數是count()函數,它用于計算某個區域中含有數字的單元格的個數。

在 Python 中,直接在整個數據表上調用 count()函數,返回的結果為該數據表中每列的非空值的個數,具體實現如下所示。

2c138e21ef90580e19580cdd620aa7c9.png

count()函數默認是求取每一列的非空數值的個數,可以通過修改axis參數讓其等于1,來求取每一行的非空數值的個數。

e0a339a0224e3fc235d19d6f208c5b71.png

也可以把某一列或者某一行索引出來,單獨查看這一列或這一行的非空值個數。

ce93a9b297b39e486e95ab3c32d924b4.png

2、sum求和

求和就是對某一區域中的所有數值進行加和操作。

在 Excel 中要求取某一區域的和,直接在 sum()函數后面的括號中指明要求和的區域,即要對哪些值進行求和操作即可。例子如下所示。

fd08a4fb5e1b575ed3b22c51f16bde8d.png

在Python中,直接在整個數據表上調用sum()函數,返回的是該數據表每一列的求和結果,例子如下所示。

e4146499e7993001a25a16fba113bc21.png

sum()函數默認對每一列進行求和,可通過修改axis參數,讓其等于1,來對每一行的數值進行求和操作。

3c3ce9dfd757091b7c8ff978e8426ca5.png

也可以把某一列或者某一行索引出來,單獨對這一列或這一行數據進行求和操作。

945e5ecef22e74f890ca41525ce5d91a.png

3、 mean求均值

求均值是針對某一區域中的所有值進行求算術平均值運算。均值是用來衡量數據一般情況的指標,容易受到極大值、極小值的影響。

在Excel中對某個區域內的值進行求平均值運算,用的是average()函數,只要在average()函數中指明要求均值運算的區域即可,比如:

c87a96378c2d1f816698039a3019e55d.png

在Python中的求均值利用的是mean()函數,如果對整個表直接調用mean()函數,返回的是該表中每一列的均值。

9935743b618f92c7e408fe825b054f4b.png

mean()函數默認是對數據表中的每一列進行求均值運算,可通過修改 axis 參數,讓其等于1,來對每一行進行求均值運算。

fbb7c86b5579333e0f03528a89b2f5c1.png

也可以把某一列或者某一行通過索引的方式取出來,然后在這一行或這一列上調用mean()函數,單獨求取這一行或這一列的均值。

b4a3f7ede2283769e36e9d6af4bc5946.png

4、 max求最大值

求最大值就是比較一組數據中所有數值的大小,然后返回最大的一個值。

在Excel和Python中,求最大值使用的都是max()函數,在Excel中同樣只需要在max()函數中指明要求最大值的區域即可;在Python中,和其他函數一樣,如果對整個表直接調用max()函數,則返回該數據表中每一列的最大值。max()函數也可以對每一行求最大值,還可以單獨對某一行或某一列求最大值。

95dca1bbc00b54e901f28b0710daae7b.png

3b579f0e39af8930f24457f07cf66635.png

5、min求最小值

求最小值與求最大值是相對應的,通過比較一組數據中所有數值的大小,然后返回最小的那個值。

在Excel和Python中都使用min()函數來求最小值,它的使用方法與求最大值的類似,這里不再贅述。示例代碼如下。

e0e0d249ec5ddc6082517bcb47a476af.png

6、 median求中位數

中位數就是將一組含有n個數據的序列X按從小到大排列,位于中間位置的那個數。

中位數是以中間位置的數來反映數據的一般情況,不容易受到極大值、極小值的影響,因而在反映數據分布情況上要比平均值更有代表性。

現有序列為X:{X1、X2、X3、......、Xn}。

如果n為奇數,則中位數:

3c9746bce8cb0a539bdd561d97ebb236.png

如果n為偶數,則中位數:

1c7c049264cdad968d4e774748481b94.png

例如,1、3、5、7、9的中位數為5,而1、3、5、7的中位數為(3+5)/2=4。

在Excel和Python中求一組數據的中位數,都是使用median()函數來實現的。

下面為在Excel中求中位數的示例:

d99bf55a0e6fbbe17fb2e41b133ef313.png

在Python中,median()函數的使用原則和其他函數的一致。

7900ba5428ea0b15b241ec7afdace1a6.png

7、mode求眾數

顧名思義,眾數就是一組數據中出現次數最多的數,求眾數就是返回這組數據中出現次數最多的那個數。

在Excel和Python中求眾數都使用mode()函數,使用原則與其他函數完全一致。

在Excel中求眾數的示例如下:

8896e73ed4b0fcc9af78625fd9c72cde.png

在Python中求眾數的示例如下:

d316f2687c566587dcc705b62fa73238.png

9df6d86ea4a92538d11941203b95c294.png

8、var求方差

方差是用來衡量一組數據的離散程度(即數據波動幅度)的。

在Excel和Python中求一組數據中的方差都使用var()函數。

下面為在Excel中求方差的示例:

d2cabdb59f202cc4dea21fc861790818.png

在Python中,var()函數的使用原則和其他函數的一致。

ee26ad2a2a35007b8c4c52d311601d1a.png

9、std求標準差

標準差是方差的平方根,二者都是用來表示數據的離散程度的。

在Excel中計算標準差使用的是stdevp()函數,示例如下:

7653d8cd35bed5450f39016ce7612579.png

在Python中計算標準差使用的是std()函數,std()函數的使用原則與其他函數的一致,示例如下:

b4c743e937fbe487f8459a7ee1e6d8a1.png

10、quantile求分位數

分位數是比中位數更加詳細的基于位置的指標,分位數主要有四分之一分位數、四分之二分位數、四分之三分位數,而四分之二分位數就是中位數。

在Excel中求分位數用的是percentile()函數,示例如下:

272053bac19f973b318ae71996685b20.png

在Python中求分位數用的是quantile()函數,要在quantile后的括號中指明要求取的分位數值,quantile()函數與其他函數的使用規則相同。

5b43fdcb9906687a909ae85f04fdaba3.png

0bf0720c7ceff8f462a880ee7e5cb95b.png

四、相關性運算

相關性常用來衡量兩個事物之間的相關程度,比如我們前面舉的例子:啤酒與尿布二者的相關性很強。我們一般用相關系數來衡量兩者的相關程度,所以相關性計算其實就是計算相關系數,比較常用的是皮爾遜相關系數。

在Excel中求取相關系數用的是correl()函數,示例如下:

603fdee4629b4cd694ebfeb5af7cda6b.png

在Python中求取相關系數用的是corr()函數,示例如下:

2cdd039e2f0809a165d83c4704b8691e.png

還可以利用 corr()函數求取整個 DataFrame 表中各字段兩兩之間的相關性,示例如下:

d6d2aa6c8ce2e019f9152f38a5bb03d4.png

2a9b82da64cef093c90b06d14129120b.png

更多干貨內容陸續分享給大家,請持續關注我們吧!可前往:大數據AI時代,所有職場人都在高薪奔跑,您怎能OUT?

11b2d7142e0be93ad40776316cb8d634.png

9924fb9d1cf226011846f96ce5ed5cbb.png

本文來自互聯網用戶投稿,該文觀點僅代表作者本人,不代表本站立場。本站僅提供信息存儲空間服務,不擁有所有權,不承擔相關法律責任。
如若轉載,請注明出處:http://www.pswp.cn/news/537282.shtml
繁體地址,請注明出處:http://hk.pswp.cn/news/537282.shtml
英文地址,請注明出處:http://en.pswp.cn/news/537282.shtml

如若內容造成侵權/違法違規/事實不符,請聯系多彩編程網進行投訴反饋email:809451989@qq.com,一經查實,立即刪除!

相關文章

數字化改革“152”體系詳解

架構圖 “1” 即一體化智能化公共數據平臺(平臺大腦),按照“統一規劃、統一支撐、統一架構、統一平臺、統一標準、統一建設、統一管理、統一運維"的要求,建設省市縣三級公共數據平臺,疊加三級“大腦功能&#xf…

數字化改革“141”體系

縣級以上是“152”大框架,縣以下是“141”體系。 141體系是:縣級社會治理中心、鄉鎮(街道)基層治理“四個平臺”、村社網格。 “1” 第一個“1”指縣級社會治理中心。 “4” 第二個“4”指鄉鎮(街道)基…

spring boot——MockMvc的用法

1.pom配置 <dependency><groupId>org.springframework.boot</groupId><artifactId>spring-boot-starter-test</artifactId> </dependency> 2.所需對象及Controller public class User {private String id;private String username;private…

python一元加號_Python一元方程解算系統(需要Sympy庫支持)

解算案例本文為實現python一元方程解算的源碼案例(后續不定期更新)# -*- coding: UTF-8 -*-from sympy import *#設置一些可能拋出的異常def Warn(type):if type "missEquater":print "You missed the euqater!"elif type "excessiveEquater":…

接口做的好怎么形容_淘寶直播預告怎么做才合格?如何做好?

很多淘寶商家在直播前沒有做淘寶直播預告&#xff0c;或者不知道怎么去做直播預告&#xff0c;這對直播的效果會有很大的影響&#xff0c;那么直播前如何做好直播預告呢?怎樣的直播預告才是合格的&#xff0c;下面來了解一下。1.必須去淘寶直播中控臺發布。因為手機上發布目前…

“1+7+N”改革工作體系介紹

2021年&#xff0c;浙江省確定了“17N”的改革工作體系&#xff0c;要求以全面深化改革新成效再創體制機制新優勢。&#xff08;2022年已經升級為“1612N”&#xff0c;點擊閱讀&#xff09; “1” 數字化改革&#xff0c;這是浙江全面深化改革的總抓手。將聚焦打造全球數字變…

傻傻分不清的javascript運行機制

學習到javascript的運行機制時&#xff0c;有幾個概念經常出現在各種文章中且容易混淆。Execution Context(執行環境或執行上下文)&#xff0c;Context Stack (執行棧)&#xff0c;Variable Object(VO: 變量對象)&#xff0c;Active Object(AO: 活動對象)&#xff0c;LexicalEn…

浙江省數字化改革回顧(2022年5月)

事業的偉大在于目標的壯麗&#xff0c;也在于過程的壯麗&#xff1b;改革的成果在于享有的豐富&#xff0c;也在于經歷的豐富。2021年2月18日&#xff0c;春節假期后首個工作日&#xff0c;浙江省委召開全省數字化改革大會&#xff0c;在全國率先開啟數字化改革探索實踐。此后&…

python 某個數是不是在某個范圍內_教寫一個簡單的python小程序(04)

點擊藍字關注我們 會酸的柚子Python愛好者搞機少年七夕結束了~酸柚也是被強塞了滿嘴的狗糧在這樣充滿戀愛腐朽氣息的一天酸柚也是馬不停蹄的在趕稿子兄弟們&#xff0c;給我頂起來呀~我們來看看今日的題目可能很多小伙伴對完全平方數這個概念有點生疏了完全平方數數學上&#x…

Python:模塊module

python中一個模塊就是一個擴展名為.py的文件&#xff0c;也可能是預編譯的.pyc文件。 引入模塊用&#xff1a;import 模塊名 使用引用模塊中定義的標識符&#xff08;函數、變量、類&#xff09;用&#xff1a;模塊名.標識符名 引入模塊中的標識符用&#xff1a;from 模塊名 im…

浙江公布2022年數字化改革“最系列“成果 評選出最佳應用104項

10月29日&#xff0c;省委改革辦&#xff08;省數改辦&#xff09;公布了2022年數字化改革“最系列”成果。該評選由省委改革辦&#xff08;省數改辦&#xff09;會同省委政研室、省人大常委會法工委、省市場監管局和省大數據局共同開展&#xff0c;評選了最佳應用104項、最強大…

dot net core 使用 IPC 進程通信

原文:dot net core 使用 IPC 進程通信版權聲明&#xff1a;博客已遷移到 http://lindexi.gitee.io 歡迎訪問。如果當前博客圖片看不到&#xff0c;請到 http://lindexi.gitee.io 訪問博客。本文地址 https://blog.csdn.net/lindexi_gd/article/details/79946496 dot net core 使…

python可變類型和不可變深淺拷貝類型_python3筆記十四:python可變與不可變數據類型+深淺拷貝...

一&#xff1a;學習內容python3中六種數據類型python賦值python淺拷貝python深拷貝二&#xff1a;python3六種數據類型1.六種數據類型Number(數字)string(字符串)List(列表)Tuple(元祖)Set(集合)Dictionary(字典)2.六種數據類型分類不可變數據(3個)&#xff1a;Number、String、…

Android手機用wifi連接adb調試的方法

https://www.jianshu.com/p/dc6898380e38 0x0 前言 Android開發肯定要連接pc的adb進行調試&#xff0c;傳統的方法是用usb與pc進行連接&#xff0c;操作簡單即插即用&#xff0c;缺點是pc上必須得有對應手機的usb驅動程序&#xff0c;對于谷歌親兒子系列和三星摩托等外國品牌而…

控制臺應用程序換換為窗體應用_Epic為開發者設計了一套iPhone使用的運動捕捉應用程序...

玩懂手機網7月13日資訊&#xff0c;我們都知道對于游戲或者是動漫開發者來說&#xff0c;運動捕捉設備是一套非常昂貴的設備&#xff0c;需要非常專業的獨立開發人員&#xff0c;大量的時間才能完成&#xff0c;最近Epic為開發者設計了一套iPhone使用的運動捕捉應用程序。這套i…

螞蟻金服億級并發下的移動端到端網絡接入架構解析

為了與金融從業者、科技從業者共同探討金融 業務的深層次問題&#xff0c;螞蟻金服聯手 TGO 鯤鵬會上海分會&#xff0c;在 12 月 8 日舉辦了「走進螞蟻金服&#xff1a;雙十一背后的螞蟻金服技術支持」活動。螞蟻金服高級技術專家賈島為大家分享了《億級并發下的螞蟻移動端到…

python3.12答案_編程常見問題

通常&#xff0c;不要使用 from modulename import * 。這樣做會使導入器的命名空間變得混亂&#xff0c;并且使得連接器更難以檢測未定義的名稱。在文件的頂部導入模塊。這樣做可以清楚地了解代碼所需的其他模塊&#xff0c;并避免了模塊名稱是否在范圍內的問題。每行導入一個…

如何根據視頻的寬屏與豎屏來排序?

原理 寬屏與豎屏是根據 幀高度 與 幀寬度 來區分的 幀高度就是圖片高度&#xff08;縱向的像素尺寸&#xff09;&#xff0c;幀寬度就是圖片寬度&#xff08;橫向的像素尺寸&#xff09;&#xff0c;分辨率就是&#xff08;高度x寬度&#xff09;。 windows11的文件排序&…

HashiCorp Vault 1.0開源自動解封特性,新增Batch令牌

HashiCorp發布了其秘密管理工具Vault 的1.0版本&#xff0c;并開源了在發生故障或重啟后繼續使用Vault服務器所需的“自動解封&#xff08;auto-unseal&#xff09;”特性。這個版本提供了一種可以用于臨時工作負載的新令牌batch。另一個新特性是&#xff0c;Kubernetes auth現…

sap模塊介紹_小邁說|SAP究竟有多少模塊?

SAP究竟有哪些模塊繼上一期小邁說SAP&#xff01;SPA&#xff1f;的區別&#xff0c;相信大部分讀者明白了我們與水浴按摩行業的分別&#xff0c;可是僅僅區分名字還不夠&#xff0c;SAP還有眾多的模塊&#xff0c;這些又該怎么去了解呢&#xff1f;這就輪到肩負愛與責任的小邁…