【持更】python數據處理-學習筆記

1、讀取excel /csv及指定sheet:

pd.read_excel=("路徑",sheetname="xx")

修改列名df.rename

修改字符串類型到數字 pandas.to_numeric()

2、刪除drop、去重drop_duplicates

(1)空值所在行/列

行:df.dropna(axis=0, how='any', inplace=True)

列:df.dropna(axis=1, how='any', inplace=True)

(2)刪除指定列為空的行

df = df.dropna(subset=['列名')

(3)刪除指定行/列

df=df.drop(['列名'],axis=1) ;df=df.drop(cloumns=['列名'])

(4)去重

df=df.drop_duplicates(subset=['列名1','列名2'],keep=‘’,inplace=xx)

3、新增一列/行

(1)在最后新增一列固定值 df['列名']='值'

4、新建一個表,另存為

保存到csv就 dataframe.to_csv() ;保存到excel就dataframe.to_excel()

writer=pd.excelwriter('路徑')

df.to_excel(writer)

writer.save()

writer.close()

自定義函數

操作行/列 apply

列之間的加減乘除 df["列名"].apply(lambda x:x["a"]+x["b"],axis=1)

指定列求和匯總:xx = df['列名'].sum()

5、縱向匹配 拼接 merge

6、分組匯總+使用函數 group by

分組:df.groupby(['列名'])

分組計數:df.groupby(['列名']).count()

分組求和:df.groupby(['列名']).sum()['列名']

本文來自互聯網用戶投稿,該文觀點僅代表作者本人,不代表本站立場。本站僅提供信息存儲空間服務,不擁有所有權,不承擔相關法律責任。
如若轉載,請注明出處:http://www.pswp.cn/news/214454.shtml
繁體地址,請注明出處:http://hk.pswp.cn/news/214454.shtml
英文地址,請注明出處:http://en.pswp.cn/news/214454.shtml

如若內容造成侵權/違法違規/事實不符,請聯系多彩編程網進行投訴反饋email:809451989@qq.com,一經查實,立即刪除!

相關文章

Redis分布式鎖有什么缺陷?

Redis分布式鎖有什么缺陷? Redis 分布式鎖不能解決超時的問題,分布式鎖有一個超時時間,程序的執行如果超出了鎖的超時時間就會出現問題。 1.Redis容易產生的幾個問題: 2.鎖未被釋放 3.B鎖被A鎖釋放了 4.數據庫事務超時 5.鎖過期了…

centos 7 卸載圖形化界面步驟記錄

centos7 服務器操作系統,挺小一配置,裝了圖形化界面,現在運行程序的時候跑不動了,我想這圖形界面也沒啥用,卸載了算了! 卸載步驟 yum grouplist 查詢已經安裝的組件 可以看到 圖形化界面 等是以分組存在的…

深入理解Spring IOC的工作流程

理解Spring IOC(Inversion of Control)的工作流程是理解Spring框架的核心之一。下面是Spring IOC的基本工作流程: 配置: 開發者通過XML配置文件、Java配置類或者注解等方式,定義應用中的Bean以及它們之間的依賴關系。這…

TCP數據粘包的處理

TCP數據粘包的處理 背鍋俠TCP解決方案2.1 發送端2.2 接收端 背鍋俠TCP 在前面介紹套接字通信的時候說到了TCP是傳輸層協議,它是一個面向連接的、安全的、流式傳輸協議。因為數據的傳輸是基于流的所以發送端和接收端每次處理的數據的量,處理數據的頻率可…

Qt練習題

1.使用手動連接,將登錄框中的取消按鈕使用qt4版本的連接到自定義的槽函數中,在自定義的槽函數中調用關閉函數 將登錄按鈕使用qt5版本的連接到自定義的槽函數中,在槽函數中判斷ui界面上輸入的賬號是否為"admin",密碼是否…

代碼隨想錄 96. 不同的二叉搜索樹

題目 給你一個整數 n ,求恰由 n 個節點組成且節點值從 1 到 n 互不相同的 二叉搜索樹 有多少種?返回滿足題意的二叉搜索樹的種數。 示例 1: 輸入:n 3 輸出:5 示例 2: 輸入:n 1 輸出&#xff1…

【Angular開發】Angular 16發布:發現前7大功能

Angular 于2023年5月3日發布了主要版本升級版Angular 16。作為一名Angular開發人員,我發現這次升級很有趣,因為與以前的版本相比有一些顯著的改進。 因此,在本文中,我將討論Angular 16的前7個特性,以便您更好地理解。…

機器學習基礎介紹

百度百科: 機器學習是一門多領域交叉學科,涉及概率論、統計學、逼近論、凸分析、算法復雜度理論等多門學科。專門研究計算機怎樣模擬或實現人類的學習行為,以獲取新的知識或技能,重新組織已有的知識結構使之不斷改善自身的性能。 …

手工酸奶店如何選址?開在哪里比較合適?

手工酸奶店是一個非常受歡迎的創業項目,但想要成功開店,選址是非常重要的。 本人開酸奶店5年時間,下面我將為大家分享一些選址的小技巧,希望對大家有所幫助。(可以點贊收藏,方便以后隨時查閱) …

入職字節外包一個月,我離職了。。。

有一種打工人的羨慕,叫做“大廠”。 真是年少不知大廠香,錯把青春插稻秧。 但是,在深圳有一群比大廠員工更龐大的群體,他們頂著大廠的“名”,做著大廠的工作,還可以享受大廠的伙食,卻沒有大廠…

12.11 C++ 作業

完善對話框,點擊登錄對話框,如果賬號和密碼匹配,則彈出信息對話框,給出提示”登錄成功“,提供一個Ok按鈕,用戶點擊Ok后,關閉登錄界面,跳轉到其他界面 如果賬號和密碼不匹配&#xf…

樹根研習社|數據為王,洞察“工業數據采集”背后的價值與實踐

一、工業數據采集是什么? 數據采集是將各種信息傳感設備通過網絡結合起來,實現任何時間、任何地點,人、機、物的互聯互通。數據采集的主要的作用是: “翻譯官”:不同程序語言的設備數據通過協議解析“翻譯”為上層系…

淘寶權益玩法平臺的Serverless化實踐

通過對權益玩法平臺現有業務應用的Serverless化改造,權益團隊在雙十一期間完美地支撐了業務需求,在研發效率、運維保障等方面都體現出了很高的價值和收益。 項目背景 淘寶權益平臺是負責淘寶權益營銷的核心團隊,團隊除了負責拉菲權益平臺外&a…

1.cloud-微服務架構編碼構建

1.微服務cloud整體聚合父工程 1.1 New Project 1.2 Maven選版本 1.3 字符編碼 1.4 注解生效激活 主要為lombok中的Data 1.5 java編譯版本選8 1.6 File Type過濾 *.hprof;*.idea;*.iml;*.pyc;*.pyo;*.rbc;*.yarb;*~;.DS_Store;.git;.hg;.svn;CVS;__pycache__;_svn;vssver.scc;v…

Nginx配置文件的基本用法

Nginx簡介 1.1概述 Nginx是一個高性能的HTTP和反向代理服務器。 是一款輕量級的高性能的web服務器/反向代理服務器/電子郵件(IMAP/POP3)代理服務器 單臺物理服務器可支持30 000~50 000個并發請求。 1.2Nginx和Apache的優缺點 &#xff…

mybatis數據輸出-insert操作時獲取自增列的值給對應的屬性賦值

jdbc-修改 水果庫存系統的 BaseDao 的 executeUpdate 方法支持返回自增列-CSDN博客 1、建庫建表 CREATE DATABASE mybatis-example;USE mybatis-example;CREATE TABLE t_emp(emp_id INT AUTO_INCREMENT,emp_name CHAR(100),emp_salary DOUBLE(10,5),PRIMARY KEY(emp_id) );INSE…

王炸升級!PartyRock 10分鐘構建 AI 應用

前言 一年一度的亞馬遜云科技的 re:Invent 可謂是全球云計算、科技圈的狂歡,每次都能帶來一些最前沿的方向標,這次也不例外。在看完一些 keynote 和介紹之后,我也去親自體驗了一些最近發布的內容。其中讓我感受最深刻的無疑是 PartyRock 了。…

基于SSM的健身房預約系統設計與實現

末尾獲取源碼 開發語言:Java Java開發工具:JDK1.8 后端框架:SSM 前端:Vue 數據庫:MySQL5.7和Navicat管理工具結合 服務器:Tomcat8.5 開發軟件:IDEA / Eclipse 是否Maven項目:是 目錄…

網絡安全攻擊預警/態勢預測算法匯總

總結: 網絡安全攻擊預警/態勢預測算法眾多,主要包括: 基于統計學的算法:協方差矩陣、馬爾可夫模型等; 基于機器學習的算法:貝葉斯網絡、聚類算法、支持向量機SVM、遺傳算法、層次分析法AHP、決策樹等&am…

每日一道算法題 1

借鑒文章:Java-敏感字段加密 - 嗶哩嗶哩 題目描述 給定一個由多個命令字組成的命令字符串; 1、字符串長度小于等于127字節,只包含大小寫字母,數字,下劃線和偶數個雙引號 2、命令字之間以一個或多個下劃線_進行分割…