DataFrame 的常用操作

DataFrame是什么?

????????DataFrame 是一種用于處理和分析數據的二維標簽數據結構。它類似于Excel中的電子表格或數據庫中的表格,由行和列組成。每個列可以是不同的數據類型(如整數、浮點數、字符串等),并且可以進行各種數據操作,如過濾、聚合和可視化。

特點
  • 二維結構:DataFrame 是一個二維數據結構,可以包含多種不同的數據類型(如數值、字符串、布爾值等)。
  • 標簽索引:每個軸(行和列)都有標簽(即索引),這使得 DataFrame 在數據選擇和操作時非常靈活。
  • 對齊操作:DataFrame 在算術運算時會自動對齊數據,確保相同標簽的數據對齊進行運算。
創建DataFrame
import pandas as pd# 從字典創建DataFrame
data = {"name": ["Alice", "Bob", "Crestina", "john"],"age": [12, 32, 38, 22],"city": ["云南", "廣西", "香港", "香港"]
}
df = pd.DataFrame(data)
print(df)
常用操作
print("--------------查看:返回前幾條數據-----------------")
print(df.head())print("--------------查看:返回后幾條數據-----------------")
print(df.tail())print("--------------查看:數據結構-----------------")
print(df.info())print("--------------查看:數據的統計信息-----------------")
print(df.describe())print("--------------選擇:單列-----------------")
print(df["name"])print("--------------選擇:多列-----------------")
print(df[["name", "age"]])print("--------------選擇:按標簽選擇行-----------------")
print(df.loc[0])print("--------------選擇:按位置選擇行-----------------")
print(df.iloc[1])print("--------------過濾:年齡大于20-----------------")
print(df[df["age"] > 20])print("--------------操作:添加列-----------------")
df["id"] = ["5", "6", "7", "9"]
print(df)print("--------------操作:刪除列-----------------")
df.drop("id", axis=1, inplace=True)
print(df)print("--------------清理:刪除缺失值-----------------")
df["id"] = ["5", "6", np.nan, np.nan]
print(df)print("--------------清理:行中有NAN,則刪除整行-----------------")
# print(df.dropna(axis= 0))print("--------------清理:列中有NAN,則刪除整列-----------------")
# print(df.dropna(axis= 1))print("--------------清理:填充NAN-----------------")
print(df.fillna("0"))print("--------------聚合:數據聚合(按city分組,計算平均值)-----------------")
print(df.groupby("city").mean())

本文來自互聯網用戶投稿,該文觀點僅代表作者本人,不代表本站立場。本站僅提供信息存儲空間服務,不擁有所有權,不承擔相關法律責任。
如若轉載,請注明出處:http://www.pswp.cn/diannao/41020.shtml
繁體地址,請注明出處:http://hk.pswp.cn/diannao/41020.shtml
英文地址,請注明出處:http://en.pswp.cn/diannao/41020.shtml

如若內容造成侵權/違法違規/事實不符,請聯系多彩編程網進行投訴反饋email:809451989@qq.com,一經查實,立即刪除!

相關文章

vb與數據庫編程

第一節 一、數據庫基礎知識 數據庫的概念 數據庫是按照數據結構來組織、存儲和管理數據的倉庫。 它可以存儲大量的數據,并提供高效的數據訪問和管理功能。 數據庫的類型 關系型數據庫:如 SQL Server、MySQL、Oracle 等,以表格形式存儲數據,通過關系(如主鍵和外鍵)來關聯不…

數據結構之二叉樹概念

數據結構之二叉樹 二叉樹簡介分類普通二叉樹平衡二叉樹滿二叉樹二叉搜索樹(二叉排序樹、二叉查找樹),平衡二叉樹紅黑樹 B樹類型B樹(B-樹、B_樹)B樹B*樹 二叉樹 簡介 二叉樹(Binary Tree) :是一種非常重要…

RPC框架之Dubbo

Dubbo 是一款高性能、輕量級的開源 Java RPC(Remote Procedure Call)框架,由阿里巴巴集團于2011年發布。Dubbo 主要用于實現基于微服務架構的分布式應用,通過提供服務注冊與發現、負載均衡、容錯等功能,極大地簡化了服…

頭歌資源庫(19)在排序數組中查找元素的首尾位置

一、 問題描述 二、算法思想 該問題可以通過二分查找的思想來解決。 首先,我們可以使用二分查找找到目標值在數組中的任意一個位置(即該位置的值等于目標值)。假設找到的位置為mid。 接下來,我們需要在mid的左邊和右邊分別找到…

UNIAPP_頂部導航欄右側添加uni-icons圖標,并綁定點擊事件,自定義導航欄右側圖標

效果 1、導入插件 uni-icons插件:https://ext.dcloud.net.cn/plugin?nameuni-icons 復制 uniicons.ttf 文件到 static/fonts/ 下 僅需要那個uniicons.ttf文件,不引入插件、單獨把那個文件下載到本地也是可以的 2、配置頁面 "app-plus":…

Python爬蟲+數據分析+數據可視化圖形-爬取高校排名數據

①本文主要使用python 爬取了中國大學排名前30的大學信息,并進行了數據處理及分析,是一個比較經典的python爬蟲和分析項目 ②主要內容:爬蟲數據預處理數據可視化分析 完整代碼請看這里拿👇↓↓↓

Flutter本地數據持久化的幾種方式

目錄 前言 一、shared_preferences 1.添加依賴 2.保存數據 3.讀取數據 4.移除數據 5.Shared_preferences的優缺點 6.完整的示例代碼 二、path_provider 1.導入path_provider 2.創建文件讀寫的目錄 3.向文件中寫入數據 4.從文件中讀取數據 5.完整的示例代碼 三、…

Mac本地部署大模型-單機運行

前些天在一臺linux服務器(8核,32G內存,無顯卡)使用ollama運行阿里通義千問Qwen1.5和Qwen2.0低參數版本大模型,Qwen2-1.5B可以運行,但是推理速度有些慢。 一直還沒有嘗試在macbook上運行測試大模型&#xf…

我這個經驗好找嵌入式的工作嗎?

大家好,我是麥鴿。最近網友的提問,這樣的經驗,好找嵌入式的工作嗎? 下面是網友的情況: 本人目前大二機器人工程,未來想要入職嵌入式行業,有robomaster比賽經驗本人負責電控,但是由于…

基因組學系列3:基因分型Phasing與單倍型參考序列HRC

1. 基因分型Phasing概念 基因分型,也稱為基因定相、單倍體分型、單倍體構建等,即將一個二倍體(或多倍體)基因組上的等位基因(或雜合位點)正確定位到父親或母親的染色體上,最終使得來自同一親本…

相親交友APP系統婚戀交友社交軟件開發語音視頻聊天平臺定制開發-婚戀相親交友軟件平臺介紹——app小程序開發定制

互聯網飛速發展的時代,相親交友軟件成為了許多年輕人首選的相親方式,越來越多的單身男女希望在婚戀交友軟件平臺上尋找靈魂伴侶,相親交友軟件因此具有很高的市場價值。 多客婚戀相親交友系統是一款定位高端,到手就能運營的成熟婚戀…

軟件測評中心▏軟件驗收測試方法和測試內容簡析

在當今數字化轉型的浪潮下,軟件驗收測試變得越來越重要。軟件驗收測試,顧名思義,是對軟件進行驗收的過程中進行的一項測試。它用于確保軟件在滿足需求、達到預期效果后才能正式交付給客戶使用。軟件驗收測試是一項全面、系統的測試過程&#…

sublime 3 背景和字體顏色修改

sublime 4 突然抽風,每次打開都顯示 “plugin_host-3.3 has exited unexpectedly, some plugin functionality won’t be available until Sublime Text has been restarted” 一直沒調好,所以我退回到sublime 3了。下載好了軟件沒問題,但是一…

半導體光電

《半導體光電》創刊于1976年,是由中國電子科技集團公司主管、重慶光電技術研究所(中國電子科技集團公司第四十四研究所)主辦的中文科技期刊。本刊國內外公開發行,經過四十余年的發展已經成為我國光電子專業領域有代表性的刊物。 …

Zabbix 配置grafana對接

zabbix對接grafana簡介 Zabbix與Grafana對接可以實現更加豐富和美觀的數據可視化,可以讓您利用Grafana強大的可視化功能來展示Zabbix收集的數據。 zabbix插件的兩種安裝方式 使用grafana-cli 命令進行安裝在grafana管理頁面中進入Administration/Plugins and dat…

2024.7.4學習日報

1、ppt前三章 5日計劃 1、至少做到實驗 2、java

css中文字書寫方向

writing-mode 是 CSS 中的一個屬性,用于設置文本、內聯元素、表格單元格和表格列的書寫方向、文本排列以及塊流方向。以下是對 writing-mode 屬性的詳細介紹: 1. 語法和值 語法:writing-mode: horizontal-tb | vertical-rl | vertical-lr |…

在RT-Thread-Studio中添加arm_math庫

1.在CMSIS\Lib\GCC中找到對應的庫,如本文使用的libarm_cortexM4lf_math.a。將庫拷貝到工程,并做如下圖設置。搜索路徑為庫文件在項目中的實際位置。 2.將CMSIS\DSP\Include下的文件復制到工程目錄中,并添加包含路徑 3.添加宏定義&#xff0c…

Memcached緩存預熱深度解析:加速應用性能的秘訣

Memcached緩存預熱深度解析:加速應用性能的秘訣 在高性能計算環境中,Memcached作為一種廣泛使用的分布式內存緩存系統,其緩存預熱機制對于提升應用性能至關重要。緩存預熱可以減少系統啟動時的延遲,避免緩存未命中,從…