Python中使用pandas

使用Pandas進行數據處理和分析

Pandas是Python中最流行的數據處理和分析庫之一。下面我將介紹Pandas的基本使用方法。

安裝Pandas

pip install pandas

基本數據結構

1. Series - 一維數組

import pandas as pd# 創建Series
s = pd.Series([1, 3, 5, 7, 9])
print(s)

2. DataFrame - 二維表格

# 創建DataFrame
data = {'Name': ['Alice', 'Bob', 'Charlie'],'Age': [25, 30, 35],'City': ['New York', 'London', 'Paris']
}
df = pd.DataFrame(data)
print(df)

數據讀取與寫入

讀取CSV文件

df = pd.read_csv('data.csv')

寫入CSV文件

df.to_csv('output.csv', index=False)

讀取Excel文件

df = pd.read_excel('data.xlsx', sheet_name='Sheet1')

寫入Excel文件

df.to_excel('output.xlsx', sheet_name='Sheet1', index=False)

數據查看與選擇

查看數據

df.head()      # 查看前5行
df.tail(3)     # 查看后3行
df.info()      # 查看數據信息
df.describe()  # 統計摘要

選擇數據

# 選擇列
df['Name']       # 選擇單列
df[['Name', 'Age']]  # 選擇多列# 選擇行
df.iloc[0]       # 按位置選擇第一行
df.loc[0]        # 按索引選擇
df[df['Age'] > 30]  # 條件選擇

數據操作

添加/刪除列

# 添加列
df['Salary'] = [50000, 60000, 70000]# 刪除列
df = df.drop('City', axis=1)

排序

df.sort_values('Age', ascending=False)

分組聚合

df.groupby('City')['Age'].mean()

處理缺失值

df.dropna()      # 刪除缺失值
df.fillna(0)     # 填充缺失值

數據合并

# 連接兩個DataFrame
df1 = pd.DataFrame({'A': ['A0', 'A1'], 'B': ['B0', 'B1']})
df2 = pd.DataFrame({'A': ['A2', 'A3'], 'B': ['B2', 'B3']})
result = pd.concat([df1, df2])

時間序列處理

# 創建時間序列
dates = pd.date_range('20230101', periods=6)
df = pd.DataFrame({'Date': dates, 'Value': [1, 2, 3, 4, 5, 6]})# 設置日期為索引
df.set_index('Date', inplace=True)# 按時間篩選
df['2023-01-01':'2023-01-03']

這只是Pandas功能的冰山一角。Pandas還提供了許多高級功能，如數據透視表、窗口函數、數據可視化集成等。

本文來自互聯網用戶投稿，該文觀點僅代表作者本人，不代表本站立場。本站僅提供信息存儲空間服務，不擁有所有權，不承擔相關法律責任。
如若轉載，請注明出處：http://www.pswp.cn/web/82319.shtml
繁體地址，請注明出處：http://hk.pswp.cn/web/82319.shtml
英文地址，請注明出處：http://en.pswp.cn/web/82319.shtml

如若內容造成侵權/違法違規/事實不符，請聯系多彩編程網進行投訴反饋email:809451989@qq.com，一經查實，立即刪除！