目錄
前言
df導入數據
df基本增刪改查
數據清洗
?編輯
索引操作
數據統計
行列操作
?編輯
df->types
數據格式化
?編輯
日期數據處理
前言
此篇文章為個人python數據分析學習總結,總結內容大都為表格和結構圖方式,僅供參考。
df導入數據
類型 | 語法 |
---|---|
xls、xlsx | pd.read_excel(io、sheet_name、index_col) |
csv/txt | pd.read_csv(filepath_or_buffer、encoding、sep、delimiter、index_col) |
html | pd.read_html(io、match、index_col、encoding) 注意io不支持https |
mysql | pd.read_sql(sql、con、index_col) |
df基本增刪改查
數據清洗
索引操作
方法 | 描述 |
---|---|
reindex(index,columns,axis,fill_value,method) | 使用指定行列序列值來設置索引(行或列) |
set_index([col_names],drop) | 使用已存在的列來設置索引 |
reset_index(drop) | 重新設置索引 |
數據統計
注意:以下axis:0(列)、axis:1(行)
方法 | 描述 |
---|---|
sort_values(by,ascending,inplace) | 根據指定列來排序數據 |
rank(ascending,method) | 對數據記錄進行排序 |
value_counts(ascending,dropna) | 對數據中的值進行計數 |
sum() | 求和 |
mean() | 平均值 |
max() | 最大值 |
min() | 最小值 |
median() | 中位數 |
mode() | 眾數 |
var() | 方差 |
quantile() | 分位數 |
groupby(by) | 分組 |
agg([agg_funcs]) | 聚合方法 |
agg(agg_dict) | 聚合 |
行列操作
df->types
轉換類型 | 方法 |
---|---|
df -> dict | df.to_dict() |
df -> list | df.values.tolist() |
df -> tuple | [tuple(x) for x in df.values] |