1、讀取excel /csv及指定sheet:
pd.read_excel=("路徑",sheetname="xx")
修改列名df.rename
修改字符串類型到數字 pandas.to_numeric()
2、刪除drop、去重drop_duplicates
(1)空值所在行/列
行:df.dropna(axis=0, how='any', inplace=True)
列:df.dropna(axis=1, how='any', inplace=True)
(2)刪除指定列為空的行
df = df.dropna(subset=['列名')
(3)刪除指定行/列
df=df.drop(['列名'],axis=1) ;df=df.drop(cloumns=['列名'])
(4)去重
df=df.drop_duplicates(subset=['列名1','列名2'],keep=‘’,inplace=xx)
3、新增一列/行
(1)在最后新增一列固定值 df['列名']='值'
4、新建一個表,另存為
保存到csv就 dataframe.to_csv() ;保存到excel就dataframe.to_excel()
writer=pd.excelwriter('路徑')
df.to_excel(writer)
writer.save()
writer.close()
自定義函數
操作行/列 apply
列之間的加減乘除 df["列名"].apply(lambda x:x["a"]+x["b"],axis=1)
指定列求和匯總:xx = df['列名'].sum()
5、縱向匹配 拼接 merge
6、分組匯總+使用函數 group by
分組:df.groupby(['列名'])
分組計數:df.groupby(['列名']).count()
分組求和:df.groupby(['列名']).sum()['列名']