📊 Pandas DataFrame 常用操作代碼示例
下面用表格匯總了 DataFrame 的常用操作,方便你快速查閱和實踐。
操作類別 | 代碼示例 | 說明(簡要) |
---|---|---|
數據讀取 | df = pd.read_csv('data.csv') | 讀取 CSV 文件 |
df = pd.read_excel('data.xlsx', sheet_name='Sheet1') | 讀取 Excel 文件 | |
df = pd.read_clipboard() | 從剪貼板中讀取數據,并將其轉換為 DataFrame | |
數據查看 | df.head() | 查看前 5 行數據 |
df.info() | 查看數據基本信息(行數、列類型、非空值等) | |
df.describe() | 生成描述性統計信息(均值、標準差、分位數等) | |
數據清洗 | df.dropna() | 刪除包含缺失值的行 |
df.fillna(value) | 填充缺失值 | |
df.drop_duplicates() | 刪除重復行 | |
數據選擇 | df['column_name'] | 選擇單列 |
df[['col1', 'col2']] | 選擇多列 | |
df.loc[row_index, col_name] | 按標簽選擇數據 | |
df.iloc[row_idx, col_idx] | 按位置選擇數據 | |
df.query('A > 10 & B < 12') | 使用查詢表達式篩選數據 | |
數據排序 | df.sort_values('column_name', ascending=False) | 按指定列的值降序排序 |
df.nlargest(5, 'column_name') | 獲取某列最大的前 5 行數據 | |
數據分組聚合 | df.groupby('column_name')['other_column'].mean() | 按列分組并計算另一列的均值 |
df.groupby(['col1', 'col2']).agg({'col3': 'mean', 'col4': 'sum'}) | 多列分組并進行多種聚合操作 | |
數據合并 | pd.merge(df1, df2, on='key_column') | 基于鍵列合并兩個 DataFrame |
pd.concat([df1, df2], axis=0) | 沿行方向拼接兩個 DataFrame (axis=1 為列方向) | |
數據處理 | df['new_column'] = df['existing_column'].apply(lambda x: x*2) | 對列應用函數創建新列 |
df['date_column'] = pd.to_datetime(df['date_column']) | 轉換日期列格式 | |
數據輸出 | df.to_csv('output.csv', index=False) | 輸出到 CSV 文件(不包含索引列) |
💡 一些實用技巧:
- 條件篩選:
df[(df['Age'] <= 25) & (df['Gender'] == '女')]
可以篩選出年齡小于等于25歲的女性 。 - 處理缺失值:
df.dropna(subset=['column_name'])
可僅刪除指定列中有缺失值的行 。 - 字符串處理:
df['title'].str.split(' ').str[0]
可用于分割字符串并取第一部分 。
📚 精選Pandas學習資源
要系統學習 Pandas,優質資源很重要。下表匯總了一些推薦的學習資源:
資源類型 | 資源名稱 | 作者/提供方 | 特點與簡介 |
---|---|---|---|
官方文檔 | 10 Minutes to pandas | Pandas | 官方快速入門指南,雖不止10分鐘但內容精煉。 |
教程系列 | pandas 教程三部曲 | Greg Reda | 經典入門教程,適合初學者 。 |
實用指南 | 給 aspiring data scientist 的 pandas 實戰手冊 | LeeMeng | 近 40 個實用技巧,由淺入深 。 |
相關書籍 | 《Python for Data Analysis》 | Wes McKinney (Pandas創作者) | 系統介紹利用 Python進行數據分析,涵蓋 IPython, NumPy, Pandas 。 |
針對性指南 | 在Pandas中的常規Excel操作 | 幫助有 Excel 背景的用戶快速適應 Pandas 。 | |
從SQL到pandas | Greg Reda | 幫助從 SQL 遷移到 Pandas 的用戶 。 | |
視頻課程 | Pandas 視頻教程 | David 9 | 系列視頻和 Jupyter notebook 筆記本 。 |
備忘單 | Pandas Cheat Sheet | Pandas | 官方提供的速查表,方便快速查找常用操作。 |
? 學習建議:
- 邊學邊練:Pandas 的最佳學習方式是實際操作。可以在 Jupyter Notebook 或 Google Colab 中運行代碼。
- 從實際問題出發:嘗試用 Pandas 分析和處理你感興趣的數據集。
- 善用官方文檔:遇到函數用法不明確時,官方文檔是最權威的參考。
- 參與社區:在 Stack Overflow 等社區提問和瀏覽,可以學到很多實戰技巧。