文章目錄
- 0. 學習目標
- 1. Pandas的數據結構分析
-
- 1.1 Series - 序列
-
- 1.1.1 Series概念
- 1.1.2 Series類的構造方法
- 1.1.3 創建Series對象
-
- 1.1.3.1 基于列表創建Series對象
- 1.1.3.2 基于字典創建Series對象
- 1.1.4 獲取Series對象的數據
- 1.1.5 Series對象的運算
- 1.1.6 增刪Series對象的行數據
-
- 1.1.6.1 增加行數據
- 1.1.6.2 刪除行數據
- 1.2 DataFrame - 數據幀
-
- 1.2.1 DataFrame概念
- 1.2.2 DataFrame類的構造方法
- 1.2.3 創建DataFrame對象
- 1.2.4 獲取DataFrame對象的列數據
-
- 1.2.4.1 通過索引方式
- 1.2.4.2 通過屬性方式
- 1.2.4.3 獲取列數據的推薦方式
- 1.2.5 增刪DataFrame對象的列數據
-
- 1.2.5.1 增加列數據
- 1.2.5.2 刪除列數據
- 1.2.6 DataFrame對象的運算
- 2. Pandas索引操作及高級索引
-
- 2.1 索引對象
-
- 2.1.1 索引對象概念
- 2.1.2 索引的子類
- 2.2 重置索引
-
- 2.2.1 如何重置索引
- 2.2.2 reindex()方法
-
- 2.2.2.1 語法格式
- 2.2.2.2 參數說明
- 2.2.2.3 案例演示
- 2.3 索引操作
-
- 2.3.1 通過索引位置或索引名稱獲取序列的數據
- 2.3.2 通過位置索引切片或索引名稱切片獲取序列的數據
- 2.3.3 通過不連續的索引獲取序列的不連續數據
- 2.3.4 通過布爾索引獲取序列的數據
- 2.3.5 數據幀的行索引和列索引
- 2.3.6 通過索引方式訪問數據幀的數據
- 3 算術運算與數據對齊
-
- 3.1 采用NaN補齊缺失值
- 3.2 用戶指定補齊值
- 4. 數據排序
-
- 4.1 按索引排序
-
- 4.1.1 對序列按索引排序
- 4.1.2 對數據幀按索引排序
- 4.2 按值排序
-
- 4.2.1 對序列按值排序
- 4.2.2 對數據幀按值排序
- 5. 統計計算與描述
-
- 5.1 統計函數
- 5.2 統計描述
- 6. 層次化索引
-
- 6.1 認識層次化索引
-
- 6.1.1 層次化索引概念
- 6.1.2 創建層次化索引
-
- 6.1.2.1 利用嵌套列表創建層次化索引
- 6.1.2.2 通過MultiIndex的方法構建層次化索引
-
- 6.1.2.2.1 將元組列轉換成Mutilndex對象
- 6.1.2.2.2 將數組列表轉換成MultiIndex對象
- 6.1.2.2.3 將多個集合的笛卡爾成績轉換成MutliIndex對象
- 6.1.3 基于層次化索引的序列案例演示
- 6.2 按照分層索引排序數據
- 7. 讀寫數據操作
-
- 7.1 讀寫文本文件
-
- 7.1.1 CSV文件
-
- 7.1.1.1 寫CSV文件
- 7.1.1.2 讀CSV文件
- 7.1.2 TXT文件
- 7.2 讀寫Excel文件
-
- 7.2.1 寫Excel文件
- 7.2.2 讀Excel文件
- 7.3 讀取HTML表格數據
-
- 7.3.1 讀取HTML函數
- 7.3.2 案例演示
- 7.3.4 讀寫數據庫
-
- 7.3.4.1 讀寫數據庫概述
- 7.3.4.2 讀寫數據庫函數
- 7.3.4.3 讀寫數據庫案例演示
-
- 7.3.4.3.1 讀數據庫
- 7.3.4.3.2 寫數據庫
- 8. 小結
0. 學習目標
- 掌握 數據結構分析,索引操作及高級索引
- 掌握 算術運算與數據對齊,數據排序
- 掌握 統計計算與描述 ,層次化索引
- 掌握 讀寫數據操作
1. Pandas的數據結構分析
- Pandas中有兩個主要的數據結構:
Series
(一維的數據結構)和DataFrame
(二維的數據結構)
1.1 Series - 序列
1.1.1 Series概念
- Series是一個類似一維數組的對象,它能夠保存任何類型的數據,主要由一組數據和與之相關的索引兩部分構成。
- 注意:Series的索引位于左邊,數據位于右邊。
1.1.2 Series類的構造方法
Series(data