DataFrame是Pandas庫中最常用的數據結構之一,它是一個類似于二維數組或表格的數據結構。DataFrame由多個列組成,每個列可以是不同的數據類型(如整數、浮點數、字符串等)。每列都有一個列標簽(column label),每行都有一個索引(index),使得我們可以通過標簽或索引來訪問和操作數據。我們可以使用多種方式來創建DataFrame,最常見的方式是從CSV文件、Excel文件、SQL數據庫等外部數據源中讀取數據。另外,我們也可以通過手動輸入數據、從字典或列表中創建DataFrame。一旦創建了DataFrame,我們可以使用各種方法和函數來對數據進行操作。例如,我們可以進行數據的篩選、排序、合并、分組等操作,還可以進行統計分析、數據可視化等。總的來說,DataFrame是Pandas庫中非常強大和靈活的數據結構,使得我們可以輕松地對數據進行處理、分析和可視化。
DataFrame是pandas庫中用于處理和分析數據的重要數據結構。它可以被看作是一個二維的表格,類似于電子表格或SQL中的數據庫表。
DataFrame的特點包括:
二維結構:DataFrame由行和列組成,可以像表格一樣對數據進行操作和分析。
標簽索引:每一個列和行都有一個唯一的標簽索引,可以通過標簽來引用和操作數據。
不同數據類型:DataFrame中的每一列可以是不同的數據類型,例如整數、浮點數、字符串等。
缺失值處理:DataFrame可以處理缺失值,可以使用NaN或None來表示缺失的數據。
靈活的操作:DataFrame可以進行多種靈活的操作,包括數據過濾、排序、統計、重塑等。
數據對齊:DataFrame可以根據標簽自動對齊數據,使得操作更加方便。
DataFrame是pandas庫中最常用的數據結構之一,提供了豐富的功能和方法,可以快速高效地處理和分析數據。
一、Dataframe的創建
DataFrame可以通過多種方式進行創建。下面列舉了一些常見的創建DataFrame的方法:
1. 從CSV文件或Excel文件中讀取數據
2. 從字典中創建DataFrame
3. 從列表中創建DataFrame
4. 手動創建DataFrame
1、從字典中創建DataFrame
????????使用字典創建DataFrame是一種常見的方法。可以將字典中的每個鍵值對作為一列數據,通過pd.DataFrame()
函數將字典轉換為DataFrame對象。
2. 從CSV文件或Excel文件中讀取數據
????????可以使用pandas庫中的read_csv()和read_excel()函數從CSV文件或Excel文件中讀取數據,并創建DataFrame。傳入參數為文件地址。
二、Dataframe切片
1、索引
df[[列名1,列名2...列名n]]? ? ——? ? 其中n=[0,正無窮]
2、切片
2.1、行切片
????????df[行索引1:行索引2]? ? ——? ? 不包括行索引2
????????df.loc[行索引1:行索引2]? ? ——? ??包括行索引2
2.2、列切片
????????df.loc[:,'列名':'列名']
三、Dataframe方法
方法 | 說明 | 方法 | 說明 |
min | 最小值 | max | 最大值 |
mean | 均值 | ptp | 極差 |
median | 中位數 | std | 標準差 |
var | 方差 | cov | 協方差 |
sem | 標準誤差 | mode | 眾數 |
skew | 樣本偏度 | kurt | 樣本峰度 |
quantile | 四分位數 | count | 非空值數 |
describe | 描述統計 | mad | 平均絕對離差 |