CSV文件
CSV(Comma-Separated Values,逗號分隔值,有時也稱為字符分隔值,因為分隔字符也可以不是逗號),其文件以純文本形式存儲表格數據(數字和文本)。
讀取與寫入
讀取csv文件
import pandas as pd
?
df = pd.read_csv('nba.csv')
# 輸出結果為數據的前面 5 行和末尾 5 行,中間部分以 ... 代替
print(df)
# to_string() 用于返回 DataFrame 類型的數據,展示全部信息
print(df.to_string())
保存到csv文件
# 三個字段 name, site, age
name = ["Google", "Runoob", "Taobao", "Wiki"]
site = ["www.google.com", "www.runoob.com", "www.taobao.com", "www.wikipedia.org"]
age = [90, 40, 80, 98]
# 字典
dict = {'name': name, 'site': site, 'age': age}
df = pd.DataFrame(dict)
# 保存 dataframe
df.to_csv('site.csv')
數據處理
head( n ) 方法用于讀取前面的 n 行,如果不填參數 n ,默認返回 5 行。
tail( n ) 方法用于讀取尾部的 n 行,如果不填參數 n ,
? ? ? ? ? ? ?默認返回 5 行,空行各個字段的值返回 NaN。
info() 方法返回表格的一些基本信息
import pandas as pd
?
df = pd.read_csv('nba.csv')
?
print(df.head()) ? # 默認讀取前 5 行
print(df.head(10)) # 讀取前 10 行
?
print(df.tail()) ? # 讀取末尾 5 行
print(df.tail(10)) # 讀取末尾 10 行
print(df.info())
non-null 為非空數據,我們可以看到上面的信息中,總共 458 行,College 字段的空值最多。