目錄
- 新建一個dataframe
- 不帶列名
- 帶列名
- dataframe添加一行內容
- 查看dataframe某列的數據類型
- 新建dataframe時設置了列名,則數據類型為object
- dataframe的保存
- 保存為csv文件
- 保存為excel文件
dataframe屬于pandas
新建一個dataframe
不帶列名
df = pd.DataFrame()
帶列名
df = pd.DataFrame(columns=[‘類別’, ‘文件名’, ‘圖像寬’, ‘圖像高’])
dataframe添加一行內容
以前的版本是append,現在變成了concat
row_data = {'類別': fruit, '文件名': file, '圖像寬': img.shape[1], '圖像高': img.shape[0]}# 使用 concat 添加一行數據
df1 = pd.concat([df1, pd.DataFrame([row_data])], ignore_index=True)
查看dataframe某列的數據類型
print(df['圖像寬'].dtype, df['圖像高'].dtype)
新建dataframe時設置了列名,則數據類型為object
df = pd.DataFrame(columns=['類別', '文件名', '圖像寬', '圖像高'])
print(df['圖像寬'].dtype, df['圖像高'].dtype)
輸出數據類型發現是object類型。而創建dataframe時不設置列名,后面再設置,則數據類型根據實際情況自動定,比如此處是數字,則類型打印出來就是Int64
dataframe的保存
保存為csv文件
import pandas as pd # 假設df是你的DataFrame
# df = pd.DataFrame(...) # 將DataFrame保存為CSV文件,默認不包含索引
df.to_csv('your_file_name.csv', index=False) # 如果你需要包含索引,可以設置index=True(但這是默認值,所以通常不需要顯式設置)
# df.to_csv('your_file_name_with_index.csv', index=True) # 還可以指定其他參數,如分隔符
# df.to_csv('your_file_name_custom_delimiter.csv', sep=';', index=False)
保存為excel文件
pip install openpyxl
import pandas as pd # 假設df是你的DataFrame
# df = pd.DataFrame(...) # 將DataFrame保存為Excel文件,默認不包含索引
df.to_excel('your_file_name.xlsx', index=False, engine='openpyxl') # 如果你需要包含索引,可以設置index=True
# df.to_excel('your_file_name_with_index.xlsx', index=True, engine='openpyxl') # 注意:'engine'參數是可選的,但如果你處理的是.xlsx文件,并且已經安裝了openpyxl,
# 那么推薦顯式指定它,以避免潛在的兼容性問題。
注意:當處理非常大的DataFrame時,保存到Excel文件可能會比較慢,并且Excel文件有大小限制(對于.xlsx格式,單個工作表的最大行數和列數分別為1,048,576行和16,384列)。相比之下,CSV文件沒有這些限制(盡管文件大小可能受到操作系統和文件系統的限制)。因此,在可能的情況下,使用CSV文件可能是一個更好的選擇。