pandas，dataframe使用筆記

新建一個dataframe

不帶列名

df = pd.DataFrame()

帶列名

df = pd.DataFrame(columns=[‘類別’, ‘文件名’, ‘圖像寬’, ‘圖像高’])

dataframe添加一行內容

以前的版本是append，現在變成了concat

row_data = {'類別': fruit, '文件名': file, '圖像寬': img.shape[1], '圖像高': img.shape[0]}# 使用 concat 添加一行數據
df1 = pd.concat([df1, pd.DataFrame([row_data])], ignore_index=True)

查看dataframe某列的數據類型

print(df['圖像寬'].dtype, df['圖像高'].dtype)

新建dataframe時設置了列名，則數據類型為object

df = pd.DataFrame(columns=['類別', '文件名', '圖像寬', '圖像高'])

print(df['圖像寬'].dtype, df['圖像高'].dtype)

輸出數據類型發現是object類型。而創建dataframe時不設置列名，后面再設置，則數據類型根據實際情況自動定，比如此處是數字，則類型打印出來就是Int64
在這里插入圖片描述

dataframe的保存

保存為csv文件

import pandas as pd  # 假設df是你的DataFrame  
# df = pd.DataFrame(...)  # 將DataFrame保存為CSV文件，默認不包含索引  
df.to_csv('your_file_name.csv', index=False)  # 如果你需要包含索引，可以設置index=True（但這是默認值，所以通常不需要顯式設置）  
# df.to_csv('your_file_name_with_index.csv', index=True)  # 還可以指定其他參數，如分隔符  
# df.to_csv('your_file_name_custom_delimiter.csv', sep=';', index=False)

保存為excel文件

pip install openpyxl

import pandas as pd  # 假設df是你的DataFrame  
# df = pd.DataFrame(...)  # 將DataFrame保存為Excel文件，默認不包含索引  
df.to_excel('your_file_name.xlsx', index=False, engine='openpyxl')  # 如果你需要包含索引，可以設置index=True  
# df.to_excel('your_file_name_with_index.xlsx', index=True, engine='openpyxl')  # 注意：'engine'參數是可選的，但如果你處理的是.xlsx文件，并且已經安裝了openpyxl，  
# 那么推薦顯式指定它，以避免潛在的兼容性問題。

注意：當處理非常大的DataFrame時，保存到Excel文件可能會比較慢，并且Excel文件有大小限制（對于.xlsx格式，單個工作表的最大行數和列數分別為1,048,576行和16,384列）。相比之下，CSV文件沒有這些限制（盡管文件大小可能受到操作系統和文件系統的限制）。因此，在可能的情況下，使用CSV文件可能是一個更好的選擇。

本文來自互聯網用戶投稿，該文觀點僅代表作者本人，不代表本站立場。本站僅提供信息存儲空間服務，不擁有所有權，不承擔相關法律責任。
如若轉載，請注明出處：http://www.pswp.cn/web/40312.shtml
繁體地址，請注明出處：http://hk.pswp.cn/web/40312.shtml
英文地址，請注明出處：http://en.pswp.cn/web/40312.shtml

如若內容造成侵權/違法違規/事實不符，請聯系多彩編程網進行投訴反饋email:809451989@qq.com，一經查實，立即刪除！