背景
數據集標簽為csv文件格式,有三個字段column_hander = [‘id’, ‘boneage’, ‘male’],需要自己定義數據集。文件較大,做一個數據發生器迭代更新數據集。
實現模板
在Pandas
中,可以使用pandas.read_csv
函數讀取CSV文件,并使用iter
函數將DataFrame
轉換為迭代器,每次next
時返回一行數據。
import pandas as pd# 讀取CSV文件到DataFrame
df = pd.read_csv('your_file.csv')# 將DataFrame轉換為迭代器
data_iter = iter(df.itertuples(index=False, name=None))# 使用next獲取每行數據
try:while True:row = next(data_iter)print(row)
except StopIteration:print("迭代完成")
數據實踐
骨齡數據集boneage-training-dataset.csv
import pandas as pdprint("Reading data...")
csv_dir = r"boneage-training-dataset.csv"
boneage_df = pd.read_csv(csv_dir)# 將DataFrame轉換為迭代器data_iter = iter(boneage_df.itertuples(index=False, name=None))# 使用next獲取每行數據try:while True:row = next(data_iter)print(row)except StopIteration:print("迭代完成")
Tips
- 使用iter函數將DataFrame轉換為迭代器使自定義數據集更加絲滑。