數據框是一種二維數據結構,其中數據以表格格式存儲,以行和列的形式。
它可以可視化為SQL數據表或excel工作表表示形式。可以使用以下構造函數創建它-pd.Dataframe(data,?index,?columns,?dtype,?copy)
讓我們了解如何使用Series字典創建數據框。系列是“熊貓”庫中存在的一維數據結構。
軸標簽統稱為索引。
系列結構可以存儲任何類型的數據,例如整數,浮點數,字符串,python對象等。
讓我們看一個例子-
示例import?pandas?as?pd
my_data?=?{'ab'?:?pd.Series([1,?2,?3],?index=['a',?'b',?'c']),
'mn'?:?pd.Series([56,?78,?13,?13],?index=['a',?'b',?'c',?'d'])}
my_df?=?pd.DataFrame(my_data)
print("從以下系列的字典創建的數據框:?")
print(my_df)
輸出結果The?dataframe?created?from?dictionary?f?series?:
ab???mn
a??1.0??56
b??2.0??78
c??3.0??13
d??NaN??13
說明導入所需的庫,并為其指定別名,以方便使用。
創建由鍵和值組成的字典值,其中值實際上是序列數據結構。
該系列字典隨后作為參數傳遞給存在于“ pandas”庫中的“ Dataframe”函數
通過將系列字典作為參數傳遞給它來創建數據框。
數據框被打印在控制臺上。
注意-“ NaN”一詞指的是“不是數字”,這意味著特定的[row,col]值沒有任何有效的條目。