處理數據主要使用的是DataFrame格式,偶爾也會有list格式。
首先定位尋找數據:主要為loc,iloc
創建DataFrame:
df = pd.DataFrame([1,2,3,4,5],index = ['a','b','c','d','e'],columns=['aa'])
或
data=pd.DataFrame(np.arange(16).reshape(4,4),index=list('abcd'),columns=list('ABCD'))
loc
按照行定位
df.loc['a']
按照行列定位
df.loc['a','aa']
重新賦值:
df.loc['a','aa']= 4
某行全部賦值
df.loc['a'] =0
某列全部賦值
df.loc[:,'aa']=0
條件賦值
df.loc[df['aa']>1] = 0
iloc使用
取某一行
df.iloc[0]
取某一列數據
df.iloc[:,[0]]
取指定行列數據
df.iloc[[0],[0]]
獲取DataFrame的各種屬性
獲得dataframe的行列數
df.shape
獲得行數
df.shape[0]
獲取列數
df.shape[1]
獲取DataFrame數據各種信息
df.describe()
排序
True從小到大,False從大到小
data = data.sort_values('A',ascending=False)
最后一行插入數據
data.loc[len(data)] = data_in
重新設定index
df.reset_index(inplace= True)
以日期為index
data.set_index(['date'],inplace=True)