# 將數據集按照比例劃分為訓練集和測試集
def split_datas(datas,labels,random_state=1,train_size=0.9,test_size=0.1):train_data, test_data, train_label, test_label = sklearn.model_selection.train_test_split(datas,labels,random_state=random_state,# 作用是通過隨機數來隨機取得一定量得樣本作為訓練樣本和測試樣本train_size,test_size)return train_data, test_data, train_label, test_label
?在運行上面代碼的時候出現了錯誤
查了一下sklearn.model_selection.train_test_split函數的參數,發現兩個參數第二個是超參數,因此我們在傳入參數的時候需要指明變量,而不是直接傳入
數據集劃分:sklearn.model_selection.train_test_split(*arrays, **options)
主要參數說明:
*arrays:可以是列表、numpy數組、scipy稀疏矩陣或pandas的數據框
# 將數據集按照比例劃分為訓練集和測試集
def split_datas(datas,labels,random_state=1,train_size=0.9,test_size=0.1):train_data, test_data, train_label, test_label = sklearn.model_selection.train_test_split(datas,labels,random_state=random_state,# 作用是通過隨機數來隨機取得一定量得樣本作為訓練樣本和測試樣本train_size = train_size,test_size = test_size)return train_data, test_data, train_label, test_label
?
?這樣就不會報錯啦