機器學習之邏輯回歸

import numpy as np
import pandas as pd
from sklearn.model_selection import train_test_split
from sklearn.preprocessing import  StandardScaler
from sklearn.linear_model import LogisticRegression
# 獲得數據
names=['Sample code number','Clump Thickness','Uniformity of Cell Size','Uniformity of Cell Shape','Marginal Adhesion','Single Hpithelial Cell Size','Bare Nucle','Bland Chromatin','Normal Nucleoli','Mitomeos','Class']
data=pd.read_csv("https://archive.ics.uci.edu/ml/machine-learning-databases/breast-cancer-wisconsin/breast-cancer-wisconsin.data",names=names)
# 處理數據  處理掉數據里的缺失值
data=data.replace(to_replace="?",value=np.nan)
# 使用dropna刪除替代過的數據
data=data.dropna()
# 分類數據  特征值  標準值
x=data.iloc[:,1:-1]
y=data["Class"]
# 分割數據
x_train,x_test,y_train,y_test=train_test_split(x,y,test_size=0.2,random_state=20)# 標準化數據
transfer =StandardScaler()
x_train=transfer.fit_transform(x_train)
x_test=transfer.fit_transform(x_test)
# 訓練模型
estimator=LogisticRegression()
ret=estimator.fit(x_train,y_train)
print(ret)
# 模型評估
print(estimator.score(x_test,y_test))

本文來自互聯網用戶投稿，該文觀點僅代表作者本人，不代表本站立場。本站僅提供信息存儲空間服務，不擁有所有權，不承擔相關法律責任。
如若轉載，請注明出處：http://www.pswp.cn/news/42286.shtml
繁體地址，請注明出處：http://hk.pswp.cn/news/42286.shtml
英文地址，請注明出處：http://en.pswp.cn/news/42286.shtml

如若內容造成侵權/違法違規/事實不符，請聯系多彩編程網進行投訴反饋email:809451989@qq.com，一經查實，立即刪除！