????logistic回歸又稱logistic回歸分析,是一種廣義的線性回歸分析模型,常用于數據挖掘,疾病自動診斷,經濟預測等領域。例如,探討引發疾病的危險因素,并根據危險因素預測疾病發生的概率等。以胃癌病情分析為例,選擇兩組人群,一組是胃癌組,一組是非胃癌組,兩組人群必定具有不同的體征與生活方式等。因此因變量就為是否胃癌,值為“是”或“否”,自變量就可以包括很多了,如年齡、性別、飲食習慣、幽門螺桿菌感染等。自變量既可以是連續的,也可以是分類的。然后通過logistic回歸分析,可以得到自變量的權重,從而可以大致了解到底哪些因素是胃癌的危險因素。同時根據該權值可以根據危險因素預測一個人患癌癥的可能性。
1、邏輯回歸是用來做什么的呢?
????????回答:用來解決二分類問題
2、專業術語:
樣本:就是一行一行數據,采集數據
特征:類似于mysql中的列
標簽列:又叫做結果列
3、回歸和分類的區別?
通過輸出結果可以判斷出是連續問題,還是離散問題?。
回歸模型的輸出是連續的
分類模型輸出的是離散的
4、案例(左分類,右回歸)
5、邏輯回歸公式
邏輯回歸=線性回歸+sigmoid函數br
????其實就是我們數學中的一條直線,讓現實數據,盡可能均勻落到該線的兩側,來實現正常分布
6、如何把回歸編程分類?
在該圖中,將x<=14劃分為一類。x>14分為另為一類,實現二分類問題。
7、Sigmoid函數
上圖為Sigmoid函數曲線圖,x=0的位置可以將數據y=0.5,得到數據二分類。
8、Sigmoid函數作用
9、邏輯回歸公式
10、判斷算法好壞-損失函數
11、評價二分類模型
????混淆矩陣、召回率、精確率、準確率
TP/TN/FP/FNT:TrueF :falseP:positiveN:Negativebr
11.1、準確率(accucry)
準確率(accucry)=總樣本中預測對了多少?br
案例:
11.2、精確率(procision)
精確率(procision)=預測為正的樣本中實際為正的有多少?br
案例:
11.3、召回率(Recall)
召回率(Recall)=實際為正的樣本中有多少被預測為正了br
案例:
11.4、F1計算公式
F1就是為了讓一個評價指標里,既能體現查準率,又能體現召回率而出現的公式br