為什么需要邏輯回歸
擬合效果太好
?? ? ??特征與標簽之間的線性關系極強的數據,比如金融領域中的 信用卡欺詐,評分卡制作,電商中的營銷預測等等相關的數據,都是邏輯回歸的強項。雖然現在有了梯度提升樹GDBT,比邏輯回歸效果更好,也被許多數據咨詢公司啟用,但邏輯回歸在金融領域,尤其是銀行業中的統治地位依然不可動搖(相對的,邏輯回歸在非線性數據的效果很多時候比瞎猜還不如,所以如果你已經知道數據之間的聯系是非線性的,千萬不要迷信邏輯回歸);
邏輯回歸計算快?????
???????對于線性數據,邏輯回歸的擬合和計算都非常快,計算效率優于SVM和隨機森林,親測表 示在大型數據上尤其能夠看得出區別
邏輯回歸返回的分類結果不是固定的0,1,而是以小數形式呈現的類概率數字
????????我們因此可以把邏輯回歸返回的結果當成連續型數據來利用。比如在評分卡制作時,我們不僅需要判斷客戶是否會違約,還需要給出確定的”信用分“,而這個信用分的計算就需要使用類概率計算出的對數幾率,而決策樹和隨機森林這樣的分類器,可以產出分類結果,卻無法幫助我們計算分數(當然,在sklearn中,決策樹也可以產生概率,使用接口 predict_proba調用就好,但一般來說,正常的決策樹沒有這個功能)。
sklearn中的邏輯回歸
????????
?