Scikit-Learn邏輯回歸

邏輯回歸（Logistic Regression）主要解決二分類問題，用來表示某個事件發生的可能性。邏輯回歸在機器學習知識結構中的位置如下：

在這里插入圖片描述

邏輯回歸的思想最早可以追溯到19世紀，由英國統計學家Francis Galton在研究豌豆遺傳問題時首次提出。然而，真正將邏輯回歸應用于機器學習的是加拿大統計學家Hugh Everett，他在1970年代提出了廣義線性模型（GLM），其中包括邏輯回歸

邏輯回歸這個算法的名稱有一定的誤導性。雖然它的名稱中有“回歸”，但它在機器學習中不是回歸算法，而是分類算法。因為采用了與回歸類似的思想來解決分類問題，所以它才會被稱為邏輯回歸

在邏輯回歸中，我們不是直接預測輸出值，而是預測輸出值屬于某一特定類別的概率。例如，一封郵件是垃圾郵件的概率（是與不是），廣告被點擊的概率（點與不點）等

邏輯回歸通過Sigmoid函數將樣本的特征與樣本發生的概率聯系起來，在擬合樣本數據發生概率的時候，其實是在解決一個回歸問題，當概率計算出來后，再根據概率進行分類處理。邏輯回歸是在解決樣本與樣本發生的概率之間的回歸問題

邏輯回歸的函數表達式（Logistic函數或Sigmoid函數）為
$\rm g(z)=\frac{1}{1+e^{-z}}$

Sigmoid函數有時也用 $\sigma(z)$ 表示，其對應的圖像為

import numpy as np
import matplotlib.pyplot as pltz = np.arange(-5, 5, 0.01)
y = 1/(1+np.exp(-z))plt.plot(z, y)
plt.show()

在這里插入圖片描述

邏輯回歸基于概率來進行分類。對于給定輸入特征X，邏輯回歸模型會計算輸出標簽y=1（正類）的條件概率：
$P(y=1|X)=\frac{1}{1+e^{-(\theta^T X+b)}}$

其中， $\omega$ 是特征權重，b是偏置項

邏輯回歸將線性回歸的結果 $y$ = $\theta^T X$ + $b$ 帶入到Sigmoid函數的自變量，并將其映射到0和1之間，使其可以解釋為概率

邏輯回歸與線性回歸的關鍵區別在于，后者訓練出來的模型的預測值域為( $? \infty$ ，+ $\infty$ )，換句話說，也就是對值域沒有限制；而對于表示概率的值而言，其值域都是在(0，1)之間

更多關于邏輯回歸的介紹見文章：傳送門

優點：

缺點：

邏輯回歸與線性回歸的區別詳見文章：傳送門

邏輯回歸的概念與原理推導詳見文章：傳送門

在邏輯回歸（詳見：傳送門）一文中，我們已經給出并推導了邏輯回歸的損失函數
$J(\theta)=-\frac{1}{m}\sum_{i=1}^m[y_i\ln \hat y_i+(1-y_i)\ln(1-\hat y_i)]$

其中

本文來自互聯網用戶投稿，該文觀點僅代表作者本人，不代表本站立場。本站僅提供信息存儲空間服務，不擁有所有權，不承擔相關法律責任。
如若轉載，請注明出處：http://www.pswp.cn/news/714902.shtml
繁體地址，請注明出處：http://hk.pswp.cn/news/714902.shtml
英文地址，請注明出處：http://en.pswp.cn/news/714902.shtml

如若內容造成侵權/違法違規/事實不符，請聯系多彩編程網進行投訴反饋email:809451989@qq.com，一經查實，立即刪除！