邏輯回歸分類算法

線性回歸解決連續值的回歸預測；而邏輯回歸解決離散值的分類預測；

算法推導

邏輯回歸可以看作是兩部分，以0、1分類問題說明；

線性回歸部分
- 對于一個樣本 $x_i$ ，有n個特征 $x_i^{(1)}$ 、 $x_i^{(2)}$ … $x_i^{(n)}$ ，每個特征有對應的權重 $\theta_{(j)}$ ，則該樣本所有特征的線性加權求和為: $h_{\theta}(x_i) =\sum_j^n\theta_jx_i^{(j)} + \theta_0x_i^{(0)}=>\theta^Tx_i ; 其中x_i^{(0)}=1$
  $\theta為權重列向量，x_i為第i個樣本的列向量$
邏輯函數部分
- 回歸擬合的值 $h_{\theta}(x_i)$ 是一個連續值，需要轉為 $[0, 1]$ 之間的概率；
- 邏輯函數 $\frac {1} {1+e^{-x}}$ 將 $h_{\theta}(x_i)$ 連續值經過該邏輯函數映射到0-1之間
由以上兩部分，可以得到邏輯回歸的預測函數： $y_{pred}(x_i) = \frac {1} {1+e^{-\theta^Tx_i}}$ 這里的預測值在 $0 ? 1$ 之間，可以表示樣本 $x_i$ 屬于某類別的概率；
概率的似然函數 $\prod_{i=1}^my_{pred}^{y_{true}}(1-y_{pred})^{(1-y_{true})}$ 盡量讓屬于某類的概率最大，即極大似然估計求解；兩邊取對數，并乘以-1，得到損失函數： $-\sum_{i=1}^m(y_{true}log(y_{pred}) + (1-y_{true})log(1-y_{pred}))$ 求該損失函數的最小值。
梯度下降法，優化損失函數，得到權重更新公式： $\theta_j = \theta_j - \alpha\sum_{i=1}^m(y_{pred}(x_i) - y_{true}(x_i))x_i^{j}$

本文來自互聯網用戶投稿，該文觀點僅代表作者本人，不代表本站立場。本站僅提供信息存儲空間服務，不擁有所有權，不承擔相關法律責任。
如若轉載，請注明出處：http://www.pswp.cn/bicheng/20195.shtml
繁體地址，請注明出處：http://hk.pswp.cn/bicheng/20195.shtml
英文地址，請注明出處：http://en.pswp.cn/bicheng/20195.shtml

如若內容造成侵權/違法違規/事實不符，請聯系多彩編程網進行投訴反饋email:809451989@qq.com，一經查實，立即刪除！