Sigmoid函數導數推導詳解

在邏輯回歸中，Sigmoid函數的導數推導是一個關鍵步驟，它使得梯度下降算法能夠高效地計算。

1. Sigmoid函數定義

首先回顧Sigmoid函數的定義：

$\frac{1}{1 + e^{-z}}$

2. 導數推導過程

從Sigmoid函數出發：
$\frac{1}{1 + e^{-z}}$
令 $u = 1 + e^{-z}$ ，則 $g(z) = u^{-1}$
使用鏈式法則：
$\frac{dg}{dz} = \frac{dg}{du} \cdot \frac{du}{dz} = -u^{-2} \cdot (-e^{-z}) = \frac{e^{-z}}{(1 + e^{-z})^2}$
現在，我們將其表示為 $g (z)$ 的函數：
$\frac{e^{-z}}{1 + e^{-z}} = 1 - \frac{1}{1 + e^{-z}} = 1 - g(z)$
因此：
$\frac{1}{1 + e^{-z}} \cdot \frac{e^{-z}}{1 + e^{-z}} = g(z) \cdot (1 - g(z))$

3. 代碼實現

import numpy as np
import matplotlib.pyplot as pltdef sigmoid(z):return 1 / (1 + np.exp(-z))def sigmoid_derivative(z):return sigmoid(z) * (1 - sigmoid(z))z = np.linspace(-10, 10, 100)
plt.figure(figsize=(10, 6))
plt.plot(z, sigmoid(z), label="Sigmoid function")
plt.plot(z, sigmoid_derivative(z), label="Sigmoid derivative")
plt.xlabel("z")
plt.ylabel("g(z)")
plt.title("Sigmoid Function and its Derivative")
plt.legend()
plt.grid(True)
plt.show()

在這里插入圖片描述

4. 導數性質分析

最大值：當 $g (z) = 0.5$ 時，導數達到最大值 $0.25$
對稱性：導數在 $z = 0$ 時最大，隨著 $∣ z ∣$ 增大而迅速減小
非負性：導數始終非負，因為 $0 < g (z) < 1$

5. 導數形式的重要型

在邏輯回歸的梯度下降中，需要計算損失函數對參數的導數。由于損失函數中包含Sigmoid函數，這個導數形式使得計算變得非常簡潔：

$\frac{\partial}{\partial \theta_j}J(\theta) = \frac{1}{m}\sum_{i=1}^m (h_\theta(x^{(i)}) - y^{(i)})x_j^{(i)}$

其中 $h_\theta(x) = g(\theta^T x)$ 。如果沒有這個簡潔的導數形式，梯度計算會復雜得多。

推導損失函數對 $\theta_j$ 的偏導數：
$\begin{align*} \frac{\partial}{\partial \theta_j} J(\theta) &= -\frac{1}{m}\sum_{i=1}^m \left(y_i \frac{1}{h_\theta(x_i)} - (1-y_i)\frac{1}{1-h_\theta(x_i)}\right) \frac{\partial}{\partial \theta_j} h_\theta(x_i) \\ &= -\frac{1}{m}\sum_{i=1}^m \left(y_i \frac{1}{g(\theta^T x_i)} - (1-y_i)\frac{1}{1-g(\theta^T x_i)}\right) g(\theta^T x_i)(1-g(\theta^T x_i)) x_i^j \\ &= -\frac{1}{m}\sum_{i=1}^m \left(y_i(1-g(\theta^T x_i)) - (1-y_i)g(\theta^T x_i)\right) x_i^j \\ &= \frac{1}{m}\sum_{i=1}^m (h_\theta(x_i) - y_i) x_i^j \end{align*}$

本文來自互聯網用戶投稿，該文觀點僅代表作者本人，不代表本站立場。本站僅提供信息存儲空間服務，不擁有所有權，不承擔相關法律責任。
如若轉載，請注明出處：http://www.pswp.cn/diannao/81255.shtml
繁體地址，請注明出處：http://hk.pswp.cn/diannao/81255.shtml
英文地址，請注明出處：http://en.pswp.cn/diannao/81255.shtml

如若內容造成侵權/違法違規/事實不符，請聯系多彩編程網進行投訴反饋email:809451989@qq.com，一經查實，立即刪除！