02 Deep learning神經網絡的編程基礎邏輯回歸--吳恩達

1.邏輯回歸

邏輯回歸是一種用于解決二分類任務（如預測是否是貓咪等）的統計學習方法。盡管名稱中包含“回歸”，但其本質是通過線性回歸的變體輸出概率值，并使用Sigmoid函數將線性結果映射到[0,1]區間。

以貓咪預測為例

假設單個樣本/單張圖片為（ $\mathbf{x}$ ， $\mathbf{y}$ ），特征向量X = $\mathbf{x}$ ，則 $\hat{y}$ 即為X的預測值， $\hat{y}$ =P（y= $\mathbf{y}$ / $\mathbf{x}$ ）, $\hat{y}$ ∈（0,1）。
假設特征權重參數為 $\mathbf{w}$ ，是一個n_x維的向量，則有：
$\hat{y}$ = $\sigma$ （ $w^\top$ $\mathcal{x}$ + $\mathcal{b}$ ）
$\mathcal{z}$ = $w^\top$ $\mathcal{x}$ + $\mathcal{b}$
$\hat{y}$ = $\sigma（z）$

2. Sigmoid函數

Sigmoid函數是一種常用的S型激活函數，數學表達式為：
$\sigma(z) = \frac{1}{1 + e^{-z}}$
在這里插入圖片描述
機器學習便是學習參數 $\mathcal{x}$ 和 $\mathcal{b}$ ，使得 $\hat{y}$ 盡可能接近實際值 $\mathcal{y}$ 。

符號慣例介紹

定義一個額外特征向量 $\mathcal{x_0}$ =1，
$\hat{y}$ = $\sigma$ ( $\theta^{T}$ $\mathcal{x}$ )，其中 $\theta_0$ 充當 $\mathcal{b}$ ，其余 $\theta_1$ 到 $\theta_{nx}$ 充當 $\mathbf{w}$

核心特性

輸出范圍：$ (0,1) $，適合概率映射
單調性：全程可導且導數最大值為$ 0.25 $（出現在$ x=0$處）
導數特性： $\sigma'(x) = \sigma(x)(1 - \sigma(x))$ ，便于梯度計算

Python實現

import numpy as npdef sigmoid(x):return 1 / (1 + np.exp(-x))# 支持向量化計算
print(sigmoid(np.array([-1.0, 0.0, 1.0])))  # 輸出：[0.2689, 0.5, 0.7311]

典型應用

邏輯回歸中的概率轉換
神經網絡隱藏層的激活函數
強化學習中的動作選擇概率

局限說明

深層網絡易出現梯度消失（導數值隨網絡深度指數衰減）
輸出不以零為中心可能影響優化效率
現多被ReLU系列函數替代用于隱藏層

本文來自互聯網用戶投稿，該文觀點僅代表作者本人，不代表本站立場。本站僅提供信息存儲空間服務，不擁有所有權，不承擔相關法律責任。
如若轉載，請注明出處：http://www.pswp.cn/pingmian/84128.shtml
繁體地址，請注明出處：http://hk.pswp.cn/pingmian/84128.shtml
英文地址，請注明出處：http://en.pswp.cn/pingmian/84128.shtml

如若內容造成侵權/違法違規/事實不符，請聯系多彩編程網進行投訴反饋email:809451989@qq.com，一經查實，立即刪除！