神經網絡基礎-神經網絡補充概念-20-激活函數

概念

激活函數是神經網絡中的一個重要組成部分，它引入了非線性性質，使得神經網絡可以學習和表示更復雜的函數關系。激活函數對于將輸入信號轉換為輸出信號起到了關鍵作用，它在神經元的計算過程中引入了非線性變換。

幾種常見的激活函數及其特點

Sigmoid函數：
Sigmoid 函數將輸入映射到一個 0 到 1 的范圍，它的公式是：f(x) = 1 / (1 + exp(-x))。
特點：Sigmoid 函數在輸入很大或很小時，輸出接近于0或1，適合用于輸出層進行二分類問題的概率估計。但它在遠離零點時梯度接近于零，可能導致梯度消失問題。

ReLU函數（Rectified Linear Unit）：
ReLU 函數將負數輸入變為零，非負數輸入保持不變，它的公式是：f(x) = max(0, x)。
特點：ReLU 對于正數輸入有很強的激活作用，能夠緩解梯度消失問題。但存在一個問題，即在訓練過程中可能出現“神經元死亡”現象，即某些神經元永遠不會被激活。

Leaky ReLU函數：
Leaky ReLU 是對 ReLU 的改進，它在負數區域引入一個小的斜率，公式是：f(x) = x (x > 0)，f(x) = ax (x <= 0)，其中 a 是一個小于 1 的常數。
特點：Leaky ReLU 克服了 ReLU 的神經元死亡問題，但仍然能夠引入一些非線性。

Tanh函數（雙曲正切函數）：
Tanh 函數將輸入映射到 -1 到 1 的范圍，公式是：f(x) = (exp(x) - exp(-x)) / (exp(x) + exp(-x))。
特點：Tanh 函數可以將輸入的負值映射到負區間，適合用于隱藏層中。但仍然存在梯度消失問題。

Softmax函數：
Softmax 函數將一組實數映射到概率分布，用于多分類問題。它的公式是：f(x_i) = exp(x_i) / sum(exp(x_j))，其中 i 表示第 i 個類別。
特點：Softmax 函數用于多分類輸出，將神經網絡的輸出轉換為概率分布。

代碼實現

import numpy as npdef sigmoid(x):return 1 / (1 + np.exp(-x))

import numpy as npdef relu(x):return np.maximum(0, x)

import numpy as npdef leaky_relu(x, alpha=0.01):return np.where(x > 0, x, alpha * x)

import numpy as npdef tanh(x):return np.tanh(x)

import numpy as npdef softmax(x):exp_x = np.exp(x - np.max(x, axis=-1, keepdims=True))return exp_x / np.sum(exp_x, axis=-1, keepdims=True)

本文來自互聯網用戶投稿，該文觀點僅代表作者本人，不代表本站立場。本站僅提供信息存儲空間服務，不擁有所有權，不承擔相關法律責任。
如若轉載，請注明出處：http://www.pswp.cn/news/40517.shtml
繁體地址，請注明出處：http://hk.pswp.cn/news/40517.shtml
英文地址，請注明出處：http://en.pswp.cn/news/40517.shtml

如若內容造成侵權/違法違規/事實不符，請聯系多彩編程網進行投訴反饋email:809451989@qq.com，一經查實，立即刪除！