極簡的神經網絡反向傳播例子

我之前一直沒搞清楚，神經網絡為什么要求導？反向傳播又是什么？于是到現在深究回來……

本質就是擬合一個未知函數。?

高中的數理統計就學過最小二乘法這種回歸方法（? 代表自己的預測y，這個表達要記住），這個有點類似。

假設你有一個線性函數y=ax（下面a用w代替，weigh權重的意思），而目標函數是y=2x，求導（是對loss 損失函數求導！）的目的就是利用導函數中的斜率（預測值比真值大了斜率是正，就要減去變小，反之小了斜率負的，也減去則變大），來調整a的權重。

我們來舉一個特別簡單的例子：只有1個輸入、1個權重、1個輸出的神經網絡，幫你徹底理解：

我們要學的是：

用一個參數 w 去逼近函數 y = 2x

我們拿一組訓練數據：

輸入 x = 1，希望輸出 y = 2

我們的模型就是：（損失函數自己定，有能力衡量預測值和真值之間差距的函數就行，這里用的是二階中心矩——方差）

預測值：? = w * x 
損失函數：L = (? - y)^2

假設初始權重 w = 0.5

輸入 x = 1

那么預測值：? = 0.5 × 1 = 0.5

實際標簽：y = 2

損失：L = (0.5 - 2)^2 = 2.25

我們要對 損失函數L 對 參數w 求導，看看w該怎么改。

損失函數展開：

L = (w*x - y)^2

對w求導：

dL/dw = 2 * (w*x - y) * x

代入數字得到具體x的導數（梯度）：

dL/dw = 2 * (0.5*1 - 2) * 1 = 2 * (-1.5) = -3

用最簡單的梯度下降更新公式：（這部分得到的是調整斜率變化的偏移量，是減）

w = w - 學習率 * 梯度

假設學習率 lr = 0.1：

w = 0.5 - 0.1 * (-3) = 0.5 + 0.3= 0.8

新的權重 w = 0.8

這就是“通過反向傳播 + 求導”，讓網絡“學到信息”的過程。

這里是最簡單的一個例子，靠著AI輔助生成創作的，權作拋磚引玉。?

本文來自互聯網用戶投稿，該文觀點僅代表作者本人，不代表本站立場。本站僅提供信息存儲空間服務，不擁有所有權，不承擔相關法律責任。
如若轉載，請注明出處：http://www.pswp.cn/news/913314.shtml
繁體地址，請注明出處：http://hk.pswp.cn/news/913314.shtml
英文地址，請注明出處：http://en.pswp.cn/news/913314.shtml

如若內容造成侵權/違法違規/事實不符，請聯系多彩編程網進行投訴反饋email:809451989@qq.com，一經查實，立即刪除！