前饋神經網絡由三個主要部分組成:
- 輸入層: 負責接收原始數據,通常對應于特征的維度。
- 隱藏層: 包含一個或多個層,每層由多個神經元組成,用于
- 提取輸入數據的抽象特征。
- 輸出層: 產生網絡的最終預測或分類結果
激活函數:引入非線性特性,使網絡能夠學習復雜的函數。常見的如ReLU、Sigmoid、Tanh等
權重和偏置:神經網絡的可學習參數,它們在訓練過程中不斷調整,以最小化預測錯誤。
損失函數: 用于衡量網絡預測與實際目標之間的差異,常見的損失函數包括均方誤差(MSE)、交叉熵損失等。
反向傳播(BP)算法: 通過鏈式法則,從輸出層向輸入層逐層計算梯度。
避免過擬合的策略:早停法(Early Stopping)、正則化等。