從高斯噪聲的角度分析MAE和MSE

1. MAE與MSE的本質區別

MAE（Mean Absolute Error）和MSE（Mean Squared Error）是兩種常用的損失函數，它們的數學形式決定了對誤差的不同敏感程度：

MAE： $MAE=1n∑i=1n∣yi?y^i∣\text{MAE} = \frac{1}{n} \sum_{i=1}^{n} |y_i - \hat{y}_i|$
MSE： $MSE=1n∑i=1n(yi?y^i)2\text{MSE} = \frac{1}{n} \sum_{i=1}^{n} (y_i - \hat{y}_i)^2$

從幾何角度看，MSE等價于歐氏距離的平方，而MAE等價于曼哈頓距離。這導致MSE對離群點更加敏感，而MAE更具魯棒性。

在噪聲服從高斯分布 $?～N(0,σ2)\epsilon \sim \mathcal{N}(0, \sigma^2)$ 的假設下：

MSE是最優損失函數
MSE對應于高斯噪聲下的最大似然估計（MLE）。此時，最小化MSE等價于最大化對數似然函數：
$arg?min?θ∑i=1n(yi?f(xi;θ))2?arg?max?θ∏i=1n12πσ2exp?(?(yi?f(xi;θ))22σ2)\arg\min_{\theta} \sum_{i=1}^{n} (y_i - f(x_i; \theta))^2 \quad \Leftrightarrow \quad \arg\max_{\theta} \prod_{i=1}^{n} \frac{1}{\sqrt{2\pi\sigma^2}} \exp\left(-\frac{(y_i - f(x_i; \theta))^2}{2\sigma^2}\right)$
高斯分布的二次指數形式直接對應平方誤差。
MAE的統計假設
MAE對應于噪聲服從拉普拉斯分布時的MLE。拉普拉斯分布的概率密度函數為：
$p(?)=12bexp?(?∣?∣b)p(\epsilon) = \frac{1}{2b} \exp\left(-\frac{|\epsilon|}{b}\right)$

$arg?min?θ∑i=1n∣yi?f(xi;θ)∣?arg?max?θ∏i=1n12bexp?(?∣yi?f(xi;θ)∣b)\arg\min_{\theta} \sum_{i=1}^{n} |y_i - f(x_i; \theta)| \quad \Leftrightarrow \quad \arg\max_{\theta} \prod_{i=1}^{n} \frac{1}{2b} \exp\left(-\frac{|y_i - f(x_i; \theta)|}{b}\right)$
此時，最小化MAE等價于最大化拉普拉斯分布下的對數似然。

MAE容易產生稀疏解的根本原因在于其梯度特性：

MAE的梯度恒定
MAE的梯度為：
$?MAE?θ={+1,if?yi?f(xi;θ)>0?1,if?yi?f(xi;θ)<0undefined,if?yi?f(xi;θ)=0\frac{\partial \text{MAE}}{\partial \theta} = \begin{cases} +1, & \text{if } y_i - f(x_i; \theta) > 0 \\ -1, & \text{if } y_i - f(x_i; \theta) < 0 \\ \text{undefined}, & \text{if } y_i - f(x_i; \theta) = 0 \end{cases}$
當參數接近零時，梯度仍保持恒定（±1），促使參數快速收斂到零。
MSE的梯度衰減
MSE的梯度為：
$?MSE?θ=?2(yi?f(xi;θ))??f(xi;θ)?θ\frac{\partial \text{MSE}}{\partial \theta} = -2(y_i - f(x_i; \theta)) \cdot \frac{\partial f(x_i; \theta)}{\partial \theta}$
當誤差接近零時，梯度趨近于零，導致參數更新變得非常緩慢，難以徹底消除小參數。
幾何解釋
從優化角度看，MAE的等高線是菱形（在二維空間中），其頂點位于坐標軸上；而MSE的等高線是圓形。當損失函數的最小值靠近坐標軸時，MAE的等高線更容易與坐標軸相交，從而使某些參數被置零。更多可見損失函數的等高線與參數置零的關系

在實際應用中，如果數據包含較多離群點或需要進行特征選擇，MAE是更合適的選擇；如果追求預測精度且噪聲近似高斯分布，MSE通常表現更好。

本文來自互聯網用戶投稿，該文觀點僅代表作者本人，不代表本站立場。本站僅提供信息存儲空間服務，不擁有所有權，不承擔相關法律責任。
如若轉載，請注明出處：http://www.pswp.cn/diannao/91592.shtml
繁體地址，請注明出處：http://hk.pswp.cn/diannao/91592.shtml
英文地址，請注明出處：http://en.pswp.cn/diannao/91592.shtml

如若內容造成侵權/違法違規/事實不符，請聯系多彩編程網進行投訴反饋email:809451989@qq.com，一經查實，立即刪除！