DAY 44 預訓練模型
知識點回顧:
- 預訓練的概念
- 常見的分類預訓練模型
- 圖像預訓練模型的發展史
- 預訓練的策略
- 預訓練代碼實戰:resnet18
作業:
- 嘗試在cifar10對比如下其他的預訓練模型,觀察差異,盡可能和他人選擇的不同
- 嘗試通過ctrl進入resnet的內部,觀察殘差究竟是什么
在統計學和機器學習領域,**殘差(Residual)是一個核心概念**,用于衡量模型預測值與實際觀測值之間的差異。理解殘差有助于評估模型性能、診斷模型問題,并優化模型效果。以下是關于殘差的詳細解析:### **一、殘差的定義**
- **數學表達式**: 對于給定的觀測值 \( y_i \) 和模型預測值 \( \hat{y}_i \),殘差 \( e_i \) 定義為: \[e_i = y_i - \hat{y}_i\] 例如:若實際房價為100萬元,模型預測為95萬元,則殘差為 \( 100 - 95 = 5 \) 萬元。### **二、殘差與誤差的區別**
殘差常與“誤差(Error)”混淆,但兩者含義不同:
| **對比維度** | **殘差(Residual)** | **誤差(Error)** |
|--------------------|-------------------------------------|------------------------------------|
| **本質** | 模型預測值與實際觀測值的差異 | 真實值與理論值(不可觀測)的差異 |
| **可觀測性** | 可通過數據直接計算得出 | 理論上存在,無法直接觀測 |
| **用途** | 用于模型評估、診斷和優化 | 用于描述模型的理論偏差 |### **三、殘差的作用**
#### 1. **評估模型擬合效果** - **直觀判斷**:殘差絕對值越小,模型預測越準確;反之,模型擬合效果差。 - **統計指標**:通過殘差的統計量(如均值、方差、均方誤差(MSE)、平均絕對誤差(MAE))量化模型性能。 - 例如:若殘差均值接近0,說明模型無系統性偏差;若殘差方差大,說明預測值波動大。#### 2. **診斷模型問題** - **殘差分析圖**:通過繪制殘差圖(如殘差-預測值圖、殘差-自變量圖),識別模型缺陷: - **非線性關系**:若殘差呈現曲線趨勢(如U型、倒U型),說明模型可能忽略了非線性關系(需引入多項式特征或換用非線性模型)。 - **異方差性**:若殘差隨預測值增大而擴散(如扇形分布),說明數據存在異方差性(需數據變換或使用加權回歸)。 - **異常值**:若個別殘差絕對值顯著偏大,可能對應數據中的異常值,需檢查數據或調整模型。#### 3. **優化模型** - 通過分析殘差模式,指導模型改進: - 增加特征(如交互項、多項式項)以捕捉非線性關系; - 更換模型(如從線性回歸換為隨機森林、神經網絡); - 處理異常值或對數據進行標準化/歸一化。### **四、殘差的類型(以回歸模型為例)**
1. **普通殘差(Ordinary Residual)** 即最基礎的殘差 \( e_i = y_i - \hat{y}_i \),適用于初步模型評估。 2. **標準化殘差(Standardized Residual)** - 對殘差進行標準化處理,消除量綱影響: \[\text{標準化殘差} = \frac{e_i}{\hat{\sigma}}\] 其中 \( \hat{\sigma} \) 為殘差的估計標準差,用于比較不同樣本的殘差大小。 3. **學生化殘差(Studentized Residual)** - 進一步考慮單個樣本對模型的影響,剔除當前樣本后計算殘差,用于檢測異常值。### **五、殘差的假設(以線性回歸為例)**
在經典線性回歸模型中,殘差需滿足以下假設(**高斯-馬爾可夫假設**):
1. **零均值**:\( E(e_i) = 0 \)(模型無系統性偏差);
2. **同方差性**:\( \text{Var}(e_i) = \sigma^2 \)(殘差方差恒定);
3. **無自相關性**:\( \text{Cov}(e_i, e_j) = 0 \)(殘差之間相互獨立);
4. **正態性**:\( e_i \sim N(0, \sigma^2) \)(殘差服從正態分布)。
若殘差不滿足這些假設,模型的參數估計和統計檢驗將失效,需通過數據變換或模型調整解決。### **六、殘差在機器學習中的應用**
在機器學習中,殘差的概念同樣重要:
- **集成學習**:如梯度提升樹(GBDT)通過擬合殘差逐步優化模型,每棵樹學習前序模型的殘差,最終累加預測值。
- **模型診斷**:通過交叉驗證計算殘差,檢測模型是否過擬合(如訓練集殘差低但測試集殘差高,可能過擬合)。 ### **總結**
殘差是連接模型預測與實際數據的橋梁,其核心價值在于:
- **量化差異**:衡量模型預測的準確性;
- **揭示規律**:通過殘差模式發現數據中的隱藏信息(如非線性、異常值);
- **指導優化**:為模型改進提供方向。
熟練運用殘差分析,是提升數據分析和建模能力的關鍵環節。
浙大疏錦行