【Day44】

DAY 44 預訓練模型

知識點回顧:

  1. 預訓練的概念
  2. 常見的分類預訓練模型
  3. 圖像預訓練模型的發展史
  4. 預訓練的策略
  5. 預訓練代碼實戰:resnet18

作業:

  1. 嘗試在cifar10對比如下其他的預訓練模型,觀察差異,盡可能和他人選擇的不同
  2. 嘗試通過ctrl進入resnet的內部,觀察殘差究竟是什么

在統計學和機器學習領域,**殘差(Residual)是一個核心概念**,用于衡量模型預測值與實際觀測值之間的差異。理解殘差有助于評估模型性能、診斷模型問題,并優化模型效果。以下是關于殘差的詳細解析:### **一、殘差的定義**
- **數學表達式**:  對于給定的觀測值 \( y_i \) 和模型預測值 \( \hat{y}_i \),殘差 \( e_i \) 定義為:  \[e_i = y_i - \hat{y}_i\]  例如:若實際房價為100萬元,模型預測為95萬元,則殘差為 \( 100 - 95 = 5 \) 萬元。### **二、殘差與誤差的區別**
殘差常與“誤差(Error)”混淆,但兩者含義不同:  
| **對比維度**       | **殘差(Residual)**                | **誤差(Error)**                  |
|--------------------|-------------------------------------|------------------------------------|
| **本質**           | 模型預測值與實際觀測值的差異        | 真實值與理論值(不可觀測)的差異   |
| **可觀測性**       | 可通過數據直接計算得出              | 理論上存在,無法直接觀測           |
| **用途**           | 用于模型評估、診斷和優化            | 用于描述模型的理論偏差             |### **三、殘差的作用**
#### 1. **評估模型擬合效果**  - **直觀判斷**:殘差絕對值越小,模型預測越準確;反之,模型擬合效果差。  - **統計指標**:通過殘差的統計量(如均值、方差、均方誤差(MSE)、平均絕對誤差(MAE))量化模型性能。  - 例如:若殘差均值接近0,說明模型無系統性偏差;若殘差方差大,說明預測值波動大。#### 2. **診斷模型問題**  - **殘差分析圖**:通過繪制殘差圖(如殘差-預測值圖、殘差-自變量圖),識別模型缺陷:  - **非線性關系**:若殘差呈現曲線趨勢(如U型、倒U型),說明模型可能忽略了非線性關系(需引入多項式特征或換用非線性模型)。  - **異方差性**:若殘差隨預測值增大而擴散(如扇形分布),說明數據存在異方差性(需數據變換或使用加權回歸)。  - **異常值**:若個別殘差絕對值顯著偏大,可能對應數據中的異常值,需檢查數據或調整模型。#### 3. **優化模型**  - 通過分析殘差模式,指導模型改進:  - 增加特征(如交互項、多項式項)以捕捉非線性關系;  - 更換模型(如從線性回歸換為隨機森林、神經網絡);  - 處理異常值或對數據進行標準化/歸一化。### **四、殘差的類型(以回歸模型為例)**
1. **普通殘差(Ordinary Residual)**  即最基礎的殘差 \( e_i = y_i - \hat{y}_i \),適用于初步模型評估。  2. **標準化殘差(Standardized Residual)**  - 對殘差進行標準化處理,消除量綱影響:  \[\text{標準化殘差} = \frac{e_i}{\hat{\sigma}}\]  其中 \( \hat{\sigma} \) 為殘差的估計標準差,用于比較不同樣本的殘差大小。  3. **學生化殘差(Studentized Residual)**  - 進一步考慮單個樣本對模型的影響,剔除當前樣本后計算殘差,用于檢測異常值。### **五、殘差的假設(以線性回歸為例)**
在經典線性回歸模型中,殘差需滿足以下假設(**高斯-馬爾可夫假設**):  
1. **零均值**:\( E(e_i) = 0 \)(模型無系統性偏差);  
2. **同方差性**:\( \text{Var}(e_i) = \sigma^2 \)(殘差方差恒定);  
3. **無自相關性**:\( \text{Cov}(e_i, e_j) = 0 \)(殘差之間相互獨立);  
4. **正態性**:\( e_i \sim N(0, \sigma^2) \)(殘差服從正態分布)。  
若殘差不滿足這些假設,模型的參數估計和統計檢驗將失效,需通過數據變換或模型調整解決。### **六、殘差在機器學習中的應用**
在機器學習中,殘差的概念同樣重要:  
- **集成學習**:如梯度提升樹(GBDT)通過擬合殘差逐步優化模型,每棵樹學習前序模型的殘差,最終累加預測值。  
- **模型診斷**:通過交叉驗證計算殘差,檢測模型是否過擬合(如訓練集殘差低但測試集殘差高,可能過擬合)。  ### **總結**
殘差是連接模型預測與實際數據的橋梁,其核心價值在于:  
- **量化差異**:衡量模型預測的準確性;  
- **揭示規律**:通過殘差模式發現數據中的隱藏信息(如非線性、異常值);  
- **指導優化**:為模型改進提供方向。  
熟練運用殘差分析,是提升數據分析和建模能力的關鍵環節。

浙大疏錦行

本文來自互聯網用戶投稿,該文觀點僅代表作者本人,不代表本站立場。本站僅提供信息存儲空間服務,不擁有所有權,不承擔相關法律責任。
如若轉載,請注明出處:http://www.pswp.cn/news/908156.shtml
繁體地址,請注明出處:http://hk.pswp.cn/news/908156.shtml
英文地址,請注明出處:http://en.pswp.cn/news/908156.shtml

如若內容造成侵權/違法違規/事實不符,請聯系多彩編程網進行投訴反饋email:809451989@qq.com,一經查實,立即刪除!

相關文章

python打卡訓練營打卡記錄day44

知識點回顧: 預訓練的概念常見的分類預訓練模型圖像預訓練模型的發展史預訓練的策略預訓練代碼實戰:resnet18 作業: 嘗試在cifar10對比如下其他的預訓練模型,觀察差異,盡可能和他人選擇的不同嘗試通過ctrl進入resnet的…

Vue跨層級通信

下面,我們來系統的梳理關于 Vue跨層級通信 的基本知識點: 一、跨層級通信核心概念 1.1 什么是跨層級通信 跨層級通信是指在組件樹中,祖先組件與后代組件(非直接父子關系)之間的數據傳遞和交互方式。這種通信模式避免了通過中間組件層層傳遞 props 的繁瑣過程。 1.2 適用…

webPack基本使用步驟

webPack基本使用步驟 關于webPackwebPack配置的幾個概念entry(入口)output(輸出)loader(輸出)plugin(插件)mode(模式) 基本使用過程示例1.創建測試目錄和代碼…

龍虎榜——20250604

上證指數縮量收陽線,量能依然在5天線上,股價也在5天線上。 深證指數放量收陽線,量能站上5天均線,但仍受中期60天均線壓制。 2025年6月4日龍虎榜行業方向分析 1. 黃金 代表標的:曼卡龍、菜百股份。 驅動邏輯&#…

Viggle:開啟視頻人物替換新紀元

Viggle 的出現,為視頻人物替換帶來了前所未有的變革,為創作者和愛好者們打開了一扇通往無限可能的大門。 一、Viggle 技術原理剖析 Viggle 是一款基于先進人工智能技術的創新平臺,其核心在于能夠精準實現靜態圖片與動態視頻的融合轉化。它…

【BUG解決】關于BigDecimal與0的比較問題

這是一個很細小的知識點,但是很容易被忽略掉,導致系統問題,因此記錄下來 問題背景 明明邏輯上看a和b都不為0才會調用除法,但是系統會報錯:java.lang.ArithmeticException異常: if (!a.equals(BigDecimal…

千年之后再出發,銅官窯駛入微短劇的數字航道

過去一年里,微短劇已經成為走向全民關注、平臺扶持、政策引導的“內容新主流”。從市值百億的爆款平臺到走出國門的“短劇出海”,微短劇正在重塑中國數字文化的表達方式與產業結構,也成為各地競相爭奪的“新藍海”。 就在這樣的背景下&#…

數據庫管理-第333期 Oracle 23ai:RAC打補丁完全不用停機(20250604)

數據庫管理333期 2025-06-04 數據庫管理-第333期 Oracle 23ai:RAC打補丁完全不用停機(20250604)1 概念2 要求3 操作流程4 轉移失敗處理總結 數據庫管理-第333期 Oracle 23ai:RAC打補丁完全不用停機(20250604&#xff0…

Trae CN IDE自動生成注釋功能測試與效率提升全解析

Trae CN IDE 的自動注釋功能可以通過 AI 驅動的代碼分析生成自然語言注釋,以下是具體測試方法和優勢總結: 一、Python 代碼注釋生成測試 1. 測試環境 IDE:Trae CN IDE(需確認支持 Python)代碼示例: def …

軟考 系統架構設計師系列知識點之雜項集萃(79)

接前一篇文章:軟考 系統架構設計師系列知識點之雜項集萃(78) 第141題 軟件測試一般分為兩個大類:動態測試和靜態測試。前者通過運行程序發現錯誤,包括()等方法;后者采用人工和計算機…

有公網ip但外網訪問不到怎么辦?內網IP端口映射公網連接常見問題和原因

有公網IP但外網訪問不到的核心原因通常包括:端口未正確映射、防火墻限制、DNS解析問題、運營商端口屏蔽或路由配置錯誤?。需依次排查這些關鍵環節,其中端口映射和防火墻設置是最常見的原因。?? ?內網IP端口映射公網連接常見問題和原因及解決方案 1…

HttpServletResponse 對象用來做什么?

HttpServletResponse 對象是由 Servlet 容器創建并傳遞給 Servlet 的 service() 方法(以及間接傳遞給 doGet(), doPost() 等方法)的。它的核心作用是讓 Servlet 能夠向客戶端(通常是瀏覽器)發送 HTTP 響應。 通過 HttpServletRes…

FTPS、HTTPS、SMTPS以及WebSockets over TLS的概念及其應用場景

一、什么是FTPS? FTPS,英文全稱File Transfer Protocol with support for Transport Layer Security (SSL/TLS),安全文件傳輸協議,是一種對常用的文件傳輸協議(FTP)添加傳輸層安全(TLS)和安全套接層(SSL)加密協議支持的擴展協議。…

前端??HTML contenteditable 屬性使用指南

??什么是 contenteditable? HTML5 提供的全局屬性,使元素內容可編輯類似于簡易富文本編輯器兼容性?? 支持所有現代瀏覽器(Chrome、Firefox、Safari、Edge) 移動端(iOS/Android)部分鍵盤行為需測試 &l…

持續領跑中國異地組網路由器市場,貝銳蒲公英再次登頂銷量榜首

作為國產遠程連接SaaS服務的創領者,貝銳持續引領行業發展,旗下貝銳蒲公英異地組網路由器,憑借出色的技術實力和市場表現,斬獲2024年線上電商平臺市場銷量份額中國第一的佳績,充分彰顯了其在網絡解決方案與異地組網領域…

五大主流大模型推理引擎深度解析:llama.cpp、vLLM、SGLang、DeepSpeed和Unsloth的終極選擇指南

在人工智能的競技場上,大模型推理框架就像是為超級跑車精心調校的引擎系統——選對了能讓你的AI應用一騎絕塵,選錯了可能連"停車場"都開不出去。這些框架的核心價值在于將訓練好的"大腦"轉化為實際可用的"肌肉記憶",而選擇標準則需要像職業賽…

前端面試二之運算符與表達式

目錄 1.JavaScript 中的 和 運算符 2.|| (邏輯或) 運算符 與 ES6 默認參數的區別 與 ?? (空值合并運算符) 的區別 3.?.(可選鏈)運算符 (1). 安全訪問深層嵌套屬性 (2). 安全調用可能不存在的函數 (3). 安全訪問數組元素 4.展開運算符 (..…

GB/T 24507-2020 浸漬紙層壓實木復合地板檢測

浸漬紙層壓實木地板是指以一層或多層專用紙浸漬熱固性氨基樹脂,經干燥后鋪裝在膠合板基材正面,專用紙表面加耐磨層,基材背面可加平衡層,經熱壓、成型的地板。 GB/T 24507-2020 浸漬紙層壓實木復合地板測試項目: 測試項…

AWS DocumentDB vs MongoDB:數據庫的技術抉擇

隨著非關系型數據庫在現代應用中的廣泛應用,文檔型數據庫因其靈活的結構與出色的擴展性,逐漸成為企業開發與架構設計中的核心選擇。在眾多文檔數據庫中,MongoDB 憑借其成熟生態與社區支持占據主導地位;與此同時,AWS 提…

微信小程序實現運動能耗計算

微信小程序實現運動能耗計算 近我做了一個挺有意思的微信小程序,能夠實現運動能耗的計算。只需要輸入性別、年齡、體重、運動時長和運動類型這些信息,就能算出對應的消耗熱量。 具體來說,在小程序里,性別不同,身體基…