【機器學習及深度學習】機器學習模型的誤差:偏差、方差及噪聲

機器學習模型的誤差分析

    • V1.0
    • 機器學習模型的衡量準則
    • 概念引入
    • 機器學習模型誤差分析
    • 誤差出現的原因及消除

V1.0

機器學習模型的衡量準則

衡量機器學習模型的好壞可以考慮以下幾個方面:

  • 偏差(Bias)
    在充分訓練的情況下,機器學習模型是否能夠較好地擬合訓練數據,以反映真實規律。

    這些問題可以被稱為模型的能力,衡量這一問題的指標稱為偏差(Bias)。

  • 方差(Variance)
    在充分訓練的情況下,不同的機器學習模型對不同訓練數據集敏感程度不同。某些機器學習模型使用不同的訓練數據進行訓練,所得到的模型的輸出結果較為穩定。而某些機器學習模型使用不同的訓練數據進行訓練,所得到的模型的輸出結果不穩定,有較大波動,即對不同訓練數據的魯棒程度較低。

    衡量機器學習對訓練數據的魯棒程度這一問題的指標稱為方差(Variance)。

  • 噪聲(Noise)
    機器學習模型是為了擬合訓練數據,以達到反映真實數據規律的功能。在實際情況中,采集到的訓練數據往往不等于真實數據,訓練數據往往會包含隨機波動,因此會對模型的結果造成一定的誤差。訓練數據的隨機波動往往是因為測量方法限制、測量精度限制、標注錯誤等而產生的。

    衡量訓練數據中真實規律數據以外的隨機擾動的指標稱為噪聲(Noise)。

概念引入

為了對機器學習模型的誤差進行分析,需要明確以下幾個概念

  • f ^ ( x ) \space\hat{f}(x)\space ?f^?(x)?數據預測函數(Estimated function)
    數據預測函數 f ^ ( x ) \space\hat{f}(x)\space ?f^?(x)?是通過訓練過程得到的機器學習模型,使用該模型對輸入數據進行預測。
    同樣結構的機器學習模型,使用不同的訓練集和初始值以及訓練方法進行訓練,應該會得到有差異的結果。因此對預測函數的輸出結果求期望值 E ( f ^ ( x ) ) \space E(\hat{f}(x))\space ?E(f^?(x))?是有意義的,該期望值能夠反映不同訓練條件下,模型結果的平均水平。

  • y \space y\space ?y?觀測值(Observed Value)
    使用觀測手段觀測所得到的數據,即訓練時模型使用的實際數據。觀測值是包含噪聲的真實數據,由于測量方法限制、測量精度限制、標注錯誤等原因會和真實值 f ( x ) \space f(x)\space ?f(x)?有偏差。

    觀測值 y \space y\space ?y?與真實函數 f ( x ) \space f(x)\space ?f(x)?的關系如下:
    y = f ( x ) + ? y=f(x)+\epsilon y=f(x)+?

    其中 ? \space \epsilon\space ???是噪聲,噪聲的方差為 V a r ( ? ) = σ 2 \space{Var(\epsilon)}=\sigma^2 ?Var(?)=σ2

  • f ( x ) \space f(x)\space ?f(x)?真實函數(True Function)
    真實函數 f ( x ) \space f(x)\space ?f(x)?反映問題的數據的客觀真實規律,具體來說,即反映真實的數據輸入到輸出的映射規律,是理想的不包含噪聲的。采集的訓練數據往往是由真實數據及隨機擾動的噪聲 ? \space \epsilon\space ???兩部分組成的。

機器學習模型誤差分析

機器學習模型誤差可以分解為偏差、方差和噪聲3個部分,公式如下:
E [ ( f ^ ( x ) ? y ) 2 ] = Bias 2 ( f ^ ( x ) ) ? 偏差 + Var ( f ^ ( x ) ) ? 方差 + σ 2 ? 噪聲 E[(\hat{f}(x)-y)^2]=\underbrace{\text{Bias}^2(\hat{f}(x))}_{偏差}+\underbrace{\text{Var}(\hat{f}(x))}_{方差}+\underbrace{\sigma^2}_{噪聲} E[(f^?(x)?y)2]=偏差 Bias2(f^?(x))??+方差 Var(f^?(x))??+噪聲 σ2??
機器學習的誤差分析公式,在滿足噪聲獨立性、零均值噪聲和模型針對多個訓練集求期望時,公式是嚴謹的。這部分內容更加復雜,本文不進行探討,可以自行尋找資料研究。

  • 偏差(Bias)
    偏差反映了多次訓練模型預測結果與真實結果之間的系統性誤差。公式如下:
    B i a s ( f ^ ( x ) ) = E [ f ^ ( x ) ] ? f ( x ) Bias(\hat{f}(x))=E[\hat{f}(x)]-f(x) Bias(f^?(x))=E[f^?(x)]?f(x)
    公式理解:偏差即為預測模型的預測結果的期望與真實函數預測結果的差值。

    偏差反映了在充分訓練的情況下模型結構的能力。
    偏差越小,說明模型擬合能力越強,更適用于該種問題。偏差越小,也有可能是過擬合的原因,此時通常會偏差小而方差大。偏差越大,說明預測模型的預測結果的系統性偏離了要擬合的訓練數據,無法有效反應真實規律。

  • 方差(Variance)
    方差反映了模型對不同的訓練數據是否魯棒。訓練數據的隨機波動會對模型訓練結果產生影響。方差的公式如下:
    V a r ( f ^ ( x ) ) = E [ ( f ^ ( x ) ? E [ f ^ ( x ) ] ) 2 ] Var(\hat{f}(x))=E[(\hat{f}(x)-E[\hat{f}(x)])^2] Var(f^?(x))=E[(f^?(x)?E[f^?(x)])2]

    公式理解:方差為各個訓練集訓練結果 f ^ ( x ) \space \hat{f}(x)\space ?f^?(x)?分別減去所有預測結果的期望值 E [ f ^ ( x ) ] \space E[\hat{f}(x)] ?E[f^?(x)],每個差值 ( f ^ ( x ) ? E [ f ^ ( x ) ] ) \space (\hat{f}(x)-E[\hat{f}(x)])\space ?(f^?(x)?E[f^?(x)])?平方后求期望,即正常求方差的過程。

    方差反映了模型對不同訓練數據的敏感程度。方差高,同樣的訓練程度,不同的訓練集訓練出的機器學習模型的預測結果差異大。這通常是由于模型訓練發生了過擬合,模型過多的擬合了訓練數據中的噪聲,造成其泛化能力下降。低方差的情況下,不同訓練集訓練出的模型預測結果更穩定。

  • 噪聲(Noise)
    噪聲是由于訓練數據本身包含的不可約誤差,給機器學習模型造成的誤差。由于噪聲的存在,導致采集到的訓練數據偏離真實數據,這些有噪聲的訓練數據會限制模型性能的上限。

誤差出現的原因及消除

  • 高偏差的原因
    訓練不充分,或模型能力不足,可能是模型類型選擇不當或模型參數量不夠。

    解決方法:
    – 選擇更合適的模型。
    – 增加同種模型的復雜度或參數量。如線性回歸模型可使用多項式線性回歸,或神經網絡增加網絡層數和參數數量。

  • 高方差的原因
    模型過于復雜,擬合能力過強,導致過度擬合了特定訓練數據或噪聲,導致其泛化能力差。

    解決方法
    – 可以進行模型簡化,例如神經網絡減少參數數量。
    – 增加訓練數據量。
    – 使用正則化手段,如L1、L2正則化。
    – 使用集成學習方法。

  • 噪聲出現的原因
    噪聲產生于數據生成過程中的不確定因素,所導致的訓練數據的隨機擾動。
    噪聲產生的原因包括數據采集層面的原因,如攝像頭像素噪聲,聲音采集時的環境噪聲等。以及數據標注層面的噪聲,例如正負評論類別標注錯誤等。

    解決方法
    噪聲不可能完全消除,可以對數據進行處理盡量降低其影響。
    – 可以使用更加魯棒的模型。
    – 使用集成學習方法。

本文來自互聯網用戶投稿,該文觀點僅代表作者本人,不代表本站立場。本站僅提供信息存儲空間服務,不擁有所有權,不承擔相關法律責任。
如若轉載,請注明出處:http://www.pswp.cn/web/82548.shtml
繁體地址,請注明出處:http://hk.pswp.cn/web/82548.shtml
英文地址,請注明出處:http://en.pswp.cn/web/82548.shtml

如若內容造成侵權/違法違規/事實不符,請聯系多彩編程網進行投訴反饋email:809451989@qq.com,一經查實,立即刪除!

相關文章

混沌映射(Chaotic Map)

一.定義 混沌映射是指一類具有混沌行為的離散時間非線性動力系統,通常由遞推公式定義。其數學形式為 ,其中 f 是非線性函數,θ 為參數。它們以簡單的數學規則生成復雜的、看似隨機的軌跡,是非線性動力學和混沌理論的重要研究對象…

多群組部署

相關概念 星形拓撲和并行多組 如下圖,星形組網拓撲和并行多組組網拓撲是區塊鏈應用中使用較廣泛的兩種組網方式。 星形拓撲:中心機構節點同時屬于多個群組,運行多家機構應用,其他每家機構屬于不同群組,運行各自應用…

基于vue3-elemenyui的動態列案例

本案例主要是實現數據模型的解析以及實現el-table的動態列加載。 1.數據結構 公司A\B\C\測試1,是列,功能-url,是行數據,其中功能x是行頭。 this.rawData [{companyName: "公司A",rpWebShows: [{ "功能1": &…

Kerberos面試內容整理-Kerberos 與 LDAP/Active Directory 的集成

Kerberos 通常不會單獨存在于企業環境中,而是與目錄服務相結合以提供完整的身份管理方案。其中,Active Directory (AD) 是 Kerberos 集成應用的典型代表。Active Directory 是微軟的目錄服務,實現了 LDAP(輕量級目錄訪問協議)目錄和 Kerberos 認證的融合。在 AD 域控制器上…

Oracle DG庫控制文件IO錯誤導致宕機的應急處理

Oracle DG庫控制文件IO錯誤導致宕機的應急處理 事故現場偷天換日棋差一招事故現場 一套Oracle 19c DG環境的備庫宕機。 根據告警時間檢查實例宕機時間點附近的alert日志有如下重要信息: 2025-05-25T23:34:10.705385+08:00 KCF: read, write or open error, block=0x3377ee …

《前端面試題:前端盒模型》

前端盒模型完全指南:從原理到面試實戰 🎁 端午快樂! 各位前端小伙伴,端午節快樂!🥮 在這個粽葉飄香的時節,愿你的代碼如龍舟般一往無前,bug 如咸蛋黃般被完美包裹!今天我…

BERT:讓AI真正“讀懂”語言的革命

BERT:讓AI真正“讀懂”語言的革命 ——圖解谷歌神作《BERT: Pre-training of Deep Bidirectional Transformers》 2018年,谷歌AI團隊扔出一篇核彈級論文,引爆了整個NLP領域。這個叫BERT的模型在11項任務中屠榜,甚至超越人類表現…

爬蟲入門:從基礎到實戰全攻略

🧠 一、爬蟲基礎概念 1.1 爬蟲定義 爬蟲(Web Crawler)是模擬瀏覽器行為,自動向服務器發送請求并獲取響應數據的一種程序。主要用于從網頁中提取結構化數據,供后續分析、展示或存儲使用。 1.2 爬蟲特點 數據碎片化&…

uni-app學習筆記二十一--pages.json中tabBar設置底部菜單項和圖標

如果應用是一個多 tab 應用,可以通過 tabBar 配置項指定一級導航欄,以及 tab 切換時顯示的對應頁。 在 pages.json 中提供 tabBar 配置,不僅僅是為了方便快速開發導航,更重要的是在App和小程序端提升性能。在這兩個平臺&#xff…

行業分析---小米汽車2025第一季度財報

1 背景 最近幾年是新能源汽車的淘汰賽,前短時間比亞迪再次開始了降價,導致一片上市車企的股價大跌,足見車圈現在的敏感度。因此筆者會一直跟蹤新勢力車企的財報狀況,對之前財報分析感興趣的讀者朋友可以參考以下博客:…

Python 解釋器安裝全攻略(適用于 Linux / Windows / macOS)

目錄 一、Windows安裝Python解釋器1.1 下載并安裝Python解釋1.2 測試安裝是否成功1.3 設置pip的國內鏡像------永久配置 二、macOS安裝Python解釋器三、Linux下安裝Python解釋器3.1 Rocky8.10/Rocky9.5安裝Python解釋器3.2 Ubuntu2204/Ubuntu2404安裝Python解釋器3.3 設置pip的…

考研系列—操作系統:沖刺筆記(1-3章)

目錄 第一章 計算機系統概述 1.基本概念 2.內核態和用戶態 3.中斷(外中斷)、異常(內中斷-與當前執行的) 4.系統調用 5.操作系統引導程序 2021年真題: 6.操作系統結構 大綱新增 (1)分層結構 (2)模塊化 (3)外核 7.虛擬機 第二章 進程管理 1.畫作業運行的順序和甘…

監控 100 臺服務器磁盤內存CPU利用率

監控 100 臺服務器磁盤,內存,CPU利用率腳本 以下是一個優化后的監控腳本,用于同時監控100臺服務器的磁盤、內存和CPU利用率,并支持并發執行以提高效率: #!/bin/bash # 服務器監控腳本 - 支持并發獲取100臺服務器系統指標 # 功能…

[5-02-04].第01節:Jmeter環境搭建:

JMeter筆記大綱 Jmeter依賴于JDK,所以必須確保當前計算機上已經安裝了JDK,并且配置了環境變量 一、JMeter概述: 1.1.JMeter是什么: JMeter是Appache組織使用java開發的一款測試工具 可以用于對服務器、網絡或對象模擬巨大的負載…

【獸醫處方專用軟件】佳易王獸醫電子處方軟件:高效智能的寵物診療管理方案

一、軟件概述與核心優勢 (一)試用版獲取方式 資源下載路徑:進入博主頭像主頁第一篇文章末尾,點擊卡片按鈕;或訪問左上角博客主頁,通過右側按鈕獲取詳細資料。 說明:下載文件為壓縮包&#xff…

MapReduce(期末速成版)

起初在B站看3分鐘的速成視頻,感覺很多細節沒聽懂。 具體例子解析(文件內容去重) 對于兩個輸入文件,即文件A 和文件B,請編寫MapReduce 程序,對兩個文件進行合并,并剔除 其中重復的內容,得到一個新的輸出文件…

Java高級 | 【實驗四】Springboot 獲取前端數據與返回Json數據

隸屬文章: Java高級 | (二十二)Java常用類庫-CSDN博客 系列文章: Java高級 | 【實驗一】Spring Boot安裝及測試 最新-CSDN博客 Java高級 | 【實驗二】Springboot 控制器類相關注解知識-CSDN博客 Java高級 | 【實驗三】Springboot …

從零打造AI面試系統全棧開發

🤖 AI面試系統開發完整教程 📋 項目概述 本教程將帶你從零開始構建一個完整的AI面試系統,包含前端、后端、AI集成和部署的全流程。 源碼地址 技術棧 前端: React TypeScript Vite Vaadin Components后端: Spring Boot Spring Securi…

【硬件】PCIe協議 | 電腦的高速公路

文章目錄 PCIe | 外圍設備高速互聯通道(peripheral component interconnect express)的核心概念和應用 基礎概念 1.1 電腦內的”高速“,連接CPU、顯卡、SSD(固態硬盤)等核心組件;數據傳輸速度極快&#xff…

【 Redis | 完結篇 緩存優化 】

前言:本節包含常見redis緩存問題,包含緩存一致性問題,緩存雪崩,緩存穿透,緩存擊穿問題及其解決方案 1. 緩存一致性 我們先看下目前企業用的最多的緩存模型。緩存的通用模型有三種: 緩存模型解釋Cache Asi…