第3周 機器學習課堂記錄

1.學習問題的分類

  • 有監督的學習
    • 分類
    • 回歸
  • 無監督學習
    • 聚類
    • 密度估計:確定輸入空間中的數據的分布
    • 可視化:把高位空間中的數據投影到二維或三維空間
  • 強化學習
    • 不給定最優輸出的示例,而是通過試錯發現最優輸出

2.泛化versus過度擬合

背景引入:多項式曲線擬合

目標函數:y(X,W) = W^TX

損失函數:最小平方和\tilde{E}(\mathbf{w}) = \frac{1}{2} \sum_{i=1}^{N} \left\{ y(x_i, \mathbf{w}) - t_i \right\}^2

  • 泛化:正確預測不同于用于訓練的數據的新觀察的能力
  • 過擬合:目標函數的模型y過度擬合訓練數據,如果存在一個可選的模型y‘滿足error_D(y) < error_D(y')
    但是
    error(y) > error(y')
    其中,error_D(y)是訓練數據上的誤差,而error是整個數據分布上的誤差
  • 欠擬合

3.用于模型比較的測試集

  • 測試集:一個獨立的數據集,可以獲得泛化性能對M的依賴的一些定量的領悟。
  • root-mean-square(RMS) error 均方根誤差
    • E_{RMS} = \sqrt{2E(w)/N}
    • 除以N使得我們能夠在平等的基礎上比較不同大小的數據集
    • 開放確保E_{RMS}與目標變量t具有同樣的尺度和量綱

4.Regularization正則化

  • 一種常用于控制過擬合現象的技術
  • 給誤差函數添加一個懲罰項,以阻止系數達到大的值
    • \tilde{E}(\mathbf{w}) = \frac{1}{2} \sum_{i=1}^{N} \left\{ y(x_i, \mathbf{w}) - t_i \right\}^2 + \frac{\lambda}{2} \left\| \mathbf{w} \right\|^2
    • 其中\left\| \mathbf{w} \right\|^2 \equiv \mathbf{w}^\mathrm{T} \mathbf{w} = w_0^2 + w_1^2 + \dots + w_M^2
    • 并且系數λ控制正則化項與平方和誤差項相比的相對重要性。

5.驗證集

達成模型復雜度的適合的值的一種簡單方法,通過把可用的數據劃分成:

  • 一個訓練集,用于確定系數w
  • 一個驗證集,也叫做hold-out set,用于優化模型復雜度(要么M,要么λ)

訓練集:確定模型參數w

測試集:評價模型泛化性質

驗證集:調節模型超參M

y(X,W) = w_0 + w_1x + ... + w_Mx^M


6.Gaussian Distribution 高斯分布

單個實值變量x的情形,高斯分布定義為

\mathcal{N}(x|\mu,\sigma^2) = \frac{1}{(2\pi\sigma^2)^{1/2}} \exp\left\{ -\frac{1}{2\sigma^2}(x - \mu)^2 \right\}

式中?\mu?是均值(mean),\sigma^2?是方差(variance),方差的平方根?\sigma叫做標準誤(standard deviation),方差的倒數?\beta(\beta=1/\sigma^2)?叫做精度(precision)。


7.Gaussian Parameter Estimation

  • 數據集 \mathcal{X} = (x_1, \dots, x_N)^{\mathrm{T}},表示標量x的N個觀察。
  • 數據獨立地從同一個高斯分布采樣得到,均值和方差未知。
  • 利用數據集確定高斯分布的參數。
  • 由于數據集\mathcal{X}獨立同分布,因此,給定μ和方差σ2,數據集的概率(似然)
    • p(\mathcal{X}|\mu, \sigma^2) = \prod_{i=1}^{N} \mathcal{N}(x_i|\mu, \sigma^2)

8.Maximum(Log) Likelihood 最大似然估計

  • 對數似然函數
    • \ln p(\mathcal{X}|\mu, \sigma^2) = -\frac{1}{2\sigma^2} \sum_{i=1}^{N} (x_i - \mu)^2 - \frac{N}{2} \ln \sigma^2 - \frac{N}{2} \ln 2\pi
  • 最大似然解
    • 樣本均值??\mu_{\text{ML}} = \frac{1}{N} \sum_{i=1}^{N} x_i
    • 樣本方差?\sigma_{\text{ML}}^2 = \frac{1}{N} \sum_{i=1}^{N} (x_i - \mu_{\text{ML}})^2

9.Limitations of the Maximum Likelihood Approach

  • 系統地低估分布的方差
    • E[\mu_{\text{ML}}] = \mu
    • E[\sigma_{\text{ML}}^2] = \frac{N - 1}{N} \sigma^2? (有估計偏差)
  • 和過擬合有密切關系

本文來自互聯網用戶投稿,該文觀點僅代表作者本人,不代表本站立場。本站僅提供信息存儲空間服務,不擁有所有權,不承擔相關法律責任。
如若轉載,請注明出處:http://www.pswp.cn/web/96269.shtml
繁體地址,請注明出處:http://hk.pswp.cn/web/96269.shtml
英文地址,請注明出處:http://en.pswp.cn/web/96269.shtml

如若內容造成侵權/違法違規/事實不符,請聯系多彩編程網進行投訴反饋email:809451989@qq.com,一經查實,立即刪除!

相關文章

消息隊列(MQ)高級特性深度剖析:詳解RabbitMQ與Kafka

一、引言&#xff1a;為什么需要關注高級特性&#xff1f; 在現代分布式系統架構中&#xff0c;消息隊列&#xff08;Message Queue&#xff09;已成為不可或缺的核心組件。初級使用消息隊列可能只需幾行代碼就能實現基本功能&#xff0c;但要真正發揮其在大規模生產環境中的威…

【GPT入門】第65課 vllm指定其他卡運行的方法,解決單卡CUDA不足的問題

【GPT入門】第65課 vllm指定其他卡運行的方法&#xff0c;解決單卡CUDA不足的問題&#xff11;.原理說明&#xff1a;&#xff12;.實踐&#xff11;.原理 要將 vllm 部署在第二張 GPU 卡上&#xff08;設備編號為 1&#xff09;&#xff0c;只需在命令前添加 CUDA_VISIBLE_DE…

Spring Boot Actuator自定義指標與監控實踐指南

Spring Boot Actuator自定義指標與監控實踐指南 本篇文章以生產環境實戰經驗為主線&#xff0c;結合某電商系統的業務場景&#xff0c;講解如何在Spring Boot Actuator中添加并暴露自定義指標&#xff0c;并使用Prometheus和Grafana進行完整的監控與告警配置。 一、業務場景描述…

Vue報錯<template v-for=“option in cardOptions“ :key=“option.value“>

在Vue項目中遇到報錯&#xff0c;原因是模板中使用了<template>標簽內的v-for指令&#xff0c;而當前Vue版本不支持此用法。解決方案是移除<template>標簽&#xff0c;直接在<el-option>上使用v-for。同時優化計算屬性cardOptions&#xff0c;使其能夠兼容歷…

人工智能學習:Transformer結構中的規范化層(層歸一化)

Transformer結構中的規范化層(層歸一化) 一、規范化層(層歸一化)介紹 概念 層歸一化(Layer Normalization) 是一種用于提高深度神經網絡訓練穩定性和加速收斂的技術,廣泛應用于現代深度學習模型中,尤其是在Transformer等序列建模網絡中。它通過對每一層的輸出進行歸一化…

盼之代售 最新版 decode__1174

聲明 本文章中所有內容僅供學習交流使用&#xff0c;不用于其他任何目的&#xff0c;抓包內容、敏感網址、數據接口等均已做脫敏處理&#xff0c;嚴禁用于商業用途和非法用途&#xff0c;否則由此產生的一切后果均與作者無關&#xff01; 逆向分析 部分python代碼 cp1 execj…

Transformer系列 | Pytorch復現Transformer

&#x1f368; 本文為&#x1f517;365天深度學習訓練營中的學習記錄博客&#x1f356; 原作者&#xff1a;K同學啊 一、Transformer和Seq2Seq 在之前的博客中我們學習了Seq2Seq(深度學習系列 | Seq2Seq端到端翻譯模型)&#xff0c;知曉了Attention為RNN帶來的優點。那么有沒有…

【MySQL】常用SQL語句

介紹常用的DDL語句、DML語句基本語法分號結尾使用空格和縮進不區分大小寫--或#注釋單行內容 /*注釋多行內容*/DDL數據定義語句&#xff1a;定義數據庫、表、字段一、操作庫-- 創建庫create database db1;-- 創建庫是否存在&#xff0c;不存在則創建create database if not exi…

云手機就是虛擬機嗎?

云手機并非等同于虛擬機&#xff0c;盡管二者存在一定相似性&#xff0c;但有著諸多區別&#xff0c;以下從多個方面來分析&#xff1a;云手機是一種基于云計算技術&#xff0c;將云端服務器虛擬化為手機設備&#xff0c;用戶能通過網絡遠程操控的虛擬手機服務&#xff0c;它從…

準確--Nginx 1.28.0 安裝與配置流程

Nginx 1.28.0 安裝與配置流程 1. 下載與解壓 cd ~ wget http://nginx.org/download/nginx-1.28.0.tar.gz tar -zxvf nginx-1.28.0.tar.gz cd nginx-1.28.02. 配置編譯參數 ./configure \--prefix/home/ynnewweb/nginx \--with-http_ssl_module \--with-http_gzip_static_module…

無標記點動捕新范式:Xsens系統助力人形機器人實現毫米級動作復刻

Xsen搭載Manus數據手套在機器人操作與機器學習中的應用當前&#xff0c;人形機器人正加速向工業裝配、家庭陪護、倉儲物流等場景滲透&#xff0c;而 “如何讓機器人的動作既符合人類運動規律&#xff0c;又能實現高精度執行” 成為制約其落地的核心瓶頸。Xsens 高精度全身動捕系…

mysql57超管root忘記密碼怎么辦

目錄 背景 1.首先停止數據庫 2.使用免密模式啟動 3.修改密碼 3.1刷新權限配置 3.2修改密碼 4.殺掉mysql 5.重新正常啟動mysql 6.查看mysql狀態 7.驗證 7.1首先服務器本地驗證 7.2遠程驗證 背景 數據庫密碼忘記了,急的抓耳撓腮,怎么也想不起來,于是就開始重置吧 1.…

RESTful API:@RequestParam與@PathVariable實戰對比

RequestParam vs PathVariable 在刪除和查找操作中的使用差異 在項目實戰中&#xff0c;選擇使用 RequestParam 還是 PathVariable 來接收ID參數&#xff0c;通常基于以下幾個考慮因素&#xff1a; 1. RESTful API 設計原則 查找操作使用 PathVariable GetMapping("/depts…

劇本殺小程序系統開發:開啟沉浸式社交娛樂新紀元

在當今數字化浪潮席卷的時代&#xff0c;社交娛樂方式正經歷著前所未有的變革。劇本殺&#xff0c;這一融合了角色扮演、推理懸疑與社交互動的線下娛樂項目&#xff0c;近年來迅速風靡全國&#xff0c;成為年輕人熱衷的社交新寵。而隨著移動互聯網的蓬勃發展&#xff0c;劇本殺…

中線安防保護器,也叫終端電氣綜合治理保護設備為現代生活筑起安全防線

中線安防保護器&#xff08;Neutral Line Protection Device&#xff0c;簡稱NLPD&#xff09;是一種專門用于監測和保護電力系統中性線的安全裝置。中線安防保護器的基本原理為:通過電流檢測環節采集系統中性線上過電流信息&#xff0c; 經控制器快速計算并提取各次諧波電流的…

Spring Cloud Alibaba快速入門02-Nacos配置中心(下)

文章目錄前言配置中心 - 數據隔離示例1.先創建命名空間2.創建配置3.克隆配置4.動態切換環境5.yml多文檔模式spring.profiles.activedevspring.profiles.activetest總結前言 上一章簡單了解了Nacos配置中心的基本用法&#xff0c;這一章將開始Nacos配置中心的實戰案例。 配置中…

基于結構光相移法的三維重建

基于結構光相移法的三維重建程序 1. 介紹 結構光相移法是一種常用的三維重建技術&#xff0c;通過投射條紋圖案并捕捉其變形來計算物體的三維形狀。相移法通過多次投射不同相位的條紋圖案&#xff0c;利用相位信息來提取物體表面的深度信息。 2. MATLAB實現 2.1 生成條紋圖案 首…

機器學習10——降維與度量學習(K近鄰、多維縮放、主成分分析)

上一章&#xff1a;機器學習09——聚類 下一章&#xff1a;機器學習11——特征選擇與稀疏學習 機器學習實戰項目&#xff1a;【從 0 到 1 落地】機器學習實操項目目錄&#xff1a;覆蓋入門到進階&#xff0c;大學生就業 / 競賽必備 文章目錄一、k近鄰學習&#xff08;kNN&#…

Js 圖片加載完成 與 圖片緩存加載的區別

這兩個有什么區別// 圖片加載完成后淡入$img.on(load, function () {$img.css(opacity, 1);});// 處理圖片緩存情況if ($img[0].complete) {$img.css(opacity, 1);}要理解這兩段代碼的區別&#xff0c;需要先明確它們的核心作用場景和執行時機差異—— 本質是解決 “圖片加載完…

國產化PDF處理控件Spire.PDF教程:如何在 Java 中通過模板生成 PDF

在企業級應用開發中&#xff0c;生成 PDF 文檔是一項非常常見的需求。無論是發票、報告、合同&#xff0c;還是其他業務文檔&#xff0c;開發人員通常都需要一種高效、穩定的方式來創建 PDF。與其逐行繪制 PDF 內容&#xff0c;不如直接利用 模板 ——常見的模板形式包括 HTML …