機器學習week3-分類、正則化

1. 邏輯回歸

1.1. 線性回歸 vs 邏輯回歸

對比維度

線性回歸

邏輯回歸

任務類型

回歸(預測連續值)

分類(預測離散類別)

輸出范圍

(?∞,+∞)

[0,1](概率值)

損失函數

均方誤差(MSE)

對數損失(交叉熵損失)

假設條件

假設輸出與特征呈線性關系

假設概率的對數幾率與特征呈線性關系

1.2. 場景:腫瘤分類

  • X軸:腫瘤大小;Y軸:0-良性,-惡性
  • 決策邊界(decision boundary:由線性函數 (f_{w,b}(x) = wx + b) 定義,用于劃分兩個類別
    • 決策邊界及左邊:0-良性,右邊:1-惡性

在右邊添加額外訓練樣本(腫瘤很大的樣本)會導致線性函數發生偏移

  • (藍)線性函數變成(綠)線性函數;
  • 決策邊界也右移
    • 原本為惡性的腫瘤樣本預測為0-良性
    • 顯然錯誤,右邊的樣本不應該影響怎么分類良惡性的
    • 添加新的樣本,線性函數更差

1.3. 邏輯函數

Logistic Function,也稱為 Sigmoid 函數,S 形曲線函數。它將任意實數輸入值映射到區間 (0, 1)。

g(x) =1/(1 + e^(-x))

  • e 是自然常數(約等于 2.71828)

1.4. 構建邏輯回歸算法

輸入一個特征/一組特征x,輸出一個(0,1)間的數字

  1. 定義z值:z= wx + b
  2. z值作為輸入,帶入到邏輯函數 g(z) =1/(1 + e^(-z)) 中
  3. 得到邏輯回歸模型 f(x)=g(wx+b)

輸出的理解:對于給定輸入x值時,類別y=1的概率

  • 腫瘤大小為x時,腫瘤為惡性的概率

2. 決策邊界

z= wx + b ----> g(z) =1/(1 + e^(-z)) ------> f(x)=g(wx+b)

  1. f(x)>0.5時,表分類=1概率>0.5,分類=1;否則f(x)<0.5時,表分類=1概率<0.5,分類=0
  2. f(x)>0.5時,根據邏輯函數曲線圖,z>0,z=wx+b
  3. wx+b>0時,z>0,f(x)>0.5,分類=1;wx+b<0時,z<0,f(x)<0.5,分類=0
  4. 決策邊界:wx+b=0的線

有兩個輸入特征:x1、x2

  • z=w1x1+w2x2+b
  • f(x)=g(w1x1+w2x2+b)
  • 決策邊界:w1x1+w2x2+b=0

令w1=w2=1,b=-3

  • z=x1+x2-3
  • 決策邊界:x1+x2=3

決策邊界非直線

  • 多項式特征:z=w1x1^2+w2x2^2+b
  • 假設w1=w2=1,b=-1;z=x1^2+x2^2-1
  • 決策邊界:x1^2+x2^2=1
    • 圓外:z>0,f(z)>0.5,分類y=1
    • 圓內:z<0,f(z)<0.5,分類y=0

更復雜的決策邊界

3. 邏輯回歸的代價函數

代價函數提供一種衡量特定參數集對訓練數據擬合程度的方法,幫助選擇更好的參數

對比維度

損失函數(Loss Function)

代價函數(Cost Function)

作用對象

單個訓練樣本

整個訓練數據集

數學關系

代價函數是損失函數的平均值

由損失函數累加并平均得到

優化目標

無直接優化意義

模型訓練的目標是最小化代價函數

應用場景

理論分析、梯度計算

實際訓練、評估模型整體性能

平方誤差代價函數(1/2在求和符號外面時)

  • 得到非凸代價函數:使用梯度下降,會有很多局部最小值

損失函數:單個訓練的損失

  • y^(i)真實值,f(x^(i))預測值
  • 橫軸:f,即標簽y=1的概率預測值;縱軸:L,即損失函數

當 y^(i) = 1 時的損失函數曲線:

  • 當 f(x^(i))->1(預測正確),損失 L -> 0;
  • 當 f(x^(i))->0(預測錯誤),損失 L -> +∞

當 y^(i) = 0 時的損失函數曲線:

  • 當 f(x^(i))->0(預測正確),損失 L -> 0;
  • 當 f(x^(i))->1(預測錯誤),損失 L -> +∞

代價函數

4. 邏輯回歸的簡化版代價函數

5. 梯度下降的實現

如何選擇w1、w2、w3、...、b的值使代價函數值盡可能小

對于repeat,先計算兩個式子的右側,再同時更新到左側

  • 線性回歸:預測函數為 f(x) = wx + b
  • 邏輯回歸:預測函數為 f(x) = 1/(1 + e^(-(wx + b)))(sigmoid 函數)

更新公式形式與線性回歸的相同,但f(x)定義不同

  1. 監督梯度下降
  2. 向量化
  3. 特征縮放

6. 過擬合問題

過擬合(Overfitting):模型在訓練數據上表現良好,但在新的、未見過的數據上表現不佳,高方差(High Variance)

欠擬合(Underfitting):模型的復雜度較低,無法捕捉到數據中的關鍵特征和潛在規律,模型在訓練、測試數據上的表現都很差,高偏差(High Bias)

泛化(Generalization) 是指模型在未見過的新數據上表現良好的能力。

過擬合也適用于分類

7. 解決過擬合

  1. 獲得更多數據
  2. 嘗試選擇、使用特征的子集
  3. 正則化減小參數大小🔺

8. 帶正則化的成本函數

模型過擬合的本質是參數值過大(如高次多項式的系數),導致模型對訓練數據的微小波動過度敏感。正則化通過在代價函數中引入參數懲罰項,迫使參數值 “收縮” 到較小范圍,從而:

  • 降低模型復雜度(避免過度復雜的決策邊界);
  • 增強模型對新數據的泛化能力。

正則化:對特征的參數w_j懲罰,對b不操作

  1. L2正則化:溫和收縮參數,保留所有特征
    1. 所有參數 w_j 都會被 “拉向 0”,但不會嚴格為 0(系數值變小但非零)。
    2. 傾向于讓參數值更平均(避免某一特征權重過大),使模型更 “平滑”。
  2. L1正則化:稀疏化參數,實現自動特征選擇
    1. 部分參數 w_j 會被直接壓縮至 0(“稀疏化”),相當于自動實現 “特征選擇”。
    2. 能篩選出對目標影響最大的核心特征,剔除冗余特征。

正則化參數 ?

  • =0:無正則化,模型可能過擬合(完全擬合訓練數據)。
  • ? 非常大:正則化權重大,所有參數 w1...wj 被壓縮至 0,模型復雜度降低 f(x)~=b(可能欠擬合)。
  • 選擇原則:通過交叉驗證(如網格搜索)找到最優 ?,使驗證集上的模型性能(如準確率、損失值)最優。

9. 正則化線性回歸

和線性回歸相比,repeat部分對 b 的更新沒變化,符合正則化試圖縮小參數 wi ,不改變 b

正則化在每次迭代的作用:更新wj時,先?一個略小于1的數,稍微縮小wj值,再減去

  • 第一部分:w_j*(1-ɑ*?/m) 是正則化項,確保權重不會無限制增長。
  • 第二部分:是標準的梯度下降更新項,用于最小化預測誤差。

10. 正則化邏輯回歸

對于梯度下降迭代最小化代價函數,repeat和正則化線性回歸相同,只是各自的 f(x) 函數表達式不同

本文來自互聯網用戶投稿,該文觀點僅代表作者本人,不代表本站立場。本站僅提供信息存儲空間服務,不擁有所有權,不承擔相關法律責任。
如若轉載,請注明出處:http://www.pswp.cn/diannao/92739.shtml
繁體地址,請注明出處:http://hk.pswp.cn/diannao/92739.shtml
英文地址,請注明出處:http://en.pswp.cn/diannao/92739.shtml

如若內容造成侵權/違法違規/事實不符,請聯系多彩編程網進行投訴反饋email:809451989@qq.com,一經查實,立即刪除!

相關文章

FastAdmin 中生成插件

在 FastAdmin 中生成一個 OCR 發票識別插件&#xff0c;可以按照以下步驟進行開發。這里假設你已經熟悉 FastAdmin 插件開發的基本流程&#xff0c;并會使用 Composer 和 PHP 擴展。1. 創建插件骨架使用 FastAdmin 命令行工具生成插件基礎結構&#xff1a;php think addon -a o…

DevExpress WinForms中文教程:Grouping(分組)- 如何自定義分組算法?

DevExpress WinForms擁有180組件和UI庫&#xff0c;能為Windows Forms平臺創建具有影響力的業務解決方案。DevExpress WinForms能完美構建流暢、美觀且易于使用的應用程序&#xff0c;無論是Office風格的界面&#xff0c;還是分析處理大批量的業務數據&#xff0c;它都能輕松勝…

PHP 與 Vue.js 結合的前后端分離架構

PHP 與 Vue.js 結合是構建現代 Web 應用的流行技術棧&#xff0c;通常采用 前后端分離架構。以下是關鍵要點和推薦實現方案&#xff1a; 一、技術棧組合 角色技術選項后端 (PHP)Laravel (推薦)、Symfony、CodeIgniter前端 (Vue)Vue 2/3、Vue Router、Pinia/Vuex、Vite通信協議…

XML高效處理類 - 專為Office文檔XML處理優化

/**** 提供XML讀取、寫入、修改、查詢等高級功能&#xff0c;支持命名空間和復雜XML結構* * 主要功能&#xff1a;* 1. 復雜路徑解析&#xff08;支持屬性篩選、索引、通配符&#xff09;* 2. 完整節點類型支持&#xff08;元素、文本、CDATA、注釋、PI&#xff09;* 3. 高效元…

星慈光編程蟲2號小車講解第一篇--向前向后

星慈光編程蟲2號小車是一款基于微控制器&#xff08;如Arduino&#xff09;的編程教學小車&#xff0c;常用于學習機器人控制和編程基礎。本講解將重點介紹小車的基本運動&#xff1a;前進、后退、左轉和右轉。這些運動通過控制電機實現&#xff0c;通常涉及調整電機的方向和速…

iOS 加固工具有哪些?快速發布團隊的實戰方案

在當今快速迭代的 iOS 開發環境中&#xff0c;團隊需要在高頻上線與應用安全之間找到平衡。快速發布不應犧牲安全性&#xff0c;而安全加固也不應成為阻礙上線的瓶頸。這就要求開發者在加固工具的選型與流程設計上&#xff0c;做到既高效又可靠。 那么&#xff0c;iOS 加固工具…

結構型模式-架構解耦與擴展實踐

結構型模式聚焦于對象間的組合關系&#xff0c;通過優化類與對象的裝配方式&#xff0c;實現系統的靈活性與可擴展性。在分布式系統中&#xff0c;由于多節點協作、跨網絡通信及異構環境集成等特性&#xff0c;傳統結構型模式需進行適應性改造&#xff0c;以應對分布式特有的復…

scratch筆記和練習-第三課

角色的大小變化 亮度等特效設置 流程圖圖形符號 Figma攻略&#xff1a;26個流行流程圖符號及其解釋 練習 實現在閃動10次后角色緩緩變回原形

Redis MCP 安裝與配置完整指南

一、Redis MCP 簡介 Redis MCP (Managed Control Plane) 是一個獨立于 Redis 服務運行的管理控制平臺&#xff0c;用戶可通過該平臺快速高效地管理和配置 Redis 實例。Redis MCP 可配合開源 Redis 或 Redis Cloud 使用。 二、安裝 Redis MCP 服務 Redis MCP 提供多種安裝方式&a…

Spring Boot配置文件加載全指南:從基礎到Spring Cloud集成

??? ??一、核心概念? 配置文件默認存在加載順序優先級主要用途必需依賴bootstrap.yml? 無1(最先)最高Spring Cloud上下文初始化spring-cloud-starter-bootstrapbootstrap.properties? 無1(略高于.yml)最高同上同上application.yml? 自動創建2中等應用核心配置無appl…

Python通關秘籍(六)數據結構——字典

前文復習 五、數據結構 5.1 列表(List) 列表是一種有序的可變數據集合,可以包含不同類型的元素。

自學嵌入式 day33 TCP、HTTP協議(超文本傳輸協議)

6、黏包問題&#xff08;1&#xff09;、原因&#xff1a;發送方發送數據太快或者接收方接收數據太慢&#xff0c;導致數據在緩沖區緩存。&#xff08;2&#xff09;、解決方法&#xff1a;①發送指定大小數據&#xff08;結構體&#xff09;問題&#xff1a;結構體對齊問題&am…

LinuxShell 的 Here-Document(<< EOF) 筆記250723

LinuxShell 的 Here-Document(<< EOF) 筆記250723 Here-Document(<< EOF) Linux Shell Here Document (<< EOF) 終極指南 Here Document&#xff08;立即文檔&#xff09;是 Shell 中用于多行輸入重定向的強大功能&#xff0c;其核心語法為 << DELI…

【windows修復】解決windows10,沒有【相機] 功能問題

問題: windows10,相機模塊,好像是被卸載了,想重新安裝 方法簡介: 先下載windows store, 然后,在windows store 里面下載 相機功能: 解決: 直接下載官方離線包并手動安裝(成功率 90%+) 1 用瀏覽器打開 https://store.rg-adguard.net 這是微軟 CDN 解析站,安…

Python 中字典和 if-else 的選擇

一、為什么要寫這篇文章&#xff1f; 在 Python 編程中&#xff0c;我們經常需要根據不同的條件做不同的事情。比如&#xff1a; 根據用戶等級顯示不同的內容根據成績給出不同的評價根據天氣決定穿什么衣服 這時候&#xff0c;我們通常有兩種選擇&#xff1a; 用 if-else 語句用…

【開源解析】基于HTML5的智能會議室預約系統開發全攻略:從零構建企業級管理平臺

&#x1f680; 【開源解析】基于HTML5的智能會議室預約系統開發全攻略&#xff1a;從零構建企業級管理平臺 &#x1f308; 個人主頁&#xff1a;創客白澤 - CSDN博客 &#x1f4a1; 熱愛不止于代碼&#xff0c;熱情源自每一個靈感閃現的夜晚。愿以開源之火&#xff0c;點亮前行…

中央廣播電視總臺聯合阿里云研究院權威發布《中國人工智能應用發展報告(2025)》:我國依舊需要大力注重人工智能人才的培養

你好&#xff0c;我是杰哥。 中央廣播電視總臺聯合阿里云研究院權威發布《中國人工智能應用發展報告&#xff08;2025&#xff09;》&#xff0c;以下為報告核心看點&#xff1a; 報告首提 “654”體系&#xff1a;揭秘 6大技術趨勢、5 新應用場景、4 力產業模型&#xff1b;成…

Visual Studio 2010-.Net Framework 4.0-DevExpress安裝

最新版的DevExpress已不支持.Net Framework 4.0&#xff0c;需要下載18.1及以下版本。 17.2.5版DevExpress下載&#xff1a; 百度網盤 請輸入提取碼

借助Aspose.HTML控件,在 Python 中將 HTML 轉換為 Markdown

在這個人工智能時代&#xff0c;Markdown因其易用性而備受重視。這種標記語言易于人類和機器理解。此外&#xff0c;與 HTML 和 DOCX 相比&#xff0c;這種格式更有助于法學碩士 (LLM) 理解文檔結構。因此&#xff0c;本指南將介紹如何以 Python 編程方式將HTML轉換為 Markdown…

【2026版】Redis面試題

文章目錄1. Redis為什么這么快&#xff1f;2. Redis的持久化機制是怎樣的&#xff1f;3. Redis 的過期策略是怎么樣的&#xff1f;4. Redis的內存淘汰策略是怎么樣的&#xff1f;5. 什么是熱Key問題&#xff0c;如何解決熱key問題&#xff1f;6. 什么是大Key問題&#xff0c;如…