Class3Softmax回歸

Class3Softmax回歸

在這里插入圖片描述
回歸VS分類

回歸是估計一個連續值

分類是預測一個離散類別

回歸分類
單連續值輸出通常為多個輸出
自然區間R輸出i是預測為第i類的置信度
跟真實值的區別作為損失

生活中的分類問題

1.垃圾分類

類別
可回收物
濕垃圾(廚余垃圾)
干垃圾
有害垃圾

2.郵件分類

類別:
正常郵件
垃圾郵件(廣告、釣魚)

從回歸到多類分類

均方損失

在這里插入圖片描述
判斷當前元素為該類,設置為1,其余類別歸為0
在這里插入圖片描述

無校驗比例

在這里插入圖片描述

在這里插入圖片描述
為什么需要校驗?
因為Softmax 的輸出不是總是可靠的概率,原因是模型可能過于自信或不夠自信

舉例:
模型預測某圖像為 “貓” 的概率為 0.95,但是實際上模型只有 70% 的概率是正確的。這種情況下:

無校驗比例是 0.95(原始 softmax 輸出)

校驗比例是 0.70(經過校準的真實置信度)

常見的配置為:

訓練比例:80%
校驗比例:20%

Softmax
Softmax 是一個常用在 分類模型輸出層 的函數,主要作用是將一組實數轉換為概率分布,即每個輸出值都是 0 到 1 之間的數,并且所有輸出加起來等于 1。

公式:
給定一個向量
𝑧=[𝑧1,𝑧2,…,𝑧𝑛],softmax輸出 𝜎(𝑧)𝑖為:
在這里插入圖片描述

對每個元素求指數𝑒𝑧𝑖

然后除以所有指數的總和

得到的是每個類別的“相對概率”

Softmax 的作用:
歸一化:輸出變成概率分布(所有值相加等于 1)。

區分強弱:大值被放大,小值被壓縮,更容易做出決策。

適合分類任務:常用于神經網絡多分類的最后一層。
在這里插入圖片描述
左圖是模型的原始輸出(logits),右圖是通過 softmax 轉換后的概率分布。可以看到:

logits 數值差距不大,但 softmax 后的概率差距被放大。

最大的 logits(Class A)對應最高的概率(約 65%)。

所有概率加起來正好是 1,適合用于多分類預測。

交叉熵損失
交叉熵常用來衡量兩個概率分布的區別。

公式:
在這里插入圖片描述

𝑝:真實的概率分布(比如 one-hot 標簽)

𝑞:模型預測的概率分布(經過 softmax 得到)

理解:

如果預測𝑞越接近真實標簽𝑝,那么交叉熵越小(越好)

如果預測錯了,尤其是把正確類的概率預測得很低,損失會很大(因為 log 變負很快)

本質上,交叉熵就是衡量預測概率分布與真實 one-hot 分布的差距

梯度推導公式

在這里插入圖片描述
這是 softmax + cross entropy 的梯度

含義:

損失函數對第 𝑖個輸出的梯度 = 預測概率 - 真實值

它使得訓練過程的反向傳播特別高效(簡潔且數值穩定)

常被稱作 “softmax with log loss” 的“簡化公式”

總結
在這里插入圖片描述

本文來自互聯網用戶投稿,該文觀點僅代表作者本人,不代表本站立場。本站僅提供信息存儲空間服務,不擁有所有權,不承擔相關法律責任。
如若轉載,請注明出處:http://www.pswp.cn/bicheng/86762.shtml
繁體地址,請注明出處:http://hk.pswp.cn/bicheng/86762.shtml
英文地址,請注明出處:http://en.pswp.cn/bicheng/86762.shtml

如若內容造成侵權/違法違規/事實不符,請聯系多彩編程網進行投訴反饋email:809451989@qq.com,一經查實,立即刪除!

相關文章

day042-負載均衡與web集群搭建

文章目錄 0. 老男孩思想-面試官問:你對加班的看法?1. 負載均衡2. 搭建負載均衡的WordPress集群2.1 負載均衡服務器2.2 配置web服務器2.3 測試 踩坑記錄1. /var/cache/nginx權限問題 0. 老男孩思想-面試官問:你對加班的看法? 互聯網公司沒有不加班的&a…

40歲技術人用AI尋找突破路線

年近40,坐標重慶,從事醫療器械行業多年,遇到發展瓶頸。剛好遇到AI技術浪潮。最近一年在不斷嘗試把AI應用于工作生活的方方面面。 總結一下我是如何利用AI來做職業規劃的: 整理好自己的簡歷,越詳細越好。這個可以利用…

kde截圖工具報錯

An error occurred while taking a screenshot. KWin screenshot request failed: The process is not authorized to take a screenshot Potentially relevant information: - Method: CaptureScreen - Method specific arguments: "eDP-2"好的,感謝您提…

有理函數積分——分式分解時設分解式的規則

目錄 一、設前處理 1. 假式化真式 2. 分母因式分解 3. 判斷可約不可約 二、一次分母 1. 多項一次分母? 2. 單項一次重復分母? 三、二次分母(當然是分母不可約的,如果可約就因式分解然后對應一次分母) 1. 多項二次分母? 2. 單項二次重復分母? 四、混…

從 AJAX 到 axios:前端與服務器通信實戰指南

直到現在我們小寧已經更新了44作品了,其中和大家介紹了Python入門基礎、Fast API框架、SQLite數據庫,以及前端的知識都已經學習完了,總的來說現在前端、后端、數據庫已經都學習了,那大家是否有這樣的疑問,前端后端到底…

Pycatia二次開發基礎代碼解析:面屬性控制、視圖定向與特征統計的工業級實現

本文將以專業視角深入解析CATIA二次開發中的三個核心類方法,通過詳細分析代碼實現揭示其在工業設計中的實際應用價值。全文將嚴格圍繞提供的代碼展開,不做任何修改或補充。 一、面屬性控制:精確可視化表達技術 方法功能解析 color_and_laye…

bmc TrueSight 監控 Oracle 11g 配置

bmc TrueSight 監控 Oracle配置 文章目錄 bmc TrueSight 監控 Oracle配置1.將pat加入oinstall和dba組2.創建監控的表空間和臨時表空間并告知表空間名稱3.將oracle相關系統環境變量加入到監控pat賬戶的.profile或.bash_profile文件4.登陸Apollo監控web頁面,設置基礎架…

css實現高度可變、上下邊框是漸變色、左右邊框是純色的div容器

效果圖&#xff1a; div容器&#xff1a; <div className{styles.container}><div className{styles.content}><div className{styles.inner}><!-- 內容部分 --></div></div> </div> css&#xff1a; .container {float: left;w…

python二維碼識別

pyzbar 識別QR二維碼 from PIL import Image from pyzbar.pyzbar import decode# 打開圖像文件 image_path qr01.jpg # 替換為你的圖像路徑 image Image.open(image_path)# 解碼圖像中的二維碼 decoded_objects decode(image)# 輸出識別結果 for obj in decoded_objects:p…

ZYNQ EMMC/FLASH/SD卡深度性能評測與創新實踐

深入探索ZYNQ存儲子系統性能,揭示硬件加速下的存儲優化之道 一、存儲性能為何如此重要? 在基于Xilinx ZYNQ SoC的嵌入式系統中,EMMC、QSPI FLASH和SD卡作為核心存儲介質,直接影響系統啟動時間、數據吞吐量和用戶體驗。傳統測試方法往往局限于簡單讀寫速度測試,缺乏對真實…

html制作一個簡單的表單

<!DOCTYPE html> <html lang"en"><head><meta charset"UTF-8"><title>表單輸入練習</title><style></style> </head><body style"background-color: pink;"><div><h2>…

差分對的等長等距

差分對的等長等距: 差分對中兩個單端信號的延時差會導致接收端信號的錯位&#xff0c;引起差分信號的畸變&#xff0c;同時會產生共模噪聲導致接收端差分信號抖動增加。因此差分對設計的一個基本要求就是要盡量保持差分對兩條單端線延時相等。 圖8-27顯示了差分對中兩條單端線…

SQL 子查詢全位置解析:可編寫子查詢的 7 大子句

&#x1f50d; SQL 子查詢全位置解析&#xff1a;可編寫子查詢的 7 大子句 子查詢可以出現在 SQL 語句的多個關鍵位置&#xff0c;不同位置的子查詢具有獨特的行為和限制。以下是系統化總結&#xff1a; &#x1f4cc; 1. WHERE 子句&#xff08;最常用&#xff09; SELECT 列…

C#高級:Winform桌面開發中DataGridView的詳解(新)

一、數據填充&#xff08;反射&#xff09; 1.封裝 /// <summary> /// 渲染DataGridView /// </summary> /// <param name"dataGridView">被渲染控件</param> /// <param name"list">數據集</param> /// <param …

人臉活體識別2:Pytorch實現人臉眨眼 張嘴 點頭 搖頭識別(含訓練代碼和數據集)

人臉活體識別2&#xff1a;Pytorch實現人臉眨眼 張嘴 點頭 搖頭識別(含訓練代碼和數據集) 目錄 人臉活體識別2&#xff1a;Pytorch實現人臉眨眼 張嘴 點頭 搖頭識別(含訓練代碼和數據集) 1. 前言 2.人臉活體識別方法 &#xff08;1&#xff09;基于人臉動作的檢測?? &a…

Webpack 自定義插件開發指南:構建流程詳解與實戰開發全攻略

一. webpack打包流程 開發 Webpack 插件的第一步&#xff0c;就是明確&#xff1a;我的插件要接入 Webpack 構建流程的哪個階段&#xff0c;解決什么問題。 了解流程之前首先要了解插件的兩個核心概念&#xff1a;compiler&#xff0c;compilation 1. compiler&#xff1a;全局…

本地部署Dify+Ragflow及使用(一)

概念說明 RAGflow&#xff1a; 吃透知識&#xff1a;將企業文檔&#xff08;如技術白皮書&#xff09;解析為結構化知識片段。精準檢索&#xff1a;當用戶提問時&#xff0c;從知識庫中召回最相關內容。 模型供應商&#xff1a; 提供大腦&#xff1a;為 Dify 提供生成答案的模…

2025.06.24【R語言】|clusterProfiler安裝與常見報錯FAQ全解

文章目錄 一、clusterProfiler安裝方法1. Bioconductor官方推薦2. Conda安裝&#xff08;個人推薦 適合服務器/依賴復雜環境&#xff09;3. 檢查安裝 二、常見依賴包安裝三、常見報錯與解決方案1. 報錯&#xff1a;could not find function "bitr"2. 報錯&#xff1a…

【轉】PostgreSql的鏡像地址

docker.io/postgres 項目中國可用鏡像列表 | 高速可靠的 Docker 鏡像資源 docker.io/postgrest/postgrest:v12.2.8 linux/amd64 docker.io17.34MB2025-04-04 13:14 346 docker.io/postgrest/postgrest:v12.2.12 linux/amd64 docker.io17.38MB2025-05-27 22:02 79 docker.io…

爬蟲005----Selenium框架

在總結爬蟲 &#x1f577; 框架之前&#xff0c;先總結一下selenium框架&#xff0c;也可以說是selenium庫&#xff0c;在自動化測試中是老生常談了&#xff08;長時間??不用&#xff0c;已經忘記了&#xff0c;實際測試工作中做UI自動化的也很少了&#xff0c;上次搞UI自動化…