常用損失函數學習

常用損失函數學習

bicheng/2025/9/13 22:00:02/文章來源:https://blog.csdn.net/pumpkin84514/article/details/139205329

損失函數（Loss Function），在機器學習和統計學中，是用來量化模型預測輸出與真實結果之間差異的函數。簡而言之，損失函數衡量了模型預測的好壞，目標是通過最小化這個函數來優化模型參數，從而提高預測準確性。下面是一些常用的損失函數及其應用場景：

1. 均方誤差（Mean Squared Error, MSE）

理解：對于回歸問題，MSE計算預測值與真實值之差的平方和的均值，能夠放大較大誤差的影響。
公式： $\hat{Y}) = \frac{1}{n} \sum_{i=1}^{n}(y_i - \hat{y}_i)^2$
場景：廣泛用于連續值預測任務，如房價預測、股票價格預測等。

2. 平均絕對誤差（Mean Absolute Error, MAE）

理解：與MSE類似，但取差值的絕對值，對異常值敏感性較低。
公式： $\hat{Y}) = \frac{1}{n} \sum_{i=1}^{n}|y_i - \hat{y}_i|$
場景：同樣適用于回歸問題，特別是當希望模型對誤差有更均勻的反應時。

3. 交叉熵損失（Cross-Entropy Loss）

理解：用于分類問題，特別是在神經網絡中，衡量預測概率分布與實際類別標簽的概率分布的差異。
公式（二分類問題，sigmoid激活函數）： $\log(p) - (1-y) \log(1-p)$
場景：分類任務，如圖像分類、文本分類等。

4. 邏輯斯諦損失（Logistic Loss）

理解：實際上是二元交叉熵損失的一種特例，常用于邏輯回歸模型。
場景：與交叉熵損失類似，適用于二分類問題。

5. Hinge損失

理解：主要用于最大間隔分類器，如支持向量機（SVM），鼓勵模型找到寬的分類邊界。
公式： $\hat{y}) = \max(0, 1 - y\hat{y})$
場景：適用于支持向量機等最大間隔分類問題。

6. Huber損失

理解：結合了MSE和MAE的優點，對離群點較為魯棒，當誤差較小時表現為平方損失，誤差較大時變為線性損失。
公式：基于閾值 $δ(\delta)$ ，當誤差 $|y-\hat{y}|≤δ$ 時， $L=\frac{1}{2}(y-\hat{y})^2$ ；否則， $L=\delta(|y-\hat{y}|-\frac{1}{2}\delta)$
場景：適合包含較多離群值的數據集的回歸問題。

選擇原則：

選擇損失函數時，需考慮任務類型（回歸還是分類）、數據特性（如是否含有離群點）、模型訓練的穩定性以及對誤差的容忍度等因素。例如，在對預測誤差的敏感性要求不高且數據可能存在噪聲時，MAE可能是更好的選擇；而在分類任務中，尤其是多分類或需要概率輸出時，交叉熵損失通常是首選。

本文來自互聯網用戶投稿，該文觀點僅代表作者本人，不代表本站立場。本站僅提供信息存儲空間服務，不擁有所有權，不承擔相關法律責任。
如若轉載，請注明出處：http://www.pswp.cn/bicheng/15514.shtml
繁體地址，請注明出處：http://hk.pswp.cn/bicheng/15514.shtml
英文地址，請注明出處：http://en.pswp.cn/bicheng/15514.shtml

如若內容造成侵權/違法違規/事實不符，請聯系多彩編程網進行投訴反饋email:809451989@qq.com，一經查實，立即刪除！

相關文章

簡述js的事件循環以及宏任務和微任務

簡述js的事件循環以及宏任務和微任務

前言在JavaScript中，任務被分為同步任務和異步任務。同步任務：這些任務在主線程上順序執行，不會進入任務隊列，而是直接在主線程上排隊等待執行。每個同步任務都會阻塞后續任務的執行，直到它自身完成。常見的同步任…

閱讀更多...

【機器學習】機器學習與大型預訓練模型的前沿探索：跨模態理解與生成的新紀元

【機器學習】機器學習與大型預訓練模型的前沿探索：跨模態理解與生成的新紀元

🔒文章目錄： 💥1.引言 ?2.跨模態理解與生成技術概述 🚲3.大型預訓練模型在跨模態理解與生成中的應用 🛴4.前沿探索與挑戰并存 👊5.未來趨勢與展望 💥1.引言近年來，機器學習領…

閱讀更多...

著名書法家王杰寶做客央視頻《筆墨寫人生》藝壇人物經典訪談節目

著名書法家王杰寶做客央視頻《筆墨寫人生》藝壇人物經典訪談節目

印象網北京訊（張春兄、馮愛云）展示藝術風采，構建時代精神。5月25日，著名書法家、羲之文化傳承人王杰寶，做客央視頻《筆墨寫人生》藝壇人物經典訪談節目，與中央電視臺紀錄頻道主持人姚文倩一起，分…

閱讀更多...

MyBatis 中的動態 SQL 的相關使用方法(Javaee/MyBatis)

MyBatis 中的動態 SQL 的相關使用方法(Javaee/MyBatis)

MyBatis 的動態 SQL 是一種強大的特性，它可以讓你在 XML 映射文件內，根據不同的條件編寫不同的 SQL 語句。MyBatis 動態 SQL 主要元素有： <if>: 根據提供的條件來動態拼接 SQL。接口定義 Integer insertUserByCondition(UserInfo u…

閱讀更多...

c++ list容器

c++ list容器

std::list 是 C 標準庫中的一個雙向鏈表容器。與 std::vector（動態數組）和 std::deque（雙端隊列）不同，std::list 的元素在內存中不是連續存儲的，而是分散存儲并通過節點進行連接。這使得 std::list 在插入和…

閱讀更多...

SpringBoot 集成 ChatGPT（附實戰源碼）

SpringBoot 集成 ChatGPT（附實戰源碼）

建項目項目結構 application.properties openai.chatgtp.modelgpt-3.5-turbo openai.chatgtp.api.keyREPLACE_WITH_YOUR_API_KEY openai.chatgtp.api.urlhttps://api.openai.com/v1/chat/completionsopenai.chatgtp.max-completions1 openai.chatgtp.temperature0 openai.cha…

閱讀更多...

全局平均池化筆記

全局平均池化筆記

全局平均池化（Global Average Pooling, GAP）是一種用于卷積神經網絡（CNN）中的池化操作，其主要作用和優點包括： 減少參數數量：全局平均池化層將每個特征圖通過取其所有元素的平均值，壓…

閱讀更多...

ubuntu安裝yum方法【最新可用】

ubuntu安裝yum方法【最新可用】

一、安裝命令在根目錄（root）下執行 sudo apt-get install build-essential sudo apt-get install yum二、出錯處理 1、E: Package yum has no installation candidate 解決：更換鏡像源，找到自己的系統版本用vim進行更換&#xff…

閱讀更多...

make是什么

make是什么

make是什么工具 make是一個自動化編譯工具，它本身并沒有編譯和鏈接的功能，而是用類似于批處理的方式——通過makefile文件中指示的依賴關系，調用makefile文件中使用的命令來完成編譯和鏈接的。makefile文件中記錄了源代碼文件之間的依賴關系，并說明了如何編譯各個源代碼文…

閱讀更多...

GmSSL3.X編譯iOS和Android動態庫

GmSSL3.X編譯iOS和Android動態庫

一、環境準備我用的Mac電腦編譯，Xcode版本15.2，安卓的NDK版本是android-ndk-r21e。 1.1、下載國密源碼下載最新的國密SDK源碼到本地。 1.2、安裝Xcode 前往Mac系統的AppStore下載安裝最新Xcode。 1.3、安卓NDK下載下載NDK到本地，選…

閱讀更多...

Protobuf - 語法、字段使用規則、注意事項

Protobuf - 語法、字段使用規則、注意事項

目錄前言一、Protobuf 基本語法 1.1、Protoc 版本 1.2、文件格式配置 1.3、消息字段規則 1.3.1、字段數據類型 1.3.2、字段修飾規則 1.3.3、消息類型定義 1.3.4、enum 類型 1.3.5、Any 類型 1.3.6、oneof 類型 1.3.7、map 類型 1.3.8、默認值 1.3.9、更新消息…

閱讀更多...

css設置文字在固定寬度中等距分開（僅限于單行文本）

css設置文字在固定寬度中等距分開（僅限于單行文本）

一、要實現的效果： 二、代碼要在CSS中設置文本在一個固定寬度的容器中等距分開， 可以使用text-align: justify;屬性，它可以讓文本兩端對齊，看起來就像是等距分開的。但是要注意，單獨使用text-align:justify;只能對單…

閱讀更多...

機器學習 - 模型訓練

機器學習 - 模型訓練

機器學習（Machine Learning，ML）是利用計算機算法和統計模型，使計算機系統在沒有明確編程的情況下執行特定任務的過程。機器學習的整個過程可以分為以下幾個主要步驟： 訓練步驟問題定義與需求分析目標設定&#xff1…

閱讀更多...

【Qt】Qt多元素控件深入解析與實戰應用:列表(QListWidget)、表格(QTableWidget)與樹形(QTreeWidget)結構

【Qt】Qt多元素控件深入解析與實戰應用:列表(QListWidget)、表格(QTableWidget)與樹形(QTreeWidget)結構

文章目錄前言：Qt中多元素控件：1. List Widget1.1. 代碼示例: 使用 ListWidget 2.Table Widget2.1. 代碼示例: 使用 QTableWidget 3. Tree Widget3.1. 代碼示例: 使用 QTreeWidget 總結： 前言： 在Qt框架中，用戶界面的…

閱讀更多...

2024.5.25

2024.5.25

package com.Swork.file;import java.io.File; import java.io.IOException; import java.util.Date;public class Demo1 {public static void main(String[] args) {//1,構造文件對象System.out.println("1,構造文件對象");File file new File("D://Work//Fil…

閱讀更多...

C語言內存函數超詳細講解

C語言內存函數超詳細講解

個人主頁：C忠實粉絲歡迎點贊👍 收藏? 留言? 加關注💓本文由 C忠實粉絲原創 C語言內存函數超詳細講解收錄于專欄【C語言學習】本專欄旨在分享學習C語言學習的一點學習筆記，歡迎大家在評論區交流討論💌 目錄 1. m…

閱讀更多...

C++面向對象程序設計-北京大學-郭煒【課程筆記（十一）】

C++面向對象程序設計-北京大學-郭煒【課程筆記（十一）】

C面向對象程序設計-北京大學-郭煒【課程筆記（十一）】 1、string（重要知識點）1.2、string的賦值和鏈接1.3、比較string1.4、子串1.5、交換string1.6、尋找string中的字符1.7、刪除string中的字符1.8、替換string中的字符1.9、在str…

閱讀更多...

leetcode119-Pascal‘s Triangle II

leetcode119-Pascal‘s Triangle II

題目給定一個非負索引 rowIndex，返回「楊輝三角」的第 rowIndex 行。在「楊輝三角」中，每個數是它左上方和右上方的數的和。示例 1: 輸入: rowIndex 3 輸出: [1,3,3,1] 分析楊輝三角每位數字就是上一行同一列＋上一行前一列的和&#…

閱讀更多...

結構體；結構成員訪問操作符

結構體；結構成員訪問操作符

結構體： 雖然c語言已經提供了內置類型，比如：char、short、int、long等，但還是不夠用，就好比我描述一個人，我需要描述他的身高，體重，年齡，名字等信息&#xff0c…

閱讀更多...

微軟密謀超級AI大模型！LangChain帶你輕松玩轉大模型開發

微軟密謀超級AI大模型！LangChain帶你輕松玩轉大模型開發

此前，據相關媒體報道，微軟正在研發一款名為MAI-1的最新AI大模型，其參數規模或將達5000億以上，遠超此前微軟推出的相關開源模型，其性能或能與谷歌的Gemini 1.5、Anthropic的Claude 3和OpenAI的GPT-4等知名大模型相匹敵。…

閱讀更多...

最新文章