二、深度學習——損失函數

二、損失函數

  • 損失函數定義:損失函數是用來衡量模型參數的質量的函數,衡量方式是比較網絡輸出和真實輸出的差異

  • 別名:損失函數(loss function),代價函數(cost function),目標函數(objective function),誤差函數(error function)

1.多分類損失函數

  • 在多分類任務通常使用softmax將logits轉換為概率的形式,所以多分類的交叉熵損失也叫做softmax損失,它的計算方法是:L=?∑i=1nyilog(S(fθ(xi)))L=-\sum_{i = 1}^ny_ilog(S(f_\theta(x_i)))L=?i=1n?yi?log(S(fθ?(xi?)))
    • yiy_iyi?:真實值標簽(one_hot熱編碼)
    • f(x)f(x)f(x)是樣本屬于某一類別的預測分數
    • S(fθ(xi))S(f_\theta(x_i))S(fθ?(xi?)):網絡輸出結果的概率值
    • i=1i=1i=1:樣本個數
  • 在pytorch中使用nn.CrossEntropyLoss()實現

2.二分類任務損失函數

  • 在處理二分類任務時, 使用sigmoid激活函數,則損失函數也會進行相應的調整,使用二分類的交叉熵損失函數:L=?ylogy^?(1?y)log(1?y^)L = -ylog\hat y-(1-y)log(1-\hat y)L=?ylogy^??(1?y)log(1?y^?)
    • y是樣本x中屬于某一個類別的真實概率
    • y^\hat yy^?是嚴格不能屬于某一類別的預測概率
    • LLL用來衡量真實值y與預測值y^\hat yy^?之間的差異性的損失結果
  • 在pytorch中使用nn.BCELoss()實現

3.回歸任務損失函數-MAE損失函數

  • Mean absolute loss(MAE)也被稱為L1 Loss,是以絕對誤差作為距離,損失函數公式:L=1n∑i=1n∣yi=fθ(xi)∣L = \frac{1}{n}\sum_{i = 1}^n|y_i=f_\theta(x_i)|L=n1?i=1n?yi?=fθ?(xi?)
  • 特點:
    • 由于L1 loss具有稀疏性,為了懲罰較大的值,因此常常將其作為正則項添加到其他loss中作為約束;
    • L1 loss的最大問題時梯度在零點不平滑,導致會跳過極小值(最優解)

4.回歸任務損失函數-MSE損失函數

  • Mean Squared Loss/Quadratic Loss(MSE loss)也被稱作L2 loss,或歐氏距離,它以誤差的平方和的均值作為距離損失函數公式:L=1n∑i=1n(yi?fθ(xi))2L = \frac{1}{n}\sum_{i = 1}^n(y_i-f_{\theta(x_i)})^2L=n1?i=1n?(yi??fθ(xi?)?)2
  • 特點:
    • L2 loss也常常作為正則項
    • 當預測值與目標值相差很大時,梯度容易爆炸(則盡量不會使用這種損失函數)

5.回歸任務損失函數-smooth L1損失函數

  • smooth L1說的是光滑之后的L1,損失函數公式為:smoothL1(x)={0.5x2if?∣x∣<1∣x∣?0.5otherwise\text{smooth}_{L_1}(x) = \begin{cases} 0.5x^2 & \text{if } \vert x \vert < 1 \\ \vert x \vert - 0.5 & \text{otherwise} \end{cases}smoothL1??(x)={0.5x2x?0.5?if?x<1otherwise?
    • 其中,x=f(x)?yx = f(x)-yx=f(x)?y為真實值與預測值的差值
  • 從圖像中可以看出,該函數實際上就是一個分段函數
    • [?1,1][-1, 1][?1,1]之間實際上就是L2損失,這樣解決了L1的不光滑問題
    • [?1,1][-1, 1][?1,1]區間外,實際上就是L1損失,這樣就解決了離群點梯度爆炸的問題

本文來自互聯網用戶投稿,該文觀點僅代表作者本人,不代表本站立場。本站僅提供信息存儲空間服務,不擁有所有權,不承擔相關法律責任。
如若轉載,請注明出處:http://www.pswp.cn/pingmian/88225.shtml
繁體地址,請注明出處:http://hk.pswp.cn/pingmian/88225.shtml
英文地址,請注明出處:http://en.pswp.cn/pingmian/88225.shtml

如若內容造成侵權/違法違規/事實不符,請聯系多彩編程網進行投訴反饋email:809451989@qq.com,一經查實,立即刪除!

相關文章

面向數據報的套接字通道技術詳解

數據報通道基礎 通道特性與創建方式 java.nio.channels.DatagramChannel類實例代表數據報通道&#xff0c;默認處于阻塞模式。通過configureBlocking(false)方法可將其配置為非阻塞模式。創建數據報通道需調用其靜態open()方法&#xff0c;若用于IP組播則需指定組播組的地址類型…

147.在 Vue3 中使用 OpenLayers 地圖上 ECharts 模擬飛機循環飛行

&#x1f9e9; 效果預覽 &#x1f447; 飛機從多個城市起飛并向其他城市飛行&#xff0c;動畫流暢&#xff0c;地圖可縮放拖拽&#xff1a; &#x1f4e6; 一、項目技術棧 技術用途Vue 3現代前端框架OpenLayers地圖底圖渲染ECharts ol-echarts飛機飛行動畫渲染ol-echarts將 …

OCR與PDF解析的區別

我們日常所接觸的文檔中&#xff0c;經常能碰到多語言混合的文檔。比如論文試卷、財報研報、跨國票據都含有多種語言和文字。要將文檔中的內容識別并提取務必需要使用到OCR技術&#xff0c;而傳統的OCR工具在處理這類型文檔的時候有局限性。早期的 OCR 系統識別精度有限&#x…

Java 單例類詳解:從基礎到高級,掌握線程安全與高效設計

作為一名Java開發工程師&#xff0c;你一定對**單例模式&#xff08;Singleton Pattern&#xff09;**不陌生。它是23種經典設計模式中最簡單也是最常用的一種&#xff0c;用于確保一個類在整個應用程序中只有一個實例存在。單例廣泛應用于系統配置、數據庫連接池、日志管理器、…

面向對象設計

你列出的這些屬于 C 高級開發中面向對象設計與架構設計的核心知識&#xff0c;也是面試高級工程師崗位必問的內容。下面我按順序&#xff0c;深入講解每一項概念、原理、用途&#xff0c;并穿插 C 示例。? 1. 設計原則&#xff08;SOLID&#xff09;SOLID 是面向對象設計的五大…

IntelliJ IDEA讓我的開發效率翻倍:從新手到高效開發者的進階之路

IntelliJ IDEA讓我的開發效率翻倍&#xff1a;從新手到高效開發者的進階之路 &#x1f31f; 嗨&#xff0c;我是IRpickstars&#xff01; &#x1f30c; 總有一行代碼&#xff0c;能點亮萬千星辰。 &#x1f50d; 在技術的宇宙中&#xff0c;我愿做永不停歇的探索者。 ? 用…

css sprites使用

CSS Sprites 是一種將多個小圖標或背景圖像合并到一個大圖中的技術。通過減少HTTP請求次數&#xff0c;可以顯著提高頁面加載速度。其核心原理是&#xff1a;通過設置元素的背景圖&#xff08;background-image&#xff09;為這個大圖&#xff0c;然后調整背景位置&#xff08;…

分布式爬蟲在電商平臺商品數據大規模采集中的技術應用

在電商平臺商品數據大規模采集場景中&#xff0c;分布式爬蟲憑借其高效、可擴展、抗風險的特性&#xff0c;成為突破單節點爬蟲性能瓶頸的核心技術方案。以下從技術架構、關鍵技術點、電商場景適配及挑戰應對四個維度&#xff0c;解析其具體應用&#xff1a;一、分布式爬蟲的核…

Linux的`if test`和`if [ ]中括號`的取反語法比較 筆記250709

Linux的if test和if 中括號的取反語法比較 筆記250709 Linux的 test命令&#xff08;或等價中括號寫法 [空格expression空格]&#xff09;的用法詳解. 筆記250709 四種取反語法: if ! test -e xxx ;then... 和 if test ! -e xxx ;then... 和 if ! [ -e xxx ] ;then... 和 if …

記錄使用ubuntu16.04編譯aosp(android8.1與10)遇到的問題

一、前言&#xff1a; 本來打算用wsl來編譯AOSP&#xff0c;但是折騰了好幾天&#xff0c;以失敗告終。后來使用vmware反而成功了。 本篇同樣會把wsl遇到的問題與嘗試記錄下來。 環境&#xff1a;vmware ubuntu16.04。 為什么會使用ubuntu16.04呢&#xff0c;因為在公司有一…

hiredis window之RFDMap

簡介 RFDMap用于將socket分配映射成連續的文件描述符&#xff0c;同時管理回收的文件描述符&#xff0c;因為ae構架中管理fd與對應事件處理器使用的是數據&#xff0c;fd作為數組下標 結構 #mermaid-svg-zQz2LTrKRi0LQTII {font-family:"trebuchet ms",verdana,arial…

RustFS一款Rust 驅動的 高性能 分布式存儲系統

演示地址&#xff1a;https://play.rustfs.com/browser 訪問賬號&#xff08;默認 rustfsadmin&#xff09;。 訪問密鑰&#xff08;默認 rustfsadmin&#xff09;。 下載mc https://dl.min.io/client/mc/release可以直接在 Linux 系統上安裝 mc&#xff08;&#xff0c;然后訪…

微軟 Bluetooth LE Explorer 實用工具的詳細使用分析

微軟 Bluetooth LE Explorer 實用工具的詳細使用分析 文章目錄 微軟 **Bluetooth LE Explorer** 實用工具的詳細使用分析1. **工具定位與核心功能**2. **關鍵特性與更新**3. **使用場景示例**4. **系統要求與依賴**5. **與專業工具對比**6. **局限性**7. **實踐建議**結論以下是…

centos 7.6安裝mysql8

在 CentOS 7.6 上安裝 MySQL 8.0.42 的步驟如下&#xff0c;基于搜索結果中的最新信息&#xff1a; 下載 MySQL 8.0.42 安裝包 https://dev.mysql.com/downloads/mysql/從 MySQL 官方網站下載 mysql-8.0.42-1.el7.x86_64.rpm-bundle.tar 文件&#xff1a; 官方下載地址&#xf…

CentOS7更換阿里云yum源

問題&#xff1a;剛剛在本地安裝了CentOS7虛擬機&#xff0c;使用yum安裝vim軟件時&#xff08;最小化安裝只有vi沒有vim&#xff09;出現下面的報錯原因 &#xff1a;CentOS7 已于2024-6-30停止維護&#xff0c;官方鏡像源已不可用&#xff0c;可以更換為阿里云鏡像源解決&…

UE5內置插件 AnimToTexture 簡單入門

開啟插件 首先安裝插件&#xff0c;然后重啟。打開顯示插件內容我們就可以找到插件自帶的轉換內容將骨骼網格體轉換為頂點動畫有兩種方式&#xff1a; 最簡單的記錄每個頂點的位置然后通過切換拾取顏色偏移實現記錄骨骼的變換&#xff0c;然后通過貼圖去修改骨骼位置計算 這兩種…

如何搭建Appium環境?

&#x1f345; 點擊文末小卡片&#xff0c;免費獲取軟件測試全套資料&#xff0c;資料在手&#xff0c;漲薪更快1、安裝Java Development Kit&#xff08;JDK&#xff09;前往Oracle官網下載JDK。在https://www.oracle.com/java/technologies/javase-jdk11-downloads.html 找到…

Android kotlin 協程的詳細使用指南

Android Kotlin 協程的詳細使用指南&#xff0c;結合核心概念、實戰場景和最佳實踐&#xff1a;一、協程基礎概念?協程本質?協程是輕量級線程&#xff0c;通過掛起/恢復機制實現并發&#xff0c;相比線程節省90%以上的內存開銷。其核心優勢在于結構化并發和掛起函數的協作式調…

什么是 AMR 格式?簡鹿音頻轉換器輕松批量轉換 AMR 為 MP3

AMR 格式是一種比較特殊但又常見的音頻格式&#xff0c;而MP3 格式則是大家耳熟能詳的通用音頻格式。那么&#xff0c;它們之間有什么區別&#xff1f;又該如何把 AMR 文件轉換成更常用的 MP3 呢&#xff1f;下面我們就來通俗地了解一下。一、什么是 AMR 格式&#xff1f;AMR&a…

C++11 std::move與std::move_backward深度解析

文章目錄移動語義的革命性意義std::move&#xff1a;正向范圍移動函數原型與核心功能關鍵特性與實現原理適用場景與代碼示例危險區域&#xff1a;重疊范圍的未定義行為std::move_backward&#xff1a;反向安全移動函數原型與核心功能關鍵特性與實現原理適用場景與代碼示例重疊范…