Logistic Loss Function|邏輯回歸代價函數

-----------------------------------------------------------------------------------------------

這是我在我的網站中截取的文章,有更多的文章歡迎來訪問我自己的博客網站rn.berlinlian.cn,這里還有很多有關計算機的知識,歡迎進行留言或者來我的網站進行留言!!!

-----------------------------------------------------------------------------------------------

一、邏輯回歸代價函數的定義

邏輯回歸的代價函數(又稱交叉熵損失)用于評估模型預測結果與真實標簽之間的差異。不同于線性回歸的均方誤差,它專門針對分類問題設計,能夠有效懲罰“高置信度的錯誤預測”,同時鼓勵模型輸出更接近真實標簽的概率值。

通俗理解

想象老師在批改判斷題:

  • 如果學生非常自信地答錯(比如寫“絕對選A”,但正確答案是B),老師會狠狠扣分。

  • 如果學生答對但不太確定(比如寫“可能是A”),老師會適當給分。

  • 如果學生答對且很確定(比如寫“肯定選A”),老師會給滿分。
    代價函數的作用類似——讓模型為自己的“盲目自信”付出代價,同時獎勵正確且確定的預測


二、平方誤差 vs 邏輯回歸:代價函數的設計差異與凸性對比

D9B60E6B-55D5-4B89-9F81-494CE6188D22.png

這張圖片展示了平方誤差代價函數(Squared error cost)及其相關概念,主要分為以下幾個部分:

  1. 平方誤差代價函數公式

    4A1A1FAD-3159-48F4-BC9F-8AAC89BCD657.png

    用于衡量線性回歸模型的預測值與真實值之間的誤差。

  2. 損失函數(loss)

    21573285-44D4-48BC-BABF-EE48D78BC093.png

    表示單個樣本的誤差。

  3. 線性回歸模型

    C8C4B714-C5DC-44D2-802F-9FCBE07ACEF5.png

    這是一個線性預測函數。

  4. 凸性與非凸性

    • 線性回歸的代價函數?f(w,b)?是凸函數(convex),保證梯度下降能找到全局最優解。

    • 如果直接對邏輯回歸使用平方誤差,代價函數可能非凸(non-convex),導致優化困難。

  5. 邏輯回歸的預測函數

    612B2053-923B-4A8C-A7F7-352D6A203753.png

    這是一個Sigmoid函數,將線性輸出映射到概率(0, 1)。

圖片的核心對比了線性回歸(平方誤差)邏輯回歸(需用交叉熵損失)在代價函數設計上的差異。


三、邏輯回歸代價函數公式

49D8EDA0-2B7C-43FC-B934-19D23F566A76.png

E0826B26-E1B3-4B88-A544-744548A1C88D.png

CF3FC85B-876D-4ED3-92DF-72D712EF171D.png

  1. 分段定義
    損失函數?L?根據真實標簽?y(i)?的取值(0 或 1)分段計算:

    • 若?y(i)=1,損失為??log?(fW,b(x?(i)))。

    • 若?y(i)=0,損失為??log?(1?fW,b(x?(i)))。

  2. 損失變化趨勢

    • 當預測值?fW,b(x?(i))?接近真實標簽時(如?y(i)=1?且?f→1),損失趨近于 0。

    • 當預測值與真實標簽相反時(如?y(i)=1?但?f→0),損失趨近于無窮大。

  3. 核心作用
    損失函數通過對數懲罰機制,迫使模型對錯誤預測(尤其是高置信度錯誤)付出更高代價,從而推動參數優化。

  4. 優化目標
    通過調整參數?w?,b?最小化代價函數?J,使模型預測?fw?,b(x?)?盡可能接近真實標簽?y。


四、邏輯回歸損失函數的兩種表達形式及其統一化

9E1D859F-394E-41A4-BAF2-44EB4705F760.png

629884A2-BA9C-4BA9-8600-01719C3D3537.png

  1. 第一幅圖

    • 展示了邏輯回歸損失函數從分段形式統一形式的簡化過程。

    • 分段形式(直觀但冗長):

      • 當?y=1,損失為??log?(f(x))

      • 當?y=0,損失為??log?(1?f(x))

    • 統一形式(緊湊且通用):

      CA82C261-E6ED-46DC-A3C1-46C9DB343766.png

    • 通過數學技巧將兩種情況合并為一個公式,便于計算和優化。

  2. 第二幅圖

    • 將單樣本的損失函數推廣到整體代價函數(所有樣本的平均損失)。

    • 公式:

      C790BD27-85EC-4B46-9E62-706B4E09F154.png

    • 強調該函數是凸函數(convex),保證梯度下降能找到全局最優解。

-----------------------------------------------------------------------------------------------

這是我在我的網站中截取的文章,有更多的文章歡迎來訪問我自己的博客網站rn.berlinlian.cn,這里還有很多有關計算機的知識,歡迎進行留言或者來我的網站進行留言!!!

-----------------------------------------------------------------------------------------------

本文來自互聯網用戶投稿,該文觀點僅代表作者本人,不代表本站立場。本站僅提供信息存儲空間服務,不擁有所有權,不承擔相關法律責任。
如若轉載,請注明出處:http://www.pswp.cn/bicheng/93185.shtml
繁體地址,請注明出處:http://hk.pswp.cn/bicheng/93185.shtml
英文地址,請注明出處:http://en.pswp.cn/bicheng/93185.shtml

如若內容造成侵權/違法違規/事實不符,請聯系多彩編程網進行投訴反饋email:809451989@qq.com,一經查實,立即刪除!

相關文章

計算機網絡技術-知識篇(Day.1)

一、網絡概述 1、網絡的概念 兩個不在同一地理位置的主機,通過傳輸介質和通信協議,實現通信和資源共享。 2、網絡發展史 第一階段(20世紀60年代) 標志性事件:ARPANET的誕生關鍵技術:分組交換技術 第二…

工業元宇宙:邁向星辰大海的“玄奘之路”

一、從認知革命到工業革命:文明躍遷的底層邏輯1.1 認知革命:人類協作的基石時間線:約7萬年前,智人通過語言和想象力構建共同虛擬現實,形成部落協作模式。核心突破:虛構能力:創造神、國家、法律等…

9. React組件生命周期

2. React組件生命周期 2.1. 認識生命周期 2.1.1. 很多事物都有從創建到銷毀的整個過程,這個過程稱之為生命周期;2.1.2. React組件也有自己的生命周期,了解生命周期可以讓我們在最合適的地方完成想要的功能2.1.3. 生命周期和生命周期函數的關系…

【單板硬件開發】關于復位電路的理解

閱讀紫光同創供應商提供的FPGA單板硬件開發手冊,發現復位電路他們家解釋的很通俗易懂,所以分享一下。如下圖,RST_N 是低有效的異步全芯片復位信號,一般外部連接電路有 3 種形式如圖 3–2,可根據實際需要選擇合適的電路…

《Unity Shader入門精要》學習筆記一

1、本書的源代碼 https://github.com/candycat1992/Unity_Shaders_Book 2、第1章 Shader是面向GPU的工作方式 3、第2章 渲染流水線 Shader:著色器 渲染流水線:目標是渲染一張二維紋理,輸入是一個虛擬攝像機、一些光源、一些Shader以及紋…

從零到一:TCP 回聲服務器與客戶端的完整實現與原理詳解

目錄 一、TCP 通信的核心邏輯 二、TCP 服務器編程步驟 步驟 1:創建監聽 Socket 步驟 2:綁定地址與端口(bind) 步驟 3:設置監聽狀態(listen) 步驟 4:接收客戶端連接&#xff08…

MyBatis-Plus核心內容

MyBatis-Plus MyBatis-Plus 是一個基于 MyBatis的增強工具,旨在簡化開發過程,減少重復代碼。它在MyBatis的基礎上增加了CRUD操作封裝,條件構造器、代碼生成器等功能。 一、核心特性與優勢 1. 核心特性 無侵入:只做增強不做改變&am…

計算機網絡摘星題庫800題筆記 第4章 網絡層

第4章 網絡層4.1 網絡層概述題組闖關1.在 Windows 的網絡配置中,“默認網關” 一般被設置為 ( ) 的地址。 A. DNS 服務器 B. Web 服務器 C. 路由器 D. 交換機1.【參考答案】C 【解析】只有在計算機上正確安裝網卡驅動程序和網絡協議,并正確設置 IP 地址信…

非root用戶在linux中配置zsh(已解決ncurses-devel報錯)

Zsh(Z Shell)是一款功能強大的交互式 Unix shell,以其高度可定制性和豐富的功能著稱,被視為 Bash 的增強替代品。它支持智能補全、主題美化、插件擴展(如 Oh My Zsh 框架)、自動糾錯、全局別名等特性&#…

《Foundations and Recent Trends in Multimodal Mobile Agents: A Survey》論文精讀筆記

論文鏈接:https://arxiv.org/pdf/2411.02006 摘要 文章首先介紹了核心組件,并探討了移動基準和交互環境中的關鍵代表性作品,旨在全面理解研究重點及其局限性。 接著,將這些進展分為兩種主要方法: 基于提示的方法&a…

npm安裝時一直卡住的解決方法

npm install 卡住通常是由于網絡問題或緩存問題導致的。以下是幾種解決方法: 方法1:清理npm緩存 npm cache clean --force npm install方法2:刪除node_modules和package-lock.json重新安裝 rm -rf node_modules package-lock.json npm instal…

[密碼學實戰]使用Java生成國密SM2加密證書等(四十三)

[密碼學實戰]使用Java生成國密SM2加密證書等(四十三) 本文將詳細介紹如何通過Java代碼生成符合國密標準的SM2加密證書,包括密鑰對生成、證書擴展屬性配置、PEM格式保存等關鍵步驟。 一. 運行結果示例 二. 國密算法與加密證書 國密算法(SM系列)是中國自主研發的密碼算法體…

從零開始之stm32之CAN通信

從小白的視角了解并實現簡單的STM32F103的CAN通信,直接上手。一、CAN協議簡介CAN總線上傳輸的信息稱為報文,當總線空閑時任何連接的單元都可以開始發送新的報文,有5種類型的幀:數據幀、遙控幀、錯誤幀、過載幀、幀間隔。數據幀有兩…

Java 課程,每天解讀一個簡單Java之利用條件運算符的嵌套來完成此題:學習成績>=90分的同學用A表示,60-89分之間的用B表示, * 60分以下

package ytr250812;/*題目:利用條件運算符的嵌套來完成此題:學習成績>90分的同學用A表示,60-89分之間的用B表示,* 60分以下*/import java.util.Scanner;public class GradeEvaluator {public static void main(String[] args) …

Word XML 批注范圍克隆處理器

該類用于處理 Word 文檔(XML 結構)中被批注標記的文本范圍, 實現指定內容的深度克隆,并將其插入到目標節點之后。 適用于在生成或修改 .docx 文件時復制批注內容塊。/*** Word XML 批注范圍克隆處理器* * 該類用于處理 Word 文檔&…

MQTT:Java集成MQTT

目錄Git項目路徑一、原生java架構1.1 導入POM文件1.2 編寫測試用例二、SpringBoot集成MQTT2.1 導入POM文件2.2 在YML文件中增加配置2.3 新建Properties配置文件映射配置2.4 創建連接工廠2.5 增加入站規則配置2.6 增加出站規則配置2.7 創建消息發送網關2.8 測試消息發送2.9 項目…

day 16 stm32 IIC

1.IIC概述1基于對話的形式完成,不需要同時進行發送和接收所以刪掉了一根數據線,變成半雙工2為了安全起見添加了應答機制3可以接多個模塊,且互不干擾4異步時序,要求嚴格,發送過程中不能暫停,所以需要同步時序…

AMD KFD的BO設計分析系列 0:開篇

開啟我始終不敢碰的GPU存儲系列,先上個圖把核心關系表達下,以此紀念。注:圖中kfdm_mm誤寫,應該為kfd_mm,不修改了,請大家不要介意。

EUDR的核心內容,EUDR認證的好處,EUDR意義

近年來,全球森林退化問題日益嚴峻,毀林行為不僅加劇氣候變化,還威脅生物多樣性和原住民權益。為應對這一挑戰,歐盟于2023年6月正式實施《歐盟零毀林法案》(EU Deforestation-free Regulation, EUDR)&#x…

數據分析專欄記錄之 -基礎數學與統計知識

數據分析專欄記錄之 -基礎數學與統計知識: 1、描述性統計 均值 data_set [10, 20, 30, 40, 50] mean sum(data_set)/len(data_set)np 里面的函數,對二維進行操作時, 默認每一列 mean1 np.mean(data_set) print(mean, mean1)s 0 for i…