邏輯回歸知識點

一、邏輯回歸概念

邏輯回歸(Logistic Regression)是一種廣泛應用于分類問題的統計方法,尤其適用于二分類問題。

注意: 盡管名稱中有"回歸"二字,但它實際上是一種分類算法。

解決二分類的問題

API:sklearn.linear_model.LogisticRegression

二、核心函數

Sigmoid函數:\sigma \left ( z \right )=\frac{1}{1+e^{-z}}

其中z=w^{T}x+b,w是權重向量,x是特征向量,b是偏置項。

三、邏輯回歸原理和優化手段

1.原理:(核心思想)邏輯回歸通過將線性回歸的輸出映射到(0,1)區間,使用Sigmoid函數將連續值轉換為概率值,然后根據概率值進行分類預測。

2.優化手段:極大似然估計和最小化交叉熵。

極大似然估計:(MLE,即 Maximum Likelihood Estimation)

????????是一種統計方法,用于從觀測數據中估計概率分布的參數。核心思想是“在已知觀測數據的情況下,選擇使得這些數據出現概率最大的參數值。”

? ? ? ? 二分類公式:

L\left ( p \right )=\prod_{i=1}^{n}p^{y_{i}}\left ( 1-p \right )^{1-y_{i}}

其中y_{i}表示第i個樣本的真實標簽,取值為0或1(1表示成功,0表示失敗),p是模型預測的“成功”概率(即P\left ( y_{i}=1 \right )),是帶估計的參數。

最小化交叉熵:交叉熵損失函數(Cross-Entropy Loss),也稱為對數損失(Log Loss)

????????交叉熵是衡量兩個概率分布(真實分布 y和預測分布 p)差異的指標

????????二分類公式:

Loss\left ( L \right )=-\sum_{i=1}^{m}\left ( y_{i}ln\left ( p_{i} \right )+\left ( 1-y_{i} \right )ln\left ( 1-p_{i} \right ) \right )

其中y_{i}表示第i個樣本的真實標簽,通常取值0或1(二分類問題),p_{i}表示模型預測的第i個樣本屬于類別1的概率(即P\left ( y_{i}=1|x_{i} \right )
?

關系:先用伯努利分布的似然函數,然后對其取負對數,直接得到交叉熵損失,然后不斷的梯度下降迭代更新找到最優參數!(把最大化問題將其變為最小化問題,把連乘問題將其變為連加問題)

四、混淆矩陣

1.概念

????????混淆矩陣是機器學習中用于評估分類模型性能的表格。它展示了模型的預測結果與實際標簽的對比情況。

2.圖解

3.作用

? ????????直觀顯示模型的分類錯誤類型(如誤診、漏檢),計算關鍵指標:準確率(Accuracy)、精確率(Precision)、召回率(Recall)、F1分數等。

五、分類結果評價指標

1.準確率(Accuracy_score)

準確率 = 預測正確的樣本數 / 總樣本數? ? ? ? 其中預測正確指的是預測結果 = 真實結果(包含正例以及反例)

Accuracy=\frac{TP+TN}{TP+TN+FP+FN}

2.精確率(Precision_score)?

精確率 是 預測正例中真實正例的個數占比

P=\frac{TP}{TP+FP}

3.召回率(Recall_score)

召回率 是 真實正例中預測的正例的個數占比

P=\frac{TP}{TP+FN}

4.F1-score

對模型的精確率和召回率都有要求,希望知道模型在這兩個評估方向的綜合預測能力

P=\frac{2*Precision*Recall}{Precision+Recall}

5.ROC曲線

概念:ROC曲線以模型的真正率為縱軸,假正率為橫軸,它將模型在不同閾值下的表現以曲線的形式展現出來。

真正率: 正樣本中被預測為正樣本的概率TPR (True Positive Rate)

假正率: 負樣本中被預測為正樣本的概率FPR (False Positive Rate)

6.AUC面積

ROC曲線下方的面積,AUC越大,代表分類器越好

本文來自互聯網用戶投稿,該文觀點僅代表作者本人,不代表本站立場。本站僅提供信息存儲空間服務,不擁有所有權,不承擔相關法律責任。
如若轉載,請注明出處:http://www.pswp.cn/news/908015.shtml
繁體地址,請注明出處:http://hk.pswp.cn/news/908015.shtml
英文地址,請注明出處:http://en.pswp.cn/news/908015.shtml

如若內容造成侵權/違法違規/事實不符,請聯系多彩編程網進行投訴反饋email:809451989@qq.com,一經查實,立即刪除!

相關文章

GCC內存占用統計使用指南

GCC 的 --print-memory-usage 選項用于在編譯鏈接過程中輸出程序的內存占用統計信息,特別適用于嵌入式開發等內存受限的場景。其主要作用和輸出內容如下: 核心功能 顯示內存分段占用 輸出程序在目標設備內存中的分段占用情況,通常包括&#…

Vue3 + Typescript:類型使用記錄 / 類型注解 / 積累

一、ReturnType<typeof createApp> ReturnType<typeof createApp> 是一種類型安全的寫法&#xff0c;是 TypeScript 中的一個高級類型&#xff0c;它用于獲取函數 createApp 的返回類型。 實例&#xff1a; import registerFocus from ./focus // 獲取焦點 impo…

SIFT 算法原理詳解

SIFT 算法原理詳解 SIFT&#xff08;尺度不變特征變換&#xff0c;Scale-Invariant Feature Transform&#xff09;是一種經典的局部特征檢測和描述算法&#xff0c;它能夠在不同的尺度、旋轉和光照變化下穩定地檢測圖像特征。SIFT 主要包括以下幾個步驟&#xff1a;尺度空間極…

2024年認證杯SPSSPRO杯數學建模D題(第二階段)AI繪畫帶來的挑戰解題全過程文檔及程序

2024年認證杯SPSSPRO杯數學建模 D題 AI繪畫帶來的挑戰 原題再現&#xff1a; 2023 年開年&#xff0c;ChatGPT 作為一款聊天型AI工具&#xff0c;成為了超越疫情的熱門詞條&#xff1b;而在AI的另一個分支——繪圖領域&#xff0c;一款名為Midjourney&#xff08;MJ&#xff…

電子電路:全面深入了解晶振的定義、作用及應用

本次了解重點: 1.壓電效應的數學描述 2.生產工藝以及關鍵工序 3.電路設計部分如負阻原理和匹配電容計算 4.失效案例比如冷啟動問題 5.新形態晶振技術引入5G和量子計算 6.溫補晶振的補償機制 7故障案例講解-更換負載電池或增加預熱電路 藍牙音頻斷續-頻偏導致 工控機死機-起振電…

【Java實用工具類】手擼SqlBuilder工具類,優雅拼接動態SQL,MyBatisPlus同款風格!

&#x1f4cc; 正文&#xff1a; 有時候我們項目底層是 JdbcTemplate 查詢&#xff0c;沒法像 MyBatisPlus 一樣用 Wrapper 拼接條件&#xff0c;但我們又不想手擼字符串。那怎么辦&#xff1f;我今天就給你整了個 SqlBuilder 工具類&#xff0c;支持 eq、ne、like、in、gt、l…

WEB3——開發者怎么查看自己的合約日志記錄

在區塊鏈中查看合約的日志信息&#xff08;也叫事件 logs&#xff09;&#xff0c;主要有以下幾種方式&#xff0c;具體方法依賴于你使用的區塊鏈平臺&#xff08;如 Ethereum、BSC、Polygon 等&#xff09;和工具&#xff08;如 Etherscan、web3.js、ethers.js、Hardhat 等&am…

Maven-生命周期

目錄 1.項目對象模型 2.依賴管理模型 3.倉庫&#xff1a;用于存儲資源&#xff0c;管理各種jar包 4.本地倉庫路徑 1.項目對象模型 2.依賴管理模型 3.倉庫&#xff1a;用于存儲資源&#xff0c;管理各種jar包 4.本地倉庫路徑

redis數據過期策略

redis數據過期策略有兩種方案 1.惰性刪除 2.定期刪除 首先說惰性刪除&#xff0c;對于已經過期的數據&#xff0c;訪問這個key的時候判斷key是否過期&#xff0c;如果過期則刪除&#xff0c;這種方式對cpu友好&#xff0c;只有使用key的時候才會進行過期檢查&#xff0c;用不到…

P1040 [NOIP 2003 提高組] 加分二叉樹

目錄 題目算法標簽: 區間 d p dp dp, 動態規劃, d f s dfs dfs思路代碼 題目 P1040 [NOIP 2003 提高組] 加分二叉樹 算法標簽: 區間 d p dp dp, 動態規劃, d f s dfs dfs 思路 給出的是一顆子樹的中序遍歷, s c o r e l r r o o t score l \times r root scorelrro…

uni-app學習筆記十七-css和scss的使用

SCSS 和 CSS的異同點 我們可以使用css和scss來設置樣式。其中SCSS&#xff08;Sassy CSS&#xff09;是 CSS 預處理器 Sass&#xff08;Syntactically Awesome Stylesheets&#xff09;的一種語法格式&#xff0c;而 CSS&#xff08;Cascading Style Sheets&#xff09;是標準…

Spring Boot中Excel處理完全指南:從基礎到高級實踐

Excel處理基礎知識 1.1 為什么需要在應用中處理Excel文件&#xff1f; 在企業應用開發中&#xff0c;Excel文件處理是一個非常常見的需求&#xff0c;主要用于以下場景&#xff1a; 數據導入&#xff1a;允許用戶通過Excel上傳批量數據到系統 數據導出&#xff1a;將系統數據…

Python編程基礎(四) | if語句

引言&#xff1a;很久沒有寫 Python 了&#xff0c;有一點生疏。這是學習《Python 編程&#xff1a;從入門到實踐&#xff08;第3版&#xff09;》的課后練習記錄&#xff0c;主要目的是快速回顧基礎知識。 練習1&#xff1a;條件測試 編寫一系列條件測試&#xff0c;將每個條…

使用pandas實現合并具有共同列的兩個EXCEL表

表1&#xff1a; 表2&#xff1a; 表1和表2&#xff0c;有共同的列“名稱”&#xff0c;而且&#xff0c;表1的內容&#xff08;行數&#xff09;<表2的行數。 目的&#xff0c;根據“名稱”列的對應內容&#xff0c;將表2列中的“所處行業”填寫到表1相應的位置。 實現代…

ERP學習-AP

業務需要。持續更新學習進度 借助網上零搭建平臺上手實操 這個是簡道云平臺頁面鏈接&#xff0c;登錄的化去手機號登錄 目前開始對應付模塊進行學習

Dify知識庫下載小程序

一、Dify配置 1.查看或創建知識庫的API 二、下載程序配置 1. 安裝依賴resquirements.txt ######requirements.txt##### flask2.3.3 psycopg2-binary2.9.9 requests2.31.0 python-dotenv1.0.0#####安裝依賴 pip3 install -r requirements.txt -i https://pypi.tuna.tsinghua.…

【PbstarAdmin】微前端架構下的高效后臺管理系統解決方案

如果你正在尋找一個高效、穩定、易于使用、易于擴展的管理后臺解決方案&#xff0c;PbstarAdmin 絕對值得一試。以下是它的在線演示和官方文檔地址&#xff0c;你可以先睹為快&#xff1a; 在線演示&#xff1a;http://pbstar-admin.pbstar.cn/官方文檔&#xff1a;http://pbs…

Java基礎之數組(附帶Comparator)

文章目錄 基礎概念可變參數組數組與ListComparator類1,基本概念2,使用Comparator的靜態方法&#xff08;Java 8&#xff09;3,常用Comparator方法4,例子 排序與查找數組復制其他 基礎概念 int[] anArray new int[10];只有創建對象時才會使用new關鍵字&#xff0c;所以數組是個…

Apache Doris 在數據倉庫中的作用與應用實踐

在當今數字化時代&#xff0c;企業數據呈爆炸式增長&#xff0c;數據倉庫作為企業數據管理和分析的核心基礎設施&#xff0c;其重要性不言而喻。而 Apache Doris&#xff0c;作為一款基于 MPP&#xff08;Massively Parallel Processing&#xff0c;大規模并行處理&#xff09;…

P1438 無聊的數列/P1253 扶蘇的問題

因為這兩天在寫線性代數的作業&#xff0c;沒怎么寫題…… P1438 無聊的數列 題目背景 無聊的 YYB 總喜歡搞出一些正常人無法搞出的東西。有一天&#xff0c;無聊的 YYB 想出了一道無聊的題&#xff1a;無聊的數列。。。 題目描述 維護一個數列 ai?&#xff0c;支持兩種操…