衡量機器學習模型的指標

? ? ? ?為了進一步了解模型的能力,我們需要某個指標來衡量,這就是性能度量的意義。有了一個指標,我們就可以對比不同的模型了,從而知道哪個模型相對好,哪個模型相對差,并通過這個指標來進一步調參以逐步優化我們的模型。

1. 正確率、精確率和召回率

? ? ? ?假設你有一臺用來預測某種疾病的機器,這臺機器需要用某種疾病的數據作為輸入,輸出只可能是兩種信息之一:有病或者沒病。雖然機器的輸出只有兩種,但是其內部對疾病的概率估計p是一個實數。機器上還有一個旋鈕用來控制靈敏度閾值a。因此預報過程是這樣子:首先用數據計算出p,然后比較p和a的大小,p>a輸出有病(檢測結果為陽性),p<a就輸出沒病(檢測結果為陰性)。

? ? ? ?如何評價這臺機器的疾病預測性能呢?這里就要注意了,并不是每一次都能準確預報的機器就是好機器,因為它可以次次都預報有疾病(把a調很低),自然不會漏掉,但是在絕大多數時候它都只是讓大家虛驚一場,稱為虛警;相反,從不產生虛警的機器也不一定就是好機器,因為它可以天天都預報沒有病(把a調很高)——在絕大數時間里這種預測顯然是正確的,但也必然漏掉真正的病癥,稱為漏報。一臺預測能力強的機器,應該同時具有低虛警和低漏報。精確率高意味著虛警少,能保證機器檢測為陽性時,事件真正發生的概率高,但不能保證機器檢測為陰性時,事件不發生。相反,召回率高意味著漏報少,能保證機器檢測為陰性時,事件不發生的概率高,但不能保證機器檢測為陽性時,事件就一定發生。

? ? ? ? 先介紹幾個常見的模型評估術語,現在假設分類目標只有兩類,正例(Positive)和負例(Negative)分別是:

  • 真正例(True Positives, TP):模型正確預測為正類的樣本數。
  • 真負例(True Negatives, TN):模型正確預測為負類的樣本數。
  • 假正例(False Positives, FP):模型錯誤預測為正類的樣本數(實際上是負類)。
  • 假負例(False Negatives, FN):模型錯誤預測為負類的樣本數(實際上是正類)。

? ? (1)正確率(Accuracy)=(TP+TN)/(所有樣本數P+N)最常見的評價指標,適用于樣本均衡分布的情況,衡量整體分類準確性,即所有正確預測的樣本數占總樣本數的比例。

? ? (2)錯誤率(Error Rate)=(FP+FN)/(所有樣本數P+N)與正確率相反,描述被分類器錯分的比例,對某一個實例來說,分對與分錯是互斥事件。

? ? (3)靈敏度(Sensitive)=TP/P,表示的是所有正例中被分對的比例,衡量了分類器對正例的識別能力。

? ??(4)特效度(Specificity)=TN/N,表示的是所有負例中被分對的比例,它衡量了分類器對負例的識別能力。

? ? ?(5)精確度(Precision)=TP/(TP+FP),也叫精度,針對預測結果而言,衡量模型預測為正類的樣本中實際為正類的比例,反映了預測為正類的準確性。

? ? ?(6)召回率(Recall)=TP/(TP+FN)=TP/P=靈敏度Sensitive,針對原來的樣本而言,表示的是樣本中的正例有多少被預測正確了,度量有多少個正例被分為正例。

? ? ? ?比如我們一個模型對15個樣本進行預測,然后結果如下:? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ?真實值:0 1 1 0 1 1 0 0 1 0 1 0 1 0 0? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ?預測值:1 1 1 1 1 0 0 0 0 0 1 1 1 0 1

精度(precision, 或者PPV, positive predictive value) = TP / (TP + FP)= 5 / (5+4) = 0.556

召回(recall, 或者敏感度,sensitivity,真陽性率,TPR,True Positive Rate) = TP / (TP + FN)

在上面的例子中,召回 = 5 / (5+2) = 0.714

特異度(specificity,或者真陰性率,TNR,True Negative Rate) = TN / (TN + FP)

在上面的例子中,特異度 = 4 / (4+2) = 0.667

本文來自互聯網用戶投稿,該文觀點僅代表作者本人,不代表本站立場。本站僅提供信息存儲空間服務,不擁有所有權,不承擔相關法律責任。
如若轉載,請注明出處:http://www.pswp.cn/news/918493.shtml
繁體地址,請注明出處:http://hk.pswp.cn/news/918493.shtml
英文地址,請注明出處:http://en.pswp.cn/news/918493.shtml

如若內容造成侵權/違法違規/事實不符,請聯系多彩編程網進行投訴反饋email:809451989@qq.com,一經查實,立即刪除!

相關文章

Day24|學習前端CSS

HTML把一大段雜亂無章的話&#xff0c;調整變成文章格式顏色rgba&#xff0c;16進制CSS選擇器&#xff08;從上往下&#xff0c;權重越低&#xff09;類選擇器#&#xff08;為多個元素設計相同樣式偽類選擇器&#xff1a;和類選擇器.元素選擇器p&#xff0c;div&#xff0c;li通…

初識數據結構——優先級隊列(堆!堆!堆!)

數據結構專欄 ?(click) 今天就讓我們來聊聊這個讓無數程序員又愛又恨的數據結構——堆&#xff08;Heap&#xff09;。 一、優先級隊列 vs 普通隊列 特性普通隊列優先級隊列出隊順序FIFO&#xff08;先進先出&#xff09;按優先級高低&#xff08;默認小的先出&#xff09;底…

嵌入式學習day25

fwrite&#xff1a;fread&#xff1a;fread/fwrite&#xff1a;拷貝圖片&#xff1a;#include <stdio.h>int main(void) {FILE *fsrc NULL;FILE *fdst NULL;char tmpbuff[4096] {0};size_t nret 0;fsrc fopen("src.jpg", "r");if (NULL fsrc){…

2025年中科院2區紅杉優化算法Sequoia Optimization Algorithm-附Matlab免費代碼

1. 簡介 提出了紅杉優化算法&#xff08;SequoiaOA&#xff09;&#xff0c;這是一種受紅杉森林生態系統自我調節動力學和彈性啟發的新型元啟發式方法&#xff0c;不同于傳統的奇異生物學或現象學靈感。開發一個全面的生態系統驅動框架&#xff0c;包括數學建模、系統分析和通過…

【C#】從 Queue 到 ConcurrentQueue:一次對象池改造的實戰心得

背景 最近在做一個圖像處理的 WPF 項目&#xff0c;底層使用 Halcon 的 HObject 來存放圖像。為了減少頻繁創建和釋放對象帶來的開銷&#xff0c;我實現了一個對象池&#xff0c;用來存放 HObject&#xff0c;方便后續流程復用。 最初的實現用的是 .NET 自帶的 Queue<T>&…

深度解析 AS32S601 芯片 CAN Bus Off 機制:從原理到應用的全流程指南

一、前言在汽車電子、工業自動化等眾多領域&#xff0c;CAN 總線作為一種可靠的通信協議被廣泛應用。而 AS32S601 芯片憑借其卓越的性能和可靠性&#xff0c;在這些領域也發揮著重要作用。其中&#xff0c;CAN Bus Off 功能作為 CAN 總線通信中的關鍵錯誤處理機制&#xff0c;對…

PyCharm Community 2024.2.3.exe 安裝教程(詳細步驟,附安裝包下載)

?1. 下載安裝包? 安裝下載地址&#xff1a;https://pan.quark.cn/s/ca11cb817ee5&#xff0c;你已經下載好了 pycharm-community-2024.2.3.exe 這個文件&#xff08;通常是從 JetBrains 官網下的&#xff09;。雙擊這個 .exe 文件開始安裝。 ?2. 開始安裝向導? 雙擊后&am…

JAVA:SpringBoot 集成 Selenium 實現高效爬蟲

?? 1、簡述 在互聯網數據采集中,傳統基于 Jsoup 或 HttpClient 的爬蟲方案面對復雜 JavaScript 渲染頁面時經常力不從心。此時,Selenium WebDriver 提供了更強大的模擬真實瀏覽器行為能力,成為爬取動態網站的利器。 為了繞過反爬機制,結合 IP 代理池 是提升穩定性和并發…

終端安全檢測和防御技術

目錄 1. 終端安全風險 2. 終端安全檢測和防御技術 3. 網關殺毒技術 3.1 計算機病毒工作步驟 3.2 殺毒防御產品 3.3 網關殺毒功能優勢 3.4 網關殺毒實現方式 4.僵尸網絡檢測和防御技術 4.1 僵尸網絡 4.2 僵尸網絡的形成過程&#xff08;APT場景下&#xff09; 4.3 檢測…

Java緩沖流

字節緩沖流&#xff1a;原理&#xff1a;底層自帶長度為8192的緩沖區提高性能拷貝文件一次讀一個字節一次讀一個字節數組字節緩沖流的讀寫原理字符緩沖流&#xff1a;特定方法字符緩沖輸入流基本寫法輸入所有數據字符緩沖流輸出總結

web服務器tomcat內部工作原理以及樣例代碼

目錄 一、Tomcat 運行原理與 Servlet 機制 1、為什么 Java Web 項目需要 Tomcat 2. 進程模式 vs 線程模式 3、Servlet / Controller 是怎么跟 Tomcat 對接的? 4、java反射與代理機制 ※--高級知識點 (1)原理 (1)樣例:用反射和注解模擬 Tomcat 處理 HTTP 請求時,動…

AI賦能IT服務管理:從被動響應到智能驅動的躍遷

過去十年&#xff0c;IT服務管理&#xff08;ITSM&#xff09;經歷了從紙質工單到數字化平臺的變革&#xff0c;但無論工具多么先進&#xff0c;大多數IT團隊依然面臨著相同的困境&#xff1a;事件處理速度跟不上業務變化人工重復操作占用大量時間數據雖多&#xff0c;卻缺乏可…

云計算-K8s 核心組件之CronJob、RBAC、HPA ,LimitRange、DaemonSet、nodeSelector如何作戰?

目錄 1.CronJob管理 2.RBAC管理 3.HPA管理 4.健康檢查 5.LimitRange管理 6.DaemonSet管理 7.nodeSelector管理 簡介 1. CronJob&#xff08;定時任務控制器&#xff09; 按固定時間間隔&#xff08;類似 Linux cron&#xff09;自動觸發一次性任務&#xff08;Job&#…

數據分析學習總結之實例練習(雙十一淘寶美妝)

本次通過對雙十一淘寶美妝數據的分析實踐&#xff0c;我系統掌握了數據處理與分析的完整流程&#xff0c;從數據初步認知到深度挖掘&#xff0c;再到可視化呈現與結論提煉&#xff0c;收獲頗豐。以下是具體的學習總結&#xff1a;一、數據初步了解&#xff1a;奠定分析基礎在分…

如何評估一個需求的業務價值

要科學、全面地評估一個需求的業務價值&#xff0c;核心在于建立一個多維度的、從戰略到財務、從客戶到風險的“價值羅盤”&#xff0c;并運用這套羅盤&#xff0c;對需求進行系統性的、數據驅動的量化與定性分析。一套成熟的價值評估體系&#xff0c;其構建必須涵蓋五大關鍵視…

day38_2025-08-12

一、 圖像數據的介紹 1.1 灰度圖像 從這里開始我們進入到了圖像數據相關的部分&#xff0c;也是默認你有之前復試班計算機視覺相關的知識&#xff0c;但是一些基礎的概念我仍然會提。 昨天我們介紹了minist這個經典的手寫數據集&#xff0c;作為圖像數據&#xff0c;相較于結構…

Kubernetes1.28-單Master集群部署

一、 服務器環境及初始化 1、架構分析 集群角色主機名操作系統IP地址masterk8s-masterOpenEuler24.03192.168.166.128nodek8s-node1OpenEuler24.03192.168.166.129nodek8s-node2OpenEuler24.03192.168.166.130 2、初始化 所有節點都需要初始化&#xff01; 2.1、清空Iptal…

使用pyqt5實現可勾選的測試用例界面

目錄 界面 代碼 python有哪些自動化測試的庫和html的報告的庫可以和這個軟件結合使用的 **一、自動化測試核心庫** **二、HTML報告生成庫** **三、其他實用工具** **與您的工具結合建議** 參考 界面 代碼 import sys import time import random from PyQt5.QtWidgets import (…

C語言變量的聲明和定義有什么區別?

定義&#xff1a;定義&#xff1a;為變量分配地址和存儲空間聲明&#xff1a;不分配地址和存儲空間一個變量可以在多個地方聲明&#xff0c;但是只在一個地方定義。加入extern修飾的是變量的聲明&#xff0c;說明此變量將在文件或在文件后面部分定義。1.變量聲明作用&#xff1…

imx6ull-驅動開發篇20——linux互斥體實驗

目錄 實驗程序編寫 修改設備樹文件 LED 驅動修改 mutex.c 測試mutexApp.c Makefile 文件 運行測試 在之前的文章里&#xff0c;我們學習了&#xff1a;驅動開發篇16——信號量與互斥體。 本講實驗里&#xff0c;我們來使用互斥體mutex實現 LED 燈互斥訪問的功能&#x…