機器學習常用評估指標

機器學習常用評估指標

機器學習的評價指標有精度、精確率、召回率、P-R曲線、F1 值、TPR、FPR、ROC等指標,還有在生物領域常用的敏感性、特異性等指標。

基礎

在分類任務中,各指標的計算基礎都來自于對正負樣本的分類結果,用混淆矩陣表示,如 圖1 所示:

在這里插入圖片描述

其中:

  • TP(True Positives)表示真正例,即模型正確預測為正類的樣本數量。

  • FN(False Negatives)表示假負例,即模型錯誤預測為負類的正類樣本數量。

  • FP(False Positive)表示假正例,即模型錯誤地將負類預測為正類的情況。

  • TN(True Negative)表示真正例,即模型正確地將負類預測為負類的情況。

精度
Accuracy = T P + T N T P + F N + F P + T N \text{Accuracy} = \frac{TP + TN}{TP + FN + FP + TN} Accuracy=TP+FN+FP+TNTP+TN?

即所有分類正確的樣本占全部樣本的比例。

精確率

精確率又叫Precision
Precision = T P T P + F P \text{Precision} = \frac{TP}{TP + FP} Precision=TP+FPTP?

模型預測為正例的樣本中,真正為正例的比例。

召回率

召回率又叫:Recall、查全率
Recall = T P T P + F N \text{Recall} = \frac{TP}{TP + FN} Recall=TP+FNTP?

即模型正確識別出的正類樣本占所有實際正類樣本的比例。

P-R曲線

P-R曲線又叫做:PRC,通過可視化的方式展示了模型在精確率和召回率兩個關鍵指標之間的權衡關系。
在這里插入圖片描述
理想情況下,曲線應盡可能靠近右上角(精確率和召回率均為 1)。

AP(Average Precision)是 P-R 曲線與坐標軸圍成的面積,用于量化模型整體性能。AP 值越高,模型在不同閾值下的綜合表現越好。

F1 值

F1 值是機器學習中用于衡量分類模型性能的綜合指標,它通過調和平均的方式整合了精確率和召回率。
F 1 = 2 ? P ? R P + R F1 = \frac{2 \ast P \ast R}{P + R} F1=P+R2?P?R?

相較于算術平均,調和平均更強調對較小值的敏感性。這意味著當精確率或召回率任意一方過低時,F1 值會顯著下降,從而強制模型在兩者間尋求平衡。

TPR

真正例率,衡量正例識別能力,即召回率。
TPR = T P T P + F N \text{TPR} = \frac{TP}{TP + FN} TPR=TP+FNTP?

FPR

假正例率,衡量負例誤判為正例的比例。

FPR = F P F P + T N \text{FPR} = \frac{FP}{FP + TN} FPR=FP+TNFP?

ROC

ROC曲線起源于二戰時期的雷達信號檢測理論,用于衡量 “信號” 與 “噪聲” 的區分能力。

在這里插入圖片描述

P-R 和 ROC 的區別:

ROC 曲線以FPR為橫軸、TPR為縱軸,側重展示模型在不同閾值下區分正負樣本的整體能力,對樣本不均衡不敏感,適用于醫療診斷等需平衡誤判成本的場景;而 P-R 曲線以Recall為橫軸、Precision為縱軸,直接刻畫正例預測的 “查準率” 與 “查全率” 權衡,在正負樣本高度失衡(如欺詐檢測)時更能反映模型對稀有正例的識別性能,兩者分別從不同維度揭示模型在分類閾值調整下的表現,需結合數據分布和業務目標選擇使用。

AUC 即 ROC 曲線下的面積,是評估二分類模型性能的核心指標。其本質是衡量模型對正負樣本的排序能力——AUC 值越高,模型將正樣本排在負樣本之前的概率越大。

本文來自互聯網用戶投稿,該文觀點僅代表作者本人,不代表本站立場。本站僅提供信息存儲空間服務,不擁有所有權,不承擔相關法律責任。
如若轉載,請注明出處:http://www.pswp.cn/web/84789.shtml
繁體地址,請注明出處:http://hk.pswp.cn/web/84789.shtml
英文地址,請注明出處:http://en.pswp.cn/web/84789.shtml

如若內容造成侵權/違法違規/事實不符,請聯系多彩編程網進行投訴反饋email:809451989@qq.com,一經查實,立即刪除!

相關文章

視頻相似度檢測算法(帶課設報告)

摘 要 本文提出了一種基于關鍵幀特征提取的視頻相似度檢測方法,通過融合自適應采樣與特征降維技術實現高效準確的視頻內容比對。系統采用三階段處理流程:首先對輸入視頻進行自適應關鍵幀采樣,通過均勻間隔算法提取固定數量(默…

微服務江湖的愛恨情仇:Spring Cloud 與 Kubernetes 的雙雄演義

引言:雙雄并立,一個時代的序幕 微服務革命,如同一場燎原之火,將龐大、笨重的單體應用燒成灰燼,宣告了一個敏捷、獨立、快速迭代的新紀元。然而,這場革命在摧毀舊世界的同時,也催生了一片混沌的新…

深度拆解RAGFlow分片引擎之切片實現

上一篇深度拆解RAGFlow分片引擎!3大階段視覺增強,全網最硬核架構解析 講了切片的整體流程,今天我們來拆下切片的實現。 我們在設置的時候,可以選擇切片方法。這個參數是parser_id 在創建知識庫的時候,選擇對應的切片方…

CSS平滑滾動效果實現方法

一、純CSS實現方案 使用 scroll-behavior 屬性 屬性值 auto (默認值):滾動框立即滾動smooth:滾動框以平滑的方式滾動 /* 全局平滑滾動 */ html {scroll-behavior: smooth; }/* 特定容器平滑滾動 */ .scroll-container {scroll-behavior: smooth;over…

李沐動手深度學習(pycharm中運行筆記)——12.權重衰退

12.權重衰退(與課程對應) 目錄 一、權重衰退 1、使用均方范數作為硬性限制 2、使用均方范數作為柔性限制(通常這么做) 3、演示對最優解的影響 4、參數更新法則 5、總結 二、代碼實現從零實現 三、代碼實現簡介實現 一、權重…

React Native【實戰范例】同步跟隨滾動

最終效果 實現原理 主動滾動區觸發滾動事件,原生監聽滾動值的變化,并用動畫的方式實時同步到跟隨滾動區 技術要點 使用 Animated.ScrollView 使用動畫變量 const scrollY useRef(new Animated.Value(0)).current;主動滾動觸發 onScroll,用 …

如何僅用AI開發完整的小程序<3>—創建小程序基礎框架

1、啟動小程序開發者工具-選擇小程序,點擊 2、創建一個項目工程 項目名稱:自己填默認的也行,最好不要中文,拼音也行 目錄:選擇你的項目創建路徑 AppID:可以先點測試號,后面再替換自己的AppID就…

SQL等價改寫優化

or 與 union all的優化 在SQL開發中,我們經常會遇到這樣的情況:需要組合多個相似但略有不同的查詢結果。大多數開發者本能地使用UNION/UNION ALL來解決,這種方式直觀易懂,但在特定場景下卻隱藏著巨大的性能浪費。 本案例將從執行…

【已解決】 數據庫INSERT操作時,Column count doesn’t match value count at row 1

【已解決】數據庫INSERT操作時,ColumnColumn count doesn’t match value count at row 1 在開發過程中,我們經常會遇到數據庫操作錯誤,其中之一就是 MySQL 中的 “Column count doesn’t match value count at row1” 錯誤。這個錯誤通常發…

管件接頭的無序抓取

文章目錄 1,目的2,過程3,易混易錯點4,代碼詳解4.1,初始化窗口4.2,創建多視角立體視覺模型。4.3,創建表面匹配模型4.4,多視角立體視覺重建管件堆表面模型4.5,管道接頭查找…

移遠通信 × 紫光展銳,推動FWA “5G+AI”新體驗

6月19日,在2025 MWC上海期間,移遠通信宣布,攜手紫光展銳,推出面向下一代CPE應用的“5GAI”融合解決方案。目前雙方正聯合多家CPE廠商開展方案深度調優,以加速5GAI CPE終端的產業化落地進程。 該方案以移遠5G模組RG620…

深入理解Grad-CAM:用梯度可視化神經網絡的“注意力“

深入理解Grad-CAM:用梯度可視化神經網絡的"注意力" 引言 在深度學習的發展過程中,模型的可解釋性一直是一個重要的研究方向。盡管現代神經網絡在圖像識別、自然語言處理等任務上取得了令人矚目的成果,但它們往往被稱為"黑盒…

離線環境jenkins構建前端部署鏡像

gitlabjenkins 實現前端項目打包成 docker 鏡像;gitlab部署就不贅述了;因部署的gitlab版本的webhooks有問題,無法進行配置,所以文章的構建是手動觸發的。并且nodejs部署應該也能跟docker一樣直接安裝進jenkins的鏡像(但是多版本可能就有其他問…

案例:塔能科技×某市智能照明——從傳統亮化到智慧光生態的跨越

在城市發展的滾滾浪潮中,市政照明不僅是驅散黑夜的光明使者,更是衡量城市智能化水平的關鍵標尺。貴州某市的城市照明系統正經歷一場意義深遠的革新,塔能科技以創新科技為核心驅動力,為這座城市的夜間照明生態注入全新活力。通過智…

LeapMotion-HandPoseRecorder 腳本詳解

HandPoseRecorder 腳本詳解 這個腳本是一個用于在 Unity 中錄制和保存 Leap Motion 手部姿勢的工具。下面我將詳細解釋腳本的各個部分: 核心功能 該腳本的主要作用是: 從 Leap Motion 設備捕獲當前手部姿勢數據 將姿勢數據序列化為可重用的 ScriptableObject 在 Unity 項目…

【Guava】0.做自己的編程語言

【Guava】0.做自己的編程語言 0.前言1.明確你的目標1.2.設計1.3.寫一個介紹 2.開始吧! 0.前言 DO WHAT THE F**K YOU WANT TO DO 我相信,網上有許多各式各樣的做自己的編程語言教程,but 都是這樣 收費 shit 本教程教你真正教你實現一個名叫G…

【軟考高級系統架構論文】論無服務器架構及其應用

論文真題 近年來,隨著信息技術的迅猛發展和 應用需求的快速更迭,傳統的多層企業應用系統架構面臨越來越多的挑戰,已經難以適應這種變化。在這一背景下,無服務器架構(Serverless Architecture) 逐漸流行,它強調業務邏輯…

國產MCU A\B SWAP原理及實操

看到有讀者留言說還是沒理清A\B SWAP的原理。 今天就以某國產MCU為例,實際演示一番,看看大家在芯片設計時思路是什么。 我們首先回顧下SWAP的基本思想。 SWAP的基本思想是將PFLASH分成兩組Bank,Bank A(假設是active)和Bank B(假設是inacti…

目標檢測neck經典算法之FPN的源碼實現

┌────────────────────────────────────────────────────┐│ 初始化構造 (__init__) │└─────────────────────────────────────────────…

extern關鍵字:C/C++跨文件編程利器

在 C 和 C 中,extern 是一個關鍵字,用于聲明變量或函數是在其他文件中定義的。它主要用于實現多個源文件之間的符號共享。 目錄 📌 一、C語言中的 extern 1. 基本作用 2. 示例說明 定義全局變量(只在一個 .c 文件中&#xff…