評估指標:精確率(Precision)、召回率(Recall)、F1分數(F1 Score)

評估指標:精確率(Precision)、召回率(Recall)、F1分數(F1 Score)

  • 前言
  • 相關介紹
      • 1. 準確率(Accuracy)
      • 2. 精確率(Precision)
      • 3. 召回率(Recall)
      • 4. F1分數 (F1 Score)
      • 5. ROC曲線和AUC(Area Under the Curve)
      • 6. PR曲線(Precision-Recall Curve)
  • F1分數 (F1 Score)
      • F1分數的計算
      • F1分數的優點
      • F1分數的缺點
    • 計算實例
      • 示例數據
      • 計算精確率(Precision)
      • 計算召回率(Recall)
      • 計算F1分數 (F1 Score)

在這里插入圖片描述

前言

  • 由于本人水平有限,難免出現錯漏,敬請批評改正。
  • 更多精彩內容,可點擊進入人工智能知識點專欄、Python日常小操作專欄、OpenCV-Python小應用專欄、YOLO系列專欄、自然語言處理專欄或我的個人主頁查看
  • 基于DETR的人臉偽裝檢測
  • YOLOv7訓練自己的數據集(口罩檢測)
  • YOLOv8訓練自己的數據集(足球檢測)
  • YOLOv5:TensorRT加速YOLOv5模型推理
  • YOLOv5:IoU、GIoU、DIoU、CIoU、EIoU
  • 玩轉Jetson Nano(五):TensorRT加速YOLOv5目標檢測
  • YOLOv5:添加SE、CBAM、CoordAtt、ECA注意力機制
  • YOLOv5:yolov5s.yaml配置文件解讀、增加小目標檢測層
  • Python將COCO格式實例分割數據集轉換為YOLO格式實例分割數據集
  • YOLOv5:使用7.0版本訓練自己的實例分割模型(車輛、行人、路標、車道線等實例分割)
  • 使用Kaggle GPU資源免費體驗Stable Diffusion開源項目

相關介紹

在人工智能領域,特別是在監督學習的任務中,評估模型性能是非常關鍵的步驟。

評估指標是衡量模型或系統性能的關鍵參數,不同的應用場景會采用不同的評估指標。它們將抽象的評估目標轉化為具體可量化的數值,幫助我們了解模型在特定任務上的表現。

以下是一些常用的評估指標,包括它們的定義、計算公式以及優缺點:

1. 準確率(Accuracy)

定義:模型正確分類的樣本數占總樣本數的比例。
公式 A c c u r a c y = TP + TN TP + FN + FP + TN Accuracy = \frac{\text{TP} + \text{TN}}{\text{TP} + \text{FN} + \text{FP} + \text{TN}} Accuracy=TP+FN+FP+TNTP+TN?
其中,TP(True Positive)是真的正類被正確預測的數量,TN(True Negative)是真的負類被正確預測的數量,FP(False Positive)是假的正類預測,FN(False Negative)是假的負類預測。

優點:簡單直觀,容易理解。
缺點:在數據類別不平衡的情況下,準確率可能產生誤導,因為模型可能只是簡單地預測多數類而忽略了少數類的表現。

2. 精確率(Precision)

定義:預測為正類中真正是正類的比例。
公式 P r e c i s i o n = TP TP + FP Precision = \frac{\text{TP}}{\text{TP} + \text{FP}} Precision=TP+FPTP?

優點:關注預測為正例的準確性,適用于錯誤的正面預測成本較高的場景。
缺點:不考慮真負例,因此在負例很多且預測很少時,精確率可能很高,但模型可能錯過許多正例。

3. 召回率(Recall)

定義:真正是正類的樣本中被正確預測為正類的比例。
公式 R e c a l l = TP TP + FN Recall = \frac{\text{TP}}{\text{TP} + \text{FN}} Recall=TP+FNTP?

優點:強調對正類的識別能力,適用于不能遺漏正例的場景。
缺點:可能會忽視假陽性預測的影響,即預測為正類但實際上為負類的情況。

4. F1分數 (F1 Score)

定義:精確率和召回率的調和平均值,旨在同時考慮精確率和召回率。
公式 F 1 = 2 × P r e c i s i o n × R e c a l l P r e c i s i o n + R e c a l l F1 = 2 \times \frac{Precision \times Recall}{Precision + Recall} F1=2×Precision+RecallPrecision×Recall?

優點:在單一指標中平衡了精確率和召回率,適用于兩者都重要的情況。
缺點:當精確率和召回率中有一個非常低時,F1分數可能無法準確反映模型性能。
在這里插入圖片描述

5. ROC曲線和AUC(Area Under the Curve)

定義:ROC曲線通過改變分類閾值,展示真正率(TPR)與假正率(FPR)的關系。AUC是ROC曲線下的面積。
優點:提供了一個整體評估模型分類能力的方法,不受單一閾值影響,AUC接近1表示分類器優秀。
缺點:對于多分類問題,需要計算多個二分類ROC曲線,或使用多分類的ROC曲線變體。

6. PR曲線(Precision-Recall Curve)

定義:同樣通過改變分類閾值,顯示精確率和召回率之間的權衡關系。
優點:在類別不平衡的數據集中更為有用,能更清晰地看到不同閾值下的性能變化。
缺點:不像AUC那樣有統一的標準解釋,比較不同模型時可能需要直接對比曲線形狀。

選擇合適的評估指標時,應考慮具體應用場景的需求,比如是否重視查準還是查全,或者數據集是否平衡等。
在這里插入圖片描述

F1分數 (F1 Score)

F1分數(F1 Score)是一種廣泛應用于二分類和多分類問題中的性能評價指標,特別是對于類別不平衡的數據集而言,它能提供比單一的精確率或召回率更為全面的性能評估。下面是F1分數的詳細解析,包括其計算方法、優勢和局限性:

F1分數的計算

F1分數是精確率(Precision)和召回率(Recall)的調和平均數,旨在綜合這兩個指標,以反映模型在分類任務中的平衡表現。其計算公式為:

F 1 = 2 × Precision × Recall Precision + Recall F1 = 2 \times \frac{\text{Precision} \times \text{Recall}}{\text{Precision} + \text{Recall}} F1=2×Precision+RecallPrecision×Recall?

  • 精確率(Precision) 表示模型預測為正類別的樣本中,真正為正類別的比例,計算公式為 (\frac{\text{真正例(TP)}}{\text{真正例(TP)} + \text{假正例(FP)}})。
  • 召回率(Recall) 表示所有實際為正類別的樣本中,被模型正確識別的比例,計算公式為 (\frac{\text{真正例(TP)}}{\text{真正例(TP)} + \text{假陰例(FN)}})。

F1分數的優點

  1. 平衡精確率和召回率:F1分數同時考慮了模型預測的精確性和完整性,對于需要兩者都達到較高水平的應用非常適用。
  2. 類別不平衡數據集:在正負樣本數量差距較大的情況下,F1分數能夠給出更為公平的性能評估,相比單獨使用精確率或召回率更能反映出模型的整體效能。
  3. 單一指標:作為一個單一的數值指標,F1分數簡化了模型性能的比較,便于理解和溝通。

F1分數的缺點

  1. 權重固定:F1分數對精確率和召回率給予相同的權重(即1:1),但在某些應用場景下,根據具體需求,可能需要對二者賦予不同的重要性(例如,某些情況下召回率可能比精確率更重要)。
  2. 忽視真負例(TN):F1分數完全依賴于正例的預測情況,忽略了模型正確預測為負例的能力,因此在某些場景下可能不足以全面評估模型性能,尤其是當錯誤地分類負例成本也很高時。
  3. 極端情況:當精確率和召回率中有一個為0時,F1分數也會變為0,即使另一個指標非常高,這可能在某些情況下顯得過于苛刻。

綜上所述,F1分數是衡量分類模型性能的有效工具,尤其適合評估那些需要均衡考慮精確率和召回率的應用場景。然而,在選擇評估指標時,應考慮具體任務的需求,有時可能需要結合其他指標如AUC-ROC、Precision-Recall曲線等進行綜合分析。

計算實例

F1分數是一種統計度量,用于評估二分類(或多標簽分類中的每一個類別)模型的性能,它是精確率(Precision)和召回率(Recall)的調和平均值。下面通過一個簡單的例子來說明如何計算F1分數:

示例數據

假設我們有一個二分類問題,模型預測的結果和實際標簽如下:

  • 真實正例(TP,True Positives): 25個
  • 假正例(FP,False Positives): 5個
  • 真實負例(TN,True Negatives): 70個
  • 假負例(FN,False Negatives): 10個

計算精確率(Precision)

精確率是指模型預測為正例中實際確實是正例的比例。
Precision = TP TP + FP = 25 25 + 5 = 25 30 = 0.8333 \text{Precision} = \frac{\text{TP}}{\text{TP} + \text{FP}} = \frac{25}{25 + 5} = \frac{25}{30} = 0.8333 Precision=TP+FPTP?=25+525?=3025?=0.8333

計算召回率(Recall)

召回率是指實際正例中被模型正確識別出來的比例。
Recall = TP TP + FN = 25 25 + 10 = 25 35 = 0.7143 \text{Recall} = \frac{\text{TP}}{\text{TP} + \text{FN}} = \frac{25}{25 + 10} = \frac{25}{35} = 0.7143 Recall=TP+FNTP?=25+1025?=3525?=0.7143

計算F1分數 (F1 Score)

F1分數結合了精確率和召回率,公式如下:
F1?Score = 2 × Precision × Recall Precision + Recall \text{F1 Score} = 2 \times \frac{\text{Precision} \times \text{Recall}}{\text{Precision} + \text{Recall}} F1?Score=2×Precision+RecallPrecision×Recall?
將上面計算的精確率和召回率代入公式中:
F1?Score = 2 × 0.8333 × 0.7143 0.8333 + 0.7143 ≈ 2 × 0.5972 1.5476 ≈ 2 × 0.3864 = 0.7728 \text{F1 Score} = 2 \times \frac{0.8333 \times 0.7143}{0.8333 + 0.7143} \approx 2 \times \frac{0.5972}{1.5476} \approx 2 \times 0.3864 = 0.7728 F1?Score=2×0.8333+0.71430.8333×0.7143?2×1.54760.5972?2×0.3864=0.7728

因此,基于這個示例,模型的F1分數大約為0.7728。F1分數越接近1,表明模型在精確率和召回率方面的綜合性能越好。

  • 由于本人水平有限,難免出現錯漏,敬請批評改正。
  • 更多精彩內容,可點擊進入人工智能知識點專欄、Python日常小操作專欄、OpenCV-Python小應用專欄、YOLO系列專欄、自然語言處理專欄或我的個人主頁查看
  • 基于DETR的人臉偽裝檢測
  • YOLOv7訓練自己的數據集(口罩檢測)
  • YOLOv8訓練自己的數據集(足球檢測)
  • YOLOv5:TensorRT加速YOLOv5模型推理
  • YOLOv5:IoU、GIoU、DIoU、CIoU、EIoU
  • 玩轉Jetson Nano(五):TensorRT加速YOLOv5目標檢測
  • YOLOv5:添加SE、CBAM、CoordAtt、ECA注意力機制
  • YOLOv5:yolov5s.yaml配置文件解讀、增加小目標檢測層
  • Python將COCO格式實例分割數據集轉換為YOLO格式實例分割數據集
  • YOLOv5:使用7.0版本訓練自己的實例分割模型(車輛、行人、路標、車道線等實例分割)
  • 使用Kaggle GPU資源免費體驗Stable Diffusion開源項目

本文來自互聯網用戶投稿,該文觀點僅代表作者本人,不代表本站立場。本站僅提供信息存儲空間服務,不擁有所有權,不承擔相關法律責任。
如若轉載,請注明出處:http://www.pswp.cn/diannao/45064.shtml
繁體地址,請注明出處:http://hk.pswp.cn/diannao/45064.shtml
英文地址,請注明出處:http://en.pswp.cn/diannao/45064.shtml

如若內容造成侵權/違法違規/事實不符,請聯系多彩編程網進行投訴反饋email:809451989@qq.com,一經查實,立即刪除!

相關文章

Cadence23打開與關閉飛線,修改位號絲印大小

打開與關閉所有飛線: 顯示部分飛線: 單獨顯示網絡飛線尤為好用,點擊上圖中的網絡,之后鼠標點擊器件中你想高亮的網絡即可單獨打開部分飛線。 這里的關閉部分網絡的飛線也很好用,可以臨時關閉討厭的GND飛線&#xff1a…

掌握Postman的API請求模板:一鍵生成,效率倍增

📘 掌握Postman的API請求模板:一鍵生成,效率倍增 Postman是API開發和測試的瑞士軍刀,而其請求模板功能更是提升工作效率的利器。API請求模板允許用戶定義一組可重用的請求配置,從而快速生成和發送API請求。本文將深入…

virturalBox+K8S部署jaeger-all-in-one

pod的yaml如下:這里使用的是主機host模式 apiVersion: apps/v1 kind: Deployment metadata:name: jaegerlabels:app: jaeger spec:replicas: 1selector:matchLabels:app: jaegertemplate:metadata:labels:app: jaegerspec:hostNetwork: truecontainers:- name: jae…

TF卡病毒是什么?如何防范和應對?

在存儲芯片及存儲卡領域,TF卡病毒是一個備受關注的話題。在本文中,拓優星辰將詳細解釋TF卡病毒的含義、來源以及如何防范和應對這一問題,幫助客戶更好地了解和處理TF卡病毒的風險。 1. TF卡病毒的含義 TF卡病毒是指針對TF存儲卡(T…

05:定時器中斷

中斷 1、定時器T0中斷2、案例:通過定時器T0中斷來實現燈間隔1s亮滅 1、當中央處理機CPU正在處理某件事的時候外界發生了緊急事件請求,要求CPU暫停當前的工作,轉而去處理這個緊急事件,處理完以后,再回到原來被中斷的地方…

安裝lap和cython_bbox失敗了很多次!!!終于被我發現了!

先說 lap 試了很多種方式,pip install lap / conda install -c conda-forge lap … 全失敗了后面發現 lap 不支持 python > 3.9 的版本使用 pip install lapx 成功! cython_bbox 更難了 一直提示缺少MicroSoft C 14.0 … 大家有需要自行下載&#x…

[PaddlePaddle飛槳] PaddleDetection-通用目標檢測-小模型部署

PaddleDetection的GitHub項目地址 推薦環境: PaddlePaddle > 2.3.2 OS 64位操作系統 Python 3(3.5.1/3.6/3.7/3.8/3.9/3.10),64位版本 pip/pip3(9.0.1),64位版本 CUDA > 10.2 cuDNN > 7.6pip下載指令: python -m pip i…

面向本科生的智能品牌傳播策略優化

面向本科生的智能品牌傳播策略優化 一、引言 在數字化時代,品牌傳播已不再是簡單的信息傳遞,而是需要借助智能技術實現精準、高效、創新的傳播策略。作為本科畢業生,選擇“面向本科生的智能品牌傳播策略優化實踐”作為研究課題,不僅有助于深入理解品牌傳播的理論知識,還…

【數據結構】一文了解七大排序算法

文章目錄 前言一.直接插入排序插入排序思想插入排序代碼實現插入排序總結 二.希爾排序希爾排序思想希爾排序代碼實現希爾排序總結 三.選擇排序選擇排序思想選擇排序代碼實現選擇排序總結 四.堆排序堆排序思想堆排序代碼實現堆排序總結 五、冒泡排序冒泡排序思想冒泡排序代碼實現…

Dify 與 Xinference 最佳組合 GPU 環境部署全流程

背景介紹 在前一篇文章 RAG 項目對比 之后,確定 Dify 目前最合適的 RAG 框架。本次就嘗試在本地 GPU 設備上部署 Dify 服務。 Dify 是將模型的加載獨立出去的,因此需要選擇合適的模型加載框架。調研一番之后選擇了 Xinference,理由如下&…

易我分區大師18.8.0更新:兩大功能改進

近日,易我分區大師18.8.0更新上線。此次更新重點改進了系統克隆功能,支持從第二塊系統盤(從盤)克隆系統;同時,軟件支持將分區的文件系統格式從FAT轉換成exFAT。 01、系統克隆 系統克隆功能旨在幫助用戶在…

pinia學習

conuter.ts <template><div><!-- 顯示當前的計數 --><p>Count: {{ count }}</<!-- 顯示計算的雙倍計數 --><p>Double Count: {{ doubleCount }}</p><!-- 點擊按鈕以增加計數 --><button click"increment">…

基于紅黑樹對map和set的封裝

前言 前面我們已經對紅黑樹做了介紹和實現&#xff0c;本期我們來對紅黑樹進一步改造&#xff0c;然后基于改造后的紅黑樹封裝出map和set&#xff01; 本期內容介紹 ? 紅黑樹的改造 ? 紅黑樹的迭代器實現 ? map的封裝 ? set的封裝 ? 全部源碼 ● 紅黑樹的改造 我們目前…

未來互聯網的新篇章:深度解析Facebook的技術與戰略

隨著科技的飛速發展和社會的不斷變遷&#xff0c;互聯網作為全球信息交流的重要平臺&#xff0c;正經歷著前所未有的變革和演進。作為全球最大的社交媒體平臺之一&#xff0c;Facebook不僅是人們溝通、分享和互動的重要場所&#xff0c;更是科技創新和數字化進程的推動者。本文…

音視頻開發—FFmpeg 從MP4文件中抽取視頻H264數據

文章目錄 MP4文件存放H264數據方式MP4 文件結構概述H.264 數據在 MP4 中的存儲1. ftyp 盒子2. moov 盒子3. mdat 盒子 H.264 數據在 stsd 盒子中的存儲&#xff08;AVC1&#xff09;AVC1與Annex-B 格式&#xff08;裸 H.264 流&#xff09;的區別 從MP4文件中提取H264裸流步驟&…

java使用easypoi模版導出word詳細步驟

文章目錄 第一步、引入pom依賴第二步、新建導出工具類WordUtil第三步、創建模版word4.編寫接口代碼5.導出結果示例 第一步、引入pom依賴 <dependency><groupId>cn.afterturn</groupId><artifactId>easypoi-spring-boot-starter</artifactId><…

怎么壓縮視頻?推薦7款必備視頻壓縮軟件免費版(強烈建議收藏)

如今&#xff0c;視頻內容日益豐富&#xff0c;并占據了許多人的日常娛樂和工作生活。然而&#xff0c;隨著高清和超高清視頻的普及&#xff0c;視頻文件的體積也越來越大&#xff0c;給存儲和傳輸帶來了挑戰。因此&#xff0c;學會如何壓縮視頻文件成為了許多人的需求之一。本…

小米官網的數據是怎么優化的?

小米PC端官網首頁的“全部商品分類”功能是用戶瀏覽和選擇商品的重要入口。為了優化這一功能的數據展示和用戶體驗&#xff0c;可以采取以下幾個步驟&#xff1a; 數據加載優化&#xff1a; 懶加載&#xff08;Lazy Loading&#xff09;&#xff1a;當鼠標劃過“全部商品分類”…

實現前端登錄注冊功能(有源碼)

引言 用戶登錄和注冊是任何現代Web應用程序的基本功能。在前端開發中&#xff0c;實現一個安全且用戶友好的登錄注冊系統至關重要。本文將介紹如何使用HTML、CSS和JavaScript&#xff08;包括Vue.js&#xff09;來實現前端的登錄和注冊功能。 1. 項目結構 首先&#xff0c;我們…

軟設之訪問者模式

設計模式中訪問者模式的意圖是&#xff1a; 表示一個作用于某對象結構中的各元素的操作&#xff0c;使得在不改變各元素的類的前提下定義作用于這些元素的新操作。 舉個例子&#xff0c;比如說有個游客想去幾個景點&#xff0c;去每個景點都想按統一的流程。但是每個景點都有…