評估指標：精確率（Precision）、召回率（Recall）、F1分數（F1 Score）

前言
相關介紹
- - 1. 準確率（Accuracy）
  - 2. 精確率（Precision）
  - 3. 召回率（Recall）
  - 4. F1分數 (F1 Score)
  - 5. ROC曲線和AUC（Area Under the Curve）
  - 6. PR曲線（Precision-Recall Curve）
F1分數 (F1 Score)
- - F1分數的計算
  - F1分數的優點
  - F1分數的缺點
- 計算實例
- - 示例數據
  - 計算精確率（Precision）
  - 計算召回率（Recall）
  - 計算F1分數 (F1 Score)

在這里插入圖片描述

前言

由于本人水平有限，難免出現錯漏，敬請批評改正。
更多精彩內容，可點擊進入人工智能知識點專欄、Python日常小操作專欄、OpenCV-Python小應用專欄、YOLO系列專欄、自然語言處理專欄或我的個人主頁查看
基于DETR的人臉偽裝檢測
YOLOv7訓練自己的數據集（口罩檢測）
YOLOv8訓練自己的數據集（足球檢測）
YOLOv5：TensorRT加速YOLOv5模型推理
YOLOv5：IoU、GIoU、DIoU、CIoU、EIoU
玩轉Jetson Nano（五）：TensorRT加速YOLOv5目標檢測
YOLOv5：添加SE、CBAM、CoordAtt、ECA注意力機制
YOLOv5：yolov5s.yaml配置文件解讀、增加小目標檢測層
Python將COCO格式實例分割數據集轉換為YOLO格式實例分割數據集
YOLOv5：使用7.0版本訓練自己的實例分割模型（車輛、行人、路標、車道線等實例分割）
使用Kaggle GPU資源免費體驗Stable Diffusion開源項目

F1分數 (F1 Score)

F1分數（F1 Score）是一種廣泛應用于二分類和多分類問題中的性能評價指標，特別是對于類別不平衡的數據集而言，它能提供比單一的精確率或召回率更為全面的性能評估。下面是F1分數的詳細解析，包括其計算方法、優勢和局限性：

F1分數的計算

F1分數是精確率（Precision）和召回率（Recall）的調和平均數，旨在綜合這兩個指標，以反映模型在分類任務中的平衡表現。其計算公式為：

$\times \frac{\text{Precision} \times \text{Recall}}{\text{Precision} + \text{Recall}}$

精確率（Precision） 表示模型預測為正類別的樣本中，真正為正類別的比例，計算公式為 (\frac{\text{真正例（TP）}}{\text{真正例（TP）} + \text{假正例（FP）}})。
召回率（Recall） 表示所有實際為正類別的樣本中，被模型正確識別的比例，計算公式為 (\frac{\text{真正例（TP）}}{\text{真正例（TP）} + \text{假陰例（FN）}})。

F1分數的優點

平衡精確率和召回率：F1分數同時考慮了模型預測的精確性和完整性，對于需要兩者都達到較高水平的應用非常適用。
類別不平衡數據集：在正負樣本數量差距較大的情況下，F1分數能夠給出更為公平的性能評估，相比單獨使用精確率或召回率更能反映出模型的整體效能。
單一指標：作為一個單一的數值指標，F1分數簡化了模型性能的比較，便于理解和溝通。

F1分數的缺點

權重固定：F1分數對精確率和召回率給予相同的權重（即1:1），但在某些應用場景下，根據具體需求，可能需要對二者賦予不同的重要性（例如，某些情況下召回率可能比精確率更重要）。
忽視真負例（TN）：F1分數完全依賴于正例的預測情況，忽略了模型正確預測為負例的能力，因此在某些場景下可能不足以全面評估模型性能，尤其是當錯誤地分類負例成本也很高時。
極端情況：當精確率和召回率中有一個為0時，F1分數也會變為0，即使另一個指標非常高，這可能在某些情況下顯得過于苛刻。

綜上所述，F1分數是衡量分類模型性能的有效工具，尤其適合評估那些需要均衡考慮精確率和召回率的應用場景。然而，在選擇評估指標時，應考慮具體任務的需求，有時可能需要結合其他指標如AUC-ROC、Precision-Recall曲線等進行綜合分析。

計算實例

F1分數是一種統計度量，用于評估二分類（或多標簽分類中的每一個類別）模型的性能，它是精確率（Precision）和召回率（Recall）的調和平均值。下面通過一個簡單的例子來說明如何計算F1分數：

示例數據

假設我們有一個二分類問題，模型預測的結果和實際標簽如下：

真實正例（TP，True Positives）: 25個
假正例（FP，False Positives）: 5個
真實負例（TN，True Negatives）: 70個
假負例（FN，False Negatives）: 10個

計算精確率（Precision）

精確率是指模型預測為正例中實際確實是正例的比例。
$\text{Precision} = \frac{\text{TP}}{\text{TP} + \text{FP}} = \frac{25}{25 + 5} = \frac{25}{30} = 0.8333$

計算召回率（Recall）

召回率是指實際正例中被模型正確識別出來的比例。
$\text{Recall} = \frac{\text{TP}}{\text{TP} + \text{FN}} = \frac{25}{25 + 10} = \frac{25}{35} = 0.7143$

計算F1分數 (F1 Score)

F1分數結合了精確率和召回率，公式如下：
$\text{F1 Score} = 2 \times \frac{\text{Precision} \times \text{Recall}}{\text{Precision} + \text{Recall}}$
將上面計算的精確率和召回率代入公式中：
$\text{F1 Score} = 2 \times \frac{0.8333 \times 0.7143}{0.8333 + 0.7143} \approx 2 \times \frac{0.5972}{1.5476} \approx 2 \times 0.3864 = 0.7728$

因此，基于這個示例，模型的F1分數大約為0.7728。F1分數越接近1，表明模型在精確率和召回率方面的綜合性能越好。

由于本人水平有限，難免出現錯漏，敬請批評改正。
更多精彩內容，可點擊進入人工智能知識點專欄、Python日常小操作專欄、OpenCV-Python小應用專欄、YOLO系列專欄、自然語言處理專欄或我的個人主頁查看
基于DETR的人臉偽裝檢測
YOLOv7訓練自己的數據集（口罩檢測）
YOLOv8訓練自己的數據集（足球檢測）
YOLOv5：TensorRT加速YOLOv5模型推理
YOLOv5：IoU、GIoU、DIoU、CIoU、EIoU
玩轉Jetson Nano（五）：TensorRT加速YOLOv5目標檢測
YOLOv5：添加SE、CBAM、CoordAtt、ECA注意力機制
YOLOv5：yolov5s.yaml配置文件解讀、增加小目標檢測層
Python將COCO格式實例分割數據集轉換為YOLO格式實例分割數據集
YOLOv5：使用7.0版本訓練自己的實例分割模型（車輛、行人、路標、車道線等實例分割）
使用Kaggle GPU資源免費體驗Stable Diffusion開源項目