micro avg、macro avg 和 weighted avg 的區別

問題描述:

在多分類任務的評估報告中,經常看到 micro avgmacro avgweighted avg 三種平均指標,請解釋它們的區別以及各自的適用場景。


🎯 參考答案:

這三種平均指標是用來評估多分類模型性能的不同方式,它們在計算方法和應用場景上有顯著區別:


1. micro avg(微觀平均)

計算方式

  • 將所有類別的 TP(真正例)、FP(假正例)、FN(假負例) 匯總后統一計算指標。

  • 公式:
    Precisionmicro=∑TP∑TP+∑FP,Recallmicro=∑TP∑TP+∑FN \text{Precision}_{micro} = \frac{\sum TP}{\sum TP + \sum FP}, \quad \text{Recall}_{micro} = \frac{\sum TP}{\sum TP + \sum FN} Precisionmicro?=TP+FPTP?,Recallmicro?=TP+FNTP?

特點

  • 不區分類別,將所有預測結果視為一個整體;
  • 等價于 accuracy(準確率);
  • 對樣本量大的類別更敏感;
  • 適用于類別不平衡的情況。

適用場景

  • 關注整體預測準確性;
  • 各類別樣本分布嚴重不均時。

2. macro avg(宏觀平均)

計算方式

  • 分別計算每個類別的 Precision、Recall、F1,然后取平均值。

  • 公式:
    Precisionmacro=1N∑i=1NPrecisioni,Recallmacro=1N∑i=1NRecalli \text{Precision}_{macro} = \frac{1}{N} \sum_{i=1}^{N} \text{Precision}_i, \quad \text{Recall}_{macro} = \frac{1}{N} \sum_{i=1}^{N} \text{Recall}_i Precisionmacro?=N1?i=1N?Precisioni?,Recallmacro?=N1?i=1N?Recalli?

特點

  • 每個類別權重相等;
  • 不考慮樣本數量差異;
  • 可能被少數類別"拖累";
  • 適用于各類別同等重要的場景。

適用場景

  • 各類別同等重要;
  • 需要均衡評估每個類別的表現。

3. weighted avg(加權平均)

計算方式

  • 按每個類別的 support(樣本數)加權平均各項指標。

  • 公式:
    Precisionweighted=∑(Precisioni×Supporti)∑Supporti \text{Precision}_{weighted} = \frac{\sum (\text{Precision}_i \times \text{Support}_i)}{\sum \text{Support}_i} Precisionweighted?=Supporti?(Precisioni?×Supporti?)?

特點

  • 考慮了類別樣本分布;
  • 更貼近真實業務評估;
  • 大類別對結果影響更大。

適用場景

  • 真實數據分布下的性能評估;
  • 更具業務參考價值。

📊 實際案例分析:

假設某模型在 15 個類別上的表現如下(部分):

類別PrecisionRecallF1-scoreSupport
sports0.840.810.8226
edu0.340.750.4728
stock0.000.000.001

最終評估結果為:

指標PrecisionRecallF1-score
micro avg0.49900.49400.4965
macro avg0.51320.47950.4714
weighted avg0.54750.49400.4914

分析

  • micro avg 接近整體準確率;
  • macro avgstock 類拖累;
  • weighted avg 反映了多數類(如 sports)的良好表現。

? 總結對比表:

指標是否考慮類別權重適用場景特點
micro avg?整體準確率評估受大類影響大
macro avg?各類同等重要可能被小類拖累
weighted avg?真實業務評估更貼近實際表現

💡 面試加分點:

  • 能結合具體數據解釋三者差異;
  • 能指出在類別不平衡時應優先關注 weighted avgmicro avg
  • 能提出優化建議(如針對低分小類增加數據)。

本文來自互聯網用戶投稿,該文觀點僅代表作者本人,不代表本站立場。本站僅提供信息存儲空間服務,不擁有所有權,不承擔相關法律責任。
如若轉載,請注明出處:http://www.pswp.cn/news/915731.shtml
繁體地址,請注明出處:http://hk.pswp.cn/news/915731.shtml
英文地址,請注明出處:http://en.pswp.cn/news/915731.shtml

如若內容造成侵權/違法違規/事實不符,請聯系多彩編程網進行投訴反饋email:809451989@qq.com,一經查實,立即刪除!

相關文章

Kafka灰度方案

一、kafka灰度方案架構設計方案:1、外部生產-內部消費場景:(外部生產-內部消費)解決方案:先通過kdis分流服務---消費外部生產的消息,然后根據管理后臺-灰度配置mcs-mimp-core應用默認的環境版本&#xff0c…

深入詳解K近鄰算法(KNN)在腦部疾病診斷中的應用與實現

?? 博主簡介:CSDN博客專家、CSDN平臺優質創作者,高級開發工程師,數學專業,10年以上C/C++, C#,Java等多種編程語言開發經驗,擁有高級工程師證書;擅長C/C++、C#等開發語言,熟悉Java常用開發技術,能熟練應用常用數據庫SQL server,Oracle,mysql,postgresql等進行開發應用…

黑馬點評練習題-給店鋪類型查詢業務添加緩存(String和List實現)

目錄 一、前言 二、需求 三、String實現 四、List實現 一、前言 這是黑馬點評實戰篇-商戶查詢緩存-0.3緩存練習題分析,練習給店鋪類型查詢業務添加緩存。這里我自己是通過String實現的,當然在網上查詢也能夠找到其他的實現方式。String實現我會展示自…

深度學習 pytorch圖像分類(詳細版)

目錄 一、項目簡介 二、模型訓練驗證保存 三、模型測試保存csv文件 四、單張圖片預測 五、模型評估 六、ONNX導出 七、ONNX推理 八、網絡結構與數據增強可視化 上篇我介紹了具體步驟,今天就以我實際開發的一個具體項目來講: 一、項目簡介 苯人的…

《AR眼鏡上聲學的應用與挑戰》

《2025GAS聲學大講堂—音頻產業創新技術公益講座》智能眼鏡專題講座第3講將于7月24日周四19點開講,本次邀請了 珠海莫界科技有限公司 高級算法工程師 胡立天 演講,講座主題:《AR眼鏡上聲學的應用與挑戰》(點擊觀看直播&#xff09…

編譯支持cuda硬件加速的ffmpeg

本來以為很簡單,因為印象中自己在windows機器上使用過。 目前的實在一個docker環境下的ubuntu系統里。 官方操作文檔 按照官方操作文檔Using FFmpeg with NVIDIA GPU Hardware Acceleration - NVIDIA Docs的描述,步驟很簡單: 1、安裝nv-c…

在資源受限單片機中使用printf等可變參函數時的陷阱(2025年7月22日)

今天分享一個我最近在項目調試中遇到的“大坑”,這個坑來自一個我們既熟悉又依賴的朋友——printf函數。故事的主角,是一顆資源極其有限的STM32F030單片機,它只有區區4KB的RAM。 一切始于便利 項目初期,為了能方便地監控程序運行狀…

大數據之Hive:Hive中week相關的幾個函數

目錄1.dayofweek函數2.weekday函數3.weekofyear函數1.dayofweek函數 功能:統計某天為星期幾 dayofweek(date) - Returns the day of the week for date/timestamp (1 Sunday, 2 Monday, ..., 7 Saturday).dayofweek返回值為:1-7,1 星期…

基于深度學習Transform的steam游戲特征分析與可視化【詞云-情感詞典分析-主題分析-詞頻分析-關聯分析】

文章目錄有需要本項目的代碼或文檔以及全部資源,或者部署調試可以私信博主一、項目背景與研究意義二、研究目標三、研究方法與實施流程第一階段:數據采集與預處理第二階段:多維度數據分析第三階段:綜合分析與策略建議輸出四、預期…

Qwen3-8B 與 ChatGPT-4o Mini 的 TTFT 性能對比與底層原理詳解

一、模型概述與上下文支持能力 1.1 Qwen3-8B 的技術特點 Qwen3-8B 是通義實驗室推出的 80 億參數大語言模型,支持 32,768 token 的上下文長度 。其核心優化點包括: FP8 量化技術:通過將權重從 32-bit 壓縮至 8-bit,顯著降低顯存…

recvmsg函數的用法

recvmsg 是 Linux 網絡編程中用于接收消息的高級系統調用&#xff0c;支持復雜數據結構和輔助數據的接收&#xff0c;適用于 TCP/UDP/UNIX 域套接字等場景?。以下是其核心用法詳解&#xff1a;?1. 函數原型與參數?#include <sys/socket.h> ssize_t recvmsg(int sockfd…

24GSPS高速DA FMC子卡

單通道 16bit 12GSPS/ 12bit 15.5GSPS/ 8bit 24GSPS雙通道 16bit 6.2GSPS/ 12bit 7.75GSPS/ 8bit 12GS/sDAC FMC子卡基于TI公司的高速DAC數模轉換器DAC39RF12ACK和時鐘芯片LMX2594而設計的標準單槽位的FMC子卡。支持單通道模式或雙通道模式&#xff0c;單通道模式下提供16bit 1…

LabVIEW動態調用VI

該組LabVIEW程序演示4 種動態調用 VI 的實現方案&#xff0c;圍繞 HTTP GET 任務&#xff08;通過 URL 抓取數據&#xff09;&#xff0c;利用不同調用邏輯&#xff0c;適配多場景下的并行 / 串行執行需求&#xff0c;助力工程師靈活構建異步、并行化程序。各方案說明&#xff…

安裝單機版本Redis

部署操作:步驟一: 安裝Redis服務# 安裝redis操作 dnf install redis -y步驟二&#xff1a; 修改Redis相關配置vim /etc/redis/redis.conf # 83行附件&#xff0c; 修改為 * -::* 任意的服務都可以連接redis服務 bind * -::*#908行附近&#xff1a; 打開requirepass&#xff…

Java(Set接口和HashSet的分析)

Set 接口基本介紹:注意:取出的順序的順序雖然不是添加的順序&#xff0c;但是他的固定set接口的常用方法:和 List 接口一樣, Set 接口也是 Collection 的子接口&#xff0c;因此&#xff0c;常用方法和 Collection 接口一樣.set的遍歷方式:HashSet的全面說明:HashSet的暢通方法…

vscode不識別vsix結尾的插件怎么解決?

當VS Code無法識別.vsix文件時&#xff0c;可能是由于文件損壞、版本不兼容或安裝流程不正確導致的。以下是解決此問題的詳細步驟&#xff1a; 1. 確認文件完整性 重新下載.vsix文件&#xff1a;刪除現有文件&#xff0c;從可靠來源重新下載&#xff0c;確保下載過程未中斷。檢…

面試題:sql題一

SELECTp.product_id, -- 產品IDp.product_name, -- 產品名稱SUM(s.sale_qty * s.unit_price) AS sum_price, -- 年銷售總價YEAR(s.sale_date) AS year_date -- 銷售年份 FROM products p JOIN sales s ON p.product_id s.produ…

【React-Three-Fiber實踐】放棄Shader!用頂點顏色實現高性能3D可視化

在現代前端開發中&#xff0c;3D可視化已經成為提升用戶體驗的重要手段。然而&#xff0c;許多開發者在實現復雜視覺效果時&#xff0c;往往會首先想到使用Shader&#xff08;著色器&#xff09;。雖然Shader功能強大&#xff0c;但學習曲線陡峭&#xff0c;實現復雜度高。本文…

MSTP技術

一、STP/RSTP 的局限性STP&#xff08;生成樹協議&#xff09;和 RSTP&#xff08;快速生成樹協議&#xff09;存在一些明顯的局限&#xff0c;主要包括&#xff1a;所有 VLAN 共享一顆生成樹&#xff0c;這導致無法實現不同 VLAN 在多條 Trunk 鏈路上的負載分擔。例如&#xf…

[IMX][UBoot] 16.Linux 內核移植

目錄 1.修改 Makefile 2.新增配置文件 3.新增設備樹文件 4.新建編譯腳本 5.修改 CPU 頻率 6.EMMC 適配 7.網絡驅動適配 1.修改 Makefile 修改頂層 Makefile 中的架構信息 ARCH 和交叉編譯器 CROSS_COMPILE&#xff0c;修改后不需要在執行 make 時手動指定這兩個變量的值…