模型評價指標筆記:混淆矩陣+F1+PR曲線+mAP

評價指標

二分類評價指標

混淆矩陣

image.png
TP: 正確預測為了正樣本,原來也是正樣本
FN: 錯誤的預測為負樣本,原來是正樣本 (漏報,沒有找到正確匹配的數目)
FP: 錯誤的預測為正樣本,原來是負樣本 (誤報,沒有的匹配不正確)
TN: 正確的預測為負樣本,原來是負樣本

正確率

image.png

精確率和召回率

精確率/查準率

TP: 真實P類 預測P類, FP: 真實N類 預測P類, TP + FP: 模型預測為P類的數量
image.png

召回率/查全率

FN 真實為P類,預測為N類; TP + FN: 真實P類的數量 (不考慮預測的結果)
image.png

例如

image.png

F1-Score

即F值為正確率和召回率的調和平均值
image.png

ROC

精確率、召回率 和 F1-score 都是單一的數值指標,如果想觀察分類算法在不同的參數下的表現,此時可以使用一條曲線,即 ROC。ROC 曲線可以用評價一個分類器在不同閾值下的表現。
橫坐標是 FPR(假正例率),FPR= FP / (FP + TN),表示分類器預測的正類中實際負實例占所有負例的比例,FPR越大,預測正類中的實際負類越多, 越小越好。(假警報率)
縱坐標是TPR(真正例率),公式同召回率的,TPR= TP / (TP + FN),表示分類器預測的正類中實際正實例占所有正例的比例, 值越大越好。(命中率)
ROC曲線的橫軸為假正例率,縱軸為真正例率,范圍都是[0,1],現在我們開始畫圖——根據從大到小遍歷預測值,把當前的預測值當做閾值,計算FPR和TPR
結論: ROC下面的面積越大,分類器越好

P-R曲線

為了找到最合適的閾值,需要遍歷 0 到 1 之間所有的閾值,每個閾值都對應著一對查準率和查全率,從而得到 PR 曲線
結論:越靠近正方形的對角越好

AP(average precision)

平均精確度(AP)通常是通過積分(或者近似的方法)的方式計算PR曲線下的面積來得到的
使用積分(或者近似的方法)來計算從召回率0到1的整個曲線下的面積。
通常來說一個越好的分類器,AP值越高

多分類評價指標

混淆矩陣

image.png
混淆矩陣可以提供以下信息:
正確分類的數量:主對角線上的元素顯示了每個類別被正確預測的次數
錯誤分類的數量:非對角線上的元素顯示了每個類別被錯誤預測為其他類別的次數

Accuracy 之 top1和top5

Top-1 Accuracy:是指模型預測的最高概率分數對應的類別與真實類別相同的情況下,認為是正確預測
Top-5 Accuracy:它允許模型在預測的概率最高的五個類別中只要有一個是正確的,就認為預測是成功的

mAP-全類平均精確率

image.png
其中 n 是類別的總數,AP(i) 是第 i 個類別的 Average Precision 值

AP 與 mAP

AP 衡量的是訓練好的模型在每個類別上的好壞
mAP 衡量的是模型在所有類別上的好壞,mAP 就是取所有 AP 的平均值
mAP 常作為目標檢測算法的評價指標,對于每張圖片檢測模型會輸出多個預測框(遠超真實框的個數),用 IoU (Intersection Over Union,交并比)來標記預測框是否預測準確。
標記完成后,隨著預測框的增多,查全率 R 總會上升,在不同查全率 R 水平下對準確率 P 做平均,即得到AP,最后再對所有類別按其所占比例做平均,即得到 mAP 指標

目標檢測

目標檢測中的性能指標主要包括:精確率(precision)、召回率(recall)、平均精度(average precision,AP)、平均精度均值(mean average precision,mAP)。
目標檢測算法中主要使用的性能指標是 mAP、 檢測速度(幀/s)–> FPS (每秒傳輸幀數(Frames Per Second))

性能指標

機器性能

FLOPS

FLOPS(Floating Point Operations per Second)指每秒浮點運算次數,可以理解為評估計算速度的單位
image.png

算法性能

FLOPs

FLOPs:(Floating Point Operations) s小寫,指浮點運算數,理解為計算量。可以用來衡量算法/模型的復雜度。(模型) 在論文中常用GFLOPs(1 GFLOPs = 10^9 FLOPs)
一般計算FLOPs來衡量模型的復雜度:

  • 較大的FLOPs值通常表示任務或算法具有更高的計算需求,需要更多的計算資源來完成
  • FLOPs越小時,表示模型所需計算量越小,運行起來時速度更快
安裝庫

pip install thop

查看FLOPs性能
import torch
from thop import profile
from torchvision.models import resnet50
model = resnet50()
input1 = torch.randn(1, 3, 224, 224)
flops, params = profile(model, inputs=(input1, ))
print('FLOPs = ' + str(flops / 1000 ** 3) + 'G')

第三方工具計算評價指標

參考:Cartucho / mAP

本文來自互聯網用戶投稿,該文觀點僅代表作者本人,不代表本站立場。本站僅提供信息存儲空間服務,不擁有所有權,不承擔相關法律責任。
如若轉載,請注明出處:http://www.pswp.cn/web/14947.shtml
繁體地址,請注明出處:http://hk.pswp.cn/web/14947.shtml
英文地址,請注明出處:http://en.pswp.cn/web/14947.shtml

如若內容造成侵權/違法違規/事實不符,請聯系多彩編程網進行投訴反饋email:809451989@qq.com,一經查實,立即刪除!

相關文章

CIM模型

CIM 是 Esri 制圖信息模型。 它是一個地圖內容規范,用于記錄在保存、讀取、引用或打開時如何永久保留描述不同項目組件的信息。 該規范以 JSON 表示,適用于 ArcGIS 應用程序和 API 中的地圖、場景、布局、圖層、符號和樣式。 CIM 不僅限于制圖設置。 要了解屬性的組織方式以及…

【Tools】SpringBoot工程中,對于時間屬性從后端返回到前端的格式問題

Catalog 時間屬性格式問題一、需求二、怎么使用 時間屬性格式問題 一、需求 對于表中時間字段,后端創建對應的實體類的時間屬性需要設定格式(默認的格式不方便閱讀),再返回給前端。 二、怎么使用 導入jackson相關的坐標&#x…

Vue.js - Vue 的安裝 以及 常用的 Vue 指令 【0基礎向 Vue 基礎學習】

文章目錄 Vue 快速上手1、Vue.js 官網 & Vue.js 的獲取2、創建 Vue 實例,初始化渲染3、插值表達式 安裝 Vue 開發者工具:裝插件調試 Vue 應用Vue 指令1、v-show 指令2、v-if3、v-else & v-else-if4、v-onv-on 調用傳參 5、v-bindv-bind 對于樣式…

【算法】前綴和算法——和為k的子數組之和

題解:和為k的子數組之和(前綴和算法) 目錄 1.題目2.題解思路2.1前綴和 哈希表,算法步驟:2.2細節如下:2.3參考代碼: 3.總結及思考 1.題目 題目鏈接:LINK 2.題解思路 暴力求解自然不用多說,時…

【SQL】外連接 LEFT JOIN

目錄 一.內連接與外連接 1.內連接(inner join) 2.外連接(outer join) 二.兩表連接 1.我們先來試試看內連接: 2.我們再來試試外連接 三.單表外連接 四.總結 一.內連接與外連接 先得介紹內連接和外連接兩個概念&…

第199題|關于函數的周期性問題|函數強化訓練(六)|武忠祥老師每日一題 5月24日

解題思路:解這道題我們要用到下面這個結論 f(x)連續,以T為周期時,原函數以T為周期的充分必要條件是: (A) sin x顯然是以π為周期的,我們可以看到并不等于0,根據結論,A的原函數顯然不是周期函數。 (B) 的…

memmove使?和模擬實現

一:memmove的使? 這是memmove在庫里的定義,具體可在cplusplus.com查看 void * memmove ( void * destination, const void * source, size_t num ) ? 和memcpy的差別就是memmove函數處理的源內存塊和?標內存塊是可以重疊的。 ? 如果源空間和?標…

你以為的私域是真正的私域嘛??你的私域流量真的屬于你嘛?

大家好 我是一個軟件開發公司的產品經理 專注私域電商行業7年有余 您的私域流量是真正的屬于你自己嘛? 私域的定義 私域的界定:一個互聯網私有數據(資產)積蓄的載體。這個載體的數據權益私有,且具備用戶規則制定權…

Mysql 備份恢復 mysqldump與xtrabackup備份

1.1 備份的原因 備份是數據安全的最后一道防線,對于任何數據丟失的場景,備份雖然不一定能恢復百分之百的數據 (取決于備份周期),但至少能將損失降到最低。衡量備份恢復有兩個重要的指標:恢復點目標(RPO) 和恢復時間目標(RTO)&…

數據庫常用命令(1)

DML 1.添加數據(insert into) insert into 表名 values (值1,值2....); 表示成功運行: 2.修改數據(update) update 表名 set 字段名1值1,字段名2值2.....【where條件】 3.刪除數據&#xff0…

元年科技數據智能研發部負責人張亞東受邀為第十三屆中國PMO大會演講嘉賓

全國PMO專業人士年度盛會 北京元年科技股份有限公司數據智能研發部負責人張亞東先生受邀為PMO評論主辦的2024第十三屆中國PMO大會演講嘉賓,演講議題為“大模型時代,AI創新型工具提升項目管理效率”。大會將于6月29-30日在北京舉辦,敬請關注&a…

jmeter之HTTP請求和查看結果樹

一、HTTP請求作用: 可以發送post或get請求等請求可以向服務器發送參數或消息體數據可以進行文件上傳 HTTP請求:是線程組內的取樣器最常用的的一個原件 二、查看界面 添加一個HTTP請求:選擇線程組–添加–取樣器–HTTP請求 默認界面 名稱和…

ThreadLocal為什么會導致內存泄漏?

問題引出: ThreadLocal是為了解決什么問題而產生的? ThreadLocal發生內存泄漏的根本原因是什么? 如何避免內存泄漏的發生?定義 為了解決多個線程同時操作程序中的同一個變量而導致的數據不一致性的問題。 ??假設現在有兩個線程A…

如何獲取一個城市或者一個區域的玫瑰風向圖?

玫瑰風向圖是一種直觀展示風向和風速的圖形工具,它在氣象學、城市規劃、農業等領域都有廣泛的應用。那么,如何獲取某個城市或某個區域的玫瑰風向圖呢? 首先,我們可以借助互聯網資源獲取玫瑰風向圖。現代網絡技術發達,…

前端 防抖和節流

在前端開發中,防抖(Debounce)和節流(Throttle)是兩種常用的性能優化技術,尤其在處理頻繁觸發的事件時顯得尤為重要。無論是在用戶輸入、窗口調整大小,還是滾動事件中,這兩種技術都可…

3D 生成重建011-LucidDreamer 優化SDS過平滑結果的一種探索

3D 生成重建011-LucidDreamer 優化SDS過平滑結果的一種探索 文章目錄 0論文工作1論文方法2 效果 0論文工作 文本到3D生成的最新進展標志著生成模型的一個重要里程碑,為在各種現實場景中創建富有想象力的3D資產打開了新的可能性。雖然最近在文本到3D生成方面的進展…

自建公式,VBA在Excel中解一元一次方程

自建公式,VBA在Excel中解一元一次方程 文章目錄 前言一、運行效果圖二、操作思路三、代碼1.去除方程中未知數,將未知數轉為“*0”2.計算方程中常數3.計算方程中未知數的系數一,先將未知數替換成“*1”4.計算方程中未知數的系數二5.計算方程得數前言 小學必考內容:一元一次…

掌握Python基本語法的終極指南【基本語法部分】

一、基本語法部分 1.簡單數據類型 1.1字符串類型及操作 字符串訪問: 1.索引訪問 mystr"Hello world" #索引訪問 print(mystr[0]) #H print(mystr[-1]) #d print(mystr[-7]) #o print(mystr[6]) #w 2.切片訪問 [頭下標:尾下標] &#x…

齊護K210系列教程(三十二)_在線模型訓練

在線模型訓練 概念理解準備工作1 采集圖像1.1 圖像要求1.2 使用K210采集圖片 2 標注圖像3 打包數據集4 上傳數據4.1創建項目4.1.1圖像分類創建項目4.1.2圖像檢測創建項目 4.2上傳數據4.2.1分類檢測上傳數據4.2.2圖像檢測上傳數據 5 訓練模型6 部署模型以及測試7 測試效果7.1圖像…