模型評價指標

用訓練好的模型結果進行預測,需要采用一些評價指標來進行評價,才可以得到最優的模型

常用的指標:

1.分類任務

  • ConfusionMatrix? 混淆矩陣
  • Accuracy?? 準確率
  • Precision? 精確率
  • Recall?????? 召回率
  • F1 score?? H-mean值
  • ROC Curve? ROC曲線
  • PR Curve???? PR曲線
  • AUC

??????? ……

下面我將會具體介紹以上幾種常見的分類模型評價指標

?ConfusionMatrix 混淆矩陣

?混淆矩陣是評判模型結果的一種指標,屬于模型評估的一部分,常用于評判分類器模型的優劣

混淆矩陣(ConfusionMatrix)真實值(labels)
PositiveNegative
預測值(predict)PositiveTPFP
NegativeFNTN

其中,

  • TP (True? Positive) ? : 真實值和預測值均為Positive
  • FP (False Positive)?? : 真實值為Negative,預測值為Positive
  • FN (False Negative) : 真實值為Positive,預測值為Negative
  • TN (True? Negative)? : 真實值為Negative,預測值為Negative

一般地,期望TP和TN越高越好,FN和FP越低越好

?Accuracy? 準確率、Precision 精確率、Recall 召回率

(引用 up主 :霹靂吧啦Wz的個人空間-霹靂吧啦Wz個人主頁-嗶哩嗶哩視頻?? 的一張圖做說明)

準確率(正確率) :所有預測正確的樣本數 / 總樣本數?? (所有的預測正確(正類負類)的占總的比重)

?雖然準確率可以判斷總的正確率,但是在樣本不平衡 的情況下,并不能作為很好的指標來衡量結果。舉個簡單的例子,比如在一個總樣本中,正樣本占 90%,負樣本占 10%,樣本是嚴重不平衡的。對于這種情況,我們只需要將全部樣本預測為正樣本即可得到 90% 的高準確率,但實際上我們并沒有很用心的分類,只是隨便無腦一分而已。這就說明了:由于樣本不平衡的問題,導致了得到的高準確率結果含有很大的水分。即如果樣本不平衡,準確率就會失效

作者:easyAI產品經理的AI知識庫
鏈接:https://juejin.cn/post/6844903470756167688
來源:稀土掘金

精確率(查準率):預測正類為正類的樣本數 / 預測的正類樣本數??? (真正正確的占所有預測為正的比例)

精準率和準確率看上去有些類似,但是完全不同的兩個概念。精準率代表對正樣本結果中的預測準確程度,而準確率則代表整體的預測準確程度,既包括正樣本,也包括負樣本

作者:easyAI產品經理的AI知識庫
鏈接:https://juejin.cn/post/6844903470756167688
來源:稀土掘金

召回率(查全率):預測正類為正類的樣本數 / 真實值為正類的樣本數 (真正正確的占所有實際為正的比例)

召回率的應用場景: 比如拿網貸違約率為例,相對好用戶,我們更關心壞用戶,不能錯放過任何一個壞用戶。因為如果我們過多的將壞用戶當成好用戶,這樣后續可能發生的違約金額會遠超過好用戶償還的借貸利息金額,造成嚴重償失。召回率越高,代表實際壞用戶被預測出來的概率越高,它的含義類似:寧可錯殺一千,絕不放過一個

作者:easyAI產品經理的AI知識庫
鏈接:https://juejin.cn/post/6844903470756167688
來源:稀土掘金

注意

  • 精確率和召回率的區別

?????? 從數學角度來看,精確率和召回率就是分母不一樣

?????? 召回率的分母是原本的正類(TP+FN),

?????? 召回率讓模型預測到所有想被預測到的樣本(就算預測錯的多一些,也能接受)

下面引用 博主?清如許. 的一張圖片作總結

博客鏈接:https://blog.csdn.net/MacWx/article/details/129119016?utm_medium=distribute.pc_relevant.none-task-blog-2~default~baidujs_baidulandingword~default-1-129119016-blog-80964865.235^v39^pc_relevant_anti_t3_base&spm=1001.2101.3001.4242.2&utm_relevant_index=4

總得來說,精確率就是不錯報,召回率就是不漏報

F1-Score(F1值、調和平均數)

精確率(Precision)和召回率(Recall)之間是兩難全的關系,為了綜合兩者的表現,在兩者之間找一個平衡點,就出現了一個 F1分數?

F = 2 / (1/Precision + 1/Recall) = (2 * Precision * Recall)/ (Precision + Recall)

F1值越大越好,F1對 Precision 和 Recall 進行了加權

ROC曲線

PR曲線

雖然準確率可以判斷總的正確率,但是在樣本不平衡 的情況下,并不能作為很好的指標來衡量結果。舉個簡單的例子,比如在一個總樣本中,正樣本占 90%,負樣本占 10%,樣本是嚴重不平衡的。對于這種情況,我們只需要將全部樣本預測為正樣本即可得到 90% 的高準確率,但實際上我們并沒有很用心的分類,只是隨便無腦一分而已。這就說明了:由于樣本不平衡的問題,導致了得到的高準確率結果含有很大的水分。即如果樣本不平衡,準確率就會失效

作者:easyAI產品經理的AI知識庫
鏈接:https://juejin.cn/post/6844903470756167688
來源:稀土掘金

2.回歸任務

  • MSE???? 均方誤差??? Mean Square Error
  • RMSE? 均方根誤差 Root Mean Square Error
  • MAE??? 平均絕對誤差 Mean Absolute Error

????????? ……

本文來自互聯網用戶投稿,該文觀點僅代表作者本人,不代表本站立場。本站僅提供信息存儲空間服務,不擁有所有權,不承擔相關法律責任。
如若轉載,請注明出處:http://www.pswp.cn/news/210860.shtml
繁體地址,請注明出處:http://hk.pswp.cn/news/210860.shtml
英文地址,請注明出處:http://en.pswp.cn/news/210860.shtml

如若內容造成侵權/違法違規/事實不符,請聯系多彩編程網進行投訴反饋email:809451989@qq.com,一經查實,立即刪除!

相關文章

PostgreSQL pgvector:如何利用向量數據庫提升搜索效率和精度

LLMs模型實戰教程 文章來源:https://zhuanlan.zhihu.com/p/641516393 Kevin 一、介紹 隨著基礎模型的興起,向量數據庫的受歡迎程度也飆升。事實上,在大型語言模型環境中,向量數據庫也很有用。 在機器學習領域,我們經…

天池SQL訓練營(三)-復雜查詢方法-視圖、子查詢、函數等

-天池龍珠計劃SQL訓練營 SQL訓練營頁面地址:https://tianchi.aliyun.com/specials/promotion/aicampsql 3.1 視圖 我們先來看一個查詢語句(僅做示例,未提供相關數據) SELECT stu_name FROM view_students_info;單從表面上看起來…

C#反射加載程序集并使用

具體實現參考: C# 動態加載DLL通過反射調用參數、方法、窗體_c#反射加載dll并傳入參數-CSDN博客 C#進階學習--反射(Reflection) - 知乎 走進C#反射機制 - 知乎 1.使用過程 //創建數據集 Assembly outerAsm Assembly.LoadFile("D:/your.dll");//獲取…

rancher harvester deploy demo 【部署 harvester v1.2.1】

簡介 Harvester 是一個現代的、開放的、可互操作的、基于Kubernetes的超融合基礎設施(HCI)解決方案。它是一種開源替代方案,專為尋求云原生HCI解決方案的運營商而設計。Harvester運行在裸機服務器上,提供集成的虛擬化和分布式存儲功能。除了傳統的虛擬機…

pgsql存儲過程

由于部分企業數據庫從aws遷移到騰訊云,導致有一個定時任務(從詳情表匯總數據到統計表中)錯過了觸發,所以這部分企業的數據需要觸發重新刷一下,但是又有規定白天不允許上線,只能把定時任務的邏輯用存儲過程&…

SQL SELECT 語句

SELECT 語句用于從數據庫中選取數據。 SQL SELECT 語句 SELECT 語句用于從數據庫中選取數據。 結果被存儲在一個結果表中,稱為結果集。 SQL SELECT 語法 SELECT column1, column2, ... FROM table_name; 與 SELECT * FROM table_name; 參數說明: …

五花八門客戶問題(BUG) - 用好strace

strace簡介 strace是一個用于跟蹤系統調用和信號傳遞的Linux命令,它是一個集診斷、調試、統計于一體的工具。strace可以監控用戶空間進程和內核的交互,比如系統調用、信號傳遞、進程狀態變更等。它底層使用內核的ptrace特性來實現其功能。 strace最簡單的用法是執行一個指定…

二分查找|雙指針:LeetCode:2398.預算內的最多機器人數目

作者推薦 本文涉及的基礎知識點 二分查找算法合集 滑動窗口 單調隊列:計算最大值時,如果前面的數小,則必定被淘汰,前面的數早出隊。 題目 你有 n 個機器人,給你兩個下標從 0 開始的整數數組 chargeTimes 和 runnin…

Django回顧7

一.Django緩存 1.緩存介紹 在動態網站中,用戶所有的請求,服務器都會去數據庫中進行相應的增,刪,查,改,渲染模板,執行業務邏輯,最后生成用戶看到的頁面. 當一個網站的用戶訪問量很大的時候,每一次的的后臺操作,都會消耗很多的服務端資源,所以必須使用緩存來減輕后端服務器的壓力…

算法:最長公共前綴(橫向掃描和縱向掃描)

橫向掃描 時間復雜度 O(m * n),空間復雜度O(1) /*** param {string[]} strs* return {string}*/ var longestCommonPrefix function(strs) {// 先把第一個字符串拿出來let str strs[0]// 用 startsWith 檢查數組中每個字符串是否以當前字符串為前綴while(!strs.e…

聽GPT 講Rust源代碼--src/tools(11)

File: rust/src/tools/rust-analyzer/crates/hir/src/lib.rs 在Rust源代碼中,rust/src/tools/rust-analyzer/crates/hir/src/lib.rs文件的作用是定義了Rust語言的高級抽象層次(Higher-level IR,HIR)。它包含了Rust語言的各種結構和…

Python:核心知識點整理大全10-筆記

目錄 5.4 使用 if 語句處理列表 5.4.1 檢查特殊元素 toppings.py 5.4.2 確定列表不是空的 5.4.3 使用多個列表 5.5 設置 if 語句的格式 5.6 小結 第6章 字 典 6.1 一個簡單的字典 alien.py 6.2 使用字典 6.2.1 訪問字典中的值 6.2.2 添加鍵—值對 6.2.3 先創建一…

智能優化算法應用:基于蜉蝣算法3D無線傳感器網絡(WSN)覆蓋優化 - 附代碼

智能優化算法應用:基于蜉蝣算法3D無線傳感器網絡(WSN)覆蓋優化 - 附代碼 文章目錄 智能優化算法應用:基于蜉蝣算法3D無線傳感器網絡(WSN)覆蓋優化 - 附代碼1.無線傳感網絡節點模型2.覆蓋數學模型及分析3.蜉蝣算法4.實驗參數設定5.算法結果6.參考文獻7.MA…

JAVA+SSM+springboot+MYSQL企業物資庫存進銷存管理系統

。該系統從兩個對象:由管理員和員工來對系統進行設計構建。主要功能包括首頁、個人中心、員工管理、項目信息管理、倉庫信息管理、供應商管理、項目計劃管理、物資庫存管理、到貨登記管理、物資出庫管理、物資入庫管理等功能進行管理。本企業物資管理系統方便員工快…

linux 定時任務

使用 crontab Usage: crontab [-u user] [-e|-l|-r] Crontab 的格式說明如下: * 逗號(‘,’) 指定列表值。如: “1,3,4,7,8″ * 中橫線(‘-’) 指定范圍值 如 “1-6″, 代表 “1,2,3,4,5,6″ * 星號 (‘*’) 代表所有可能的值 */15 表示每 15 分鐘執行一次 # Use the ha…

C++編程法則365天一天一條(24)RTTI運行時類型信息typeid和type_info

文章目錄 基本用法編譯時或運行時判定 基本用法 typeid 是 C 的一個運算符&#xff0c;它用于獲取表達式的類型信息。它返回一個 std::type_info 對象引用&#xff0c;該對象包含有關表達式的類型的信息。 要使用 typeid 運算符&#xff0c;需要包含 <typeinfo> 頭文件…

關于振動試驗

這是試驗的說明&#xff08;來自gbt4710-2009&#xff09; 這是試驗的參數&#xff1a; 一、試驗方向&#xff1a; 振動試驗中有幾個方向 除有關規范另有規定外&#xff0c;應在產品的三個互相垂直方向上進行振動試驗。 一般定義產品長邊為X軸向&#xff0c;短邊為Y軸向&…

飛書面試題匯總

面試相關經驗 Interview | JavaGuide(Java面試 學習指南) 同學1 7次面試 編程題匯總&#xff1a; 有序鏈表找中位數 &#xff08;飛書1面&#xff09; m個有序數組合并 &#xff08;飛書1面&#xff09; 海量數據尋找TopK&#xff08;口述&#xff09; &#xff08;飛書…

Android 10(Q) 以上普通 APP 隱藏應用圖標問題探究及解決方案

1、實驗環境 aosp 版本 10.0 系統 aosp 版本 13.0 系統 2、驗證結果 2.1 方式一 APP AndroidManifest.xml 中通過 activity-alias 配置帶 LAUNCHER 屬性 category&#xff0c;并且 android:enabled“true” 10.0 系統中可安裝后正常顯示 icon&#xff0c;通過 setComponen…

idea中run和debug是灰色的

【現象】idea中run和debug是灰色的 點擊 旁邊的Add Configuration…一看都是空白 【解決方法】&#xff1a; npm點開之后 【結果】