機器學習中核心評估指標(準確率、精確率、召回率、F1分數)

混淆矩陣

混淆矩陣是一個表格,用于總結分類模型在測試集上的預測結果,特別是當真實標簽已知時。它將預測結果分為四種情況(記憶:實際和預測一致為True,預測為正是Positive):

  • 真正例:?實際為正類,預測也為正類 (True Positive, TP)

  • 假正例:?實際為負類,但預測為正類 (False Positive, FP)?

  • 假反例:?實際為正類,但預測為負類 (False Negative, FN)?

  • 真反例:?實際為負類,預測也為負類 (True Negative, TN)

真實標簽 \ 預測標簽正類 (Positive)負類 (Negative)
正類 (Positive)TPFN
負類 (Negative)FPTN

?準確率(Accuracy)

  • 定義:?模型預測正確(TP+TN)的樣本數占總樣本數(TP+FP+FN+TN)的比例。最直觀的指標。

  • 計算公式:
    Accuracy = (TP + TN) / (TP + FP + FN + TN)

  • 意義:

    • 衡量模型整體預測正確的比例。

    • 優點:?簡單易懂。

    • 缺點:?在數據不平衡時容易產生誤導。例如,在疾病檢測中,健康人(負類)占99%,病人(正類)占1%。一個將所有樣本都預測為健康的模型,準確率也能達到99%,但這個模型對于檢測病人是完全無效的。此時需要更細致的指標。

  • 適用場景:?當正負類樣本比例大致相同時,準確率是一個合理的指標。

精確率(Precision)

  • 定義:?在模型預測為正類(TP+FP)的樣本中,實際也是正類(TP)的樣本所占的比例。衡量預測的“精準度”或“可靠性”。

  • 計算公式:
    Precision = TP / (TP + FP)

  • 意義:

    • 關注的是預測結果的質量。高精確率意味著模型預測為正類的樣本中,誤報(FP)的比例低。

    • 核心問題:?當模型說某個樣本是正類時,這個判斷有多可信?

  • 適用場景:?當需要盡量減少“假警報”或“誤報”時非常重要。

    • 垃圾郵件檢測:?將正常郵件誤判為垃圾郵件(FP)很糟糕。需要高精確率,確保標記為垃圾郵件的郵件確實是垃圾郵件。

    • 推薦系統:?向用戶推薦的商品,希望推薦列表中的商品用戶確實感興趣(高TP),避免推薦不相關的商品(低FP)。

?召回率(Recall)

  • 定義:?在實際為正類(TP+FN)的樣本中,被模型正確預測為正類(TP)的樣本所占的比例。衡量模型的“查全率”或“覆蓋度”。

  • 計算公式:
    Recall = TP / (TP + FN)

  • 意義:

    • 關注的是模型找出所有正類樣本的能力。高召回率意味著模型漏報(FN)的比例低。

    • 核心問題:?在所有實際的正類樣本中,模型成功找出了多少?

  • 適用場景:?當需要盡量減少“漏檢”或“錯過”正類樣本時非常重要。

    • 疾病診斷:?漏掉一個真正的病人(FN)后果可能很嚴重。需要高召回率,盡可能找出所有患病者。

    • 欺詐檢測:?漏掉一個欺詐交易(FN)會導致損失。需要高召回率,盡可能識別出所有欺詐行為。

    • 信息檢索:?希望搜索引擎返回的結果盡可能包含所有相關的文檔(高TP),避免遺漏(FN)。

F1 分數(F1 Score)

  • 定義:?精確率召回率調和平均數(倒數平均數:總體各統計變量倒數算術平均數倒數。旨在用一個分數綜合反映模型的精確率和召回率。1/((1/Precision+1/Recall)/2).

  • 計算公式:
    F1 Score = 2 * (Precision * Recall) / (Precision + Recall)

    • 調和平均數的特點:更重視較小值。只有當精確率和召回率都高時,F1分數才會高。

  • 意義:

    • 提供一個在精確率和召回率之間取得平衡的單一指標。

    • 特別適用于數據不平衡的情況,或者當同時關注精確率和召回率且需要找到一個折中點時。

    • 比簡單的算術平均更能反映模型的整體性能(當精確率和召回率差異較大時)。

  • 適用場景:

    • 當需要同時考慮精確率和召回率,且沒有明確偏向哪一個更重要時。

    • 評估在不平衡數據集上模型的綜合性能。

    • 比較不同模型時的一個常用綜合指標。

本文來自互聯網用戶投稿,該文觀點僅代表作者本人,不代表本站立場。本站僅提供信息存儲空間服務,不擁有所有權,不承擔相關法律責任。
如若轉載,請注明出處:http://www.pswp.cn/bicheng/90044.shtml
繁體地址,請注明出處:http://hk.pswp.cn/bicheng/90044.shtml
英文地址,請注明出處:http://en.pswp.cn/bicheng/90044.shtml

如若內容造成侵權/違法違規/事實不符,請聯系多彩編程網進行投訴反饋email:809451989@qq.com,一經查實,立即刪除!

相關文章

從零搭建Cloud Alibaba

1.初始環境的搭建 1.1環境要求: Spring Boot 3.2.5: 基于最新的 Spring Framework 6.x。支持現代化開發模式,幫助開發更加高效。 JDK 17 或更高版本: Spring Boot 3.x 開始要求 Java 17 作為最低運行環境。 Spring Boot 與 Sp…

Spring AI 工具調用

文章目錄簡述工具定義工具上下文直接返回方法:直接返回工具執行框架控制工具執行用戶控制的工具執行異常處理簡述 工具調用(也稱為函數調用)是 AI 應用程序中的一種常見模式,允許模型與一組 API 或工具進行交互,從而增…

GitHub 趨勢日報 (2025年07月20日)

📊 由 TrendForge 系統生成 | 🌐 https://trendforge.devlive.org/ 🌐 本日報中的項目描述已自動翻譯為中文 📈 今日獲星趨勢圖 今日獲星趨勢圖2033maybe737remote-jobs674Hyprland581n8n572shadPS4341bknd281Resume-Matcher249…

替代標準庫:實用 C++ 開源組件推薦

C17 及 C20 引入了許多現代化的標準庫組件,如 std::filesystem、std::optional、std::format、std::chrono 的增強,以及 std::expected 等。然而,在一些項目中,受限于老版本編譯器、不完善的標準庫實現,或跨平臺兼容性…

夯實基礎:配置Java開發環境JDK與構建工具Maven

摘要:在前面兩個章節中,我們一同探討了Spring Boot的革命性優勢,并深入其內部,理解了起步依賴、自動配置和內嵌容器這三大核心基石。理論的鋪墊是為了更穩健的實踐。從本章開始,我們將正式“卷起袖子”,搭建…

PyCharm 未正確關聯 .jpg 為圖片格式

1. PyCharm 未正確關聯 .jpg 為圖片格式PyCharm 可能錯誤地將 .jpg 文件識別為文本文件,導致無法預覽圖片。解決方法手動關聯 .jpg 為圖片格式:Windows/Linux: File → SettingsmacOS: PyCharm → Preferences進入 Editor → File Types。在 Recognized …

DM8數據庫Docker鏡像部署最佳實踐

DM8數據庫Docker鏡像部署最佳實踐一、Docker加載DM8鏡像二、Docker創建DM8容器三、驗證目錄是否掛載成功一、Docker加載DM8鏡像 1.下載DM8鏡像,由于官網暫未提供docker鏡像下載,可通過網盤下載:https://pan.quark.cn/s/fe38ba821a2a 2.打開…

數據結構——樹(2)

數據結構基礎(12) 文章目錄數據結構基礎(12)二叉樹的先序遍歷先序遍歷中序遍歷后序遍歷二叉樹的層序遍歷由遍歷序列構造二叉樹前序 中序遍歷序列后序 中序遍歷序列層序 中序遍歷序列二叉樹的中序遍歷(缺點&#xff…

【C語言進階】結構體練習:通訊錄

要求: 實現一個通訊錄。 (1)人的信息: 包括姓名、年齡、性別、電話地址。 (2)功能: ①存放一百個人的信息。 ②增加聯系人。 ③刪除指定聯系人。 ④查找指定聯系人。 ⑤修改聯系人。 ⑥排序。 ⑦顯示聯系人。 (3)文件: ①contact.…

緩存三劍客解決方案

緩存三劍客解決方案 1.緩存雪崩 定義: 大量緩存數據在同一時間點集體失效,導致所有請求直接穿透到數據庫,引發數據庫瞬時高負載甚至崩潰。 解決方案: 設置過期隨機值,避免大量緩存同時失效。 // 緩存雪崩防護&#xff…

HTML 頁面禁止縮放功能

頁面禁止縮放 代碼如下&#xff1a; <!DOCTYPE html> <html lang"en"><head><meta charset"utf-8"><meta name"viewport" content"widthdevice-width, initial-scale1, shrink-to-fitno, maximum-scale1.0, us…

在github上搭建自己主頁

主要是這篇博客進行一些補充。 第一步照做就行 首先是第二步 克隆倉庫到本地 先下載一個git&#xff0c;電腦創建一個新文件夾&#xff0c;然后 git clone xxxxx 注意即使你使用了代理&#xff0c;這里大概率也會報錯&#xff0c;Failed to connect to github.com port 443 …

Laravel 框架NOAUTH Authentication required 錯誤解決方案-優雅草卓伊凡

Laravel 框架NOAUTH Authentication required 錯誤解決方案-優雅草卓伊凡NOAUTH Authentication required 錯誤這個錯誤通常出現在以下幾種情況&#xff1a;Redis 認證問題&#xff1a;如果你的應用使用了 Redis 且配置了密碼API 認證問題&#xff1a;請求需要認證的 API 端點但…

kafka生產端和消費端的僵尸實例以及解決辦法

目錄 一 生產端僵尸 1.1 原因 1.2 問題 1.3解決辦法 1.4 案例 1.4.1 案例1&#xff1a;生產者崩潰后重啟 (同一 transactional.id) 1.4.2 案例2&#xff1a;短暫網絡分區導致的腦裂 1.4.3 案例3&#xff1a;正確 - 解決僵尸 1.4.4 案例4&#xff1a;錯誤 - 無法解決僵…

國產電科金倉數據庫金倉KES V9 2025:AI時代的數據庫融合標桿

國產電科金倉數據庫金倉KES V9 2025&#xff1a;AI時代的數據庫融合標桿 在AI技術迅猛發展的今天&#xff0c;企業數據管理面臨著前所未有的挑戰&#xff1a;異構數據庫兼容難題、多數據模型融合需求、高并發場景性能瓶頸、跨中心容災壓力……這些痛點如同數據流轉的大問題&am…

【STM32】關于STM32F407寫Flash失敗問題的解決辦法

問題描述 在使用正點原子的STM32F407寫flash例程時&#xff0c;發現STMFLASH_Write函數沒辦法寫入數據到flash&#xff0c;原始代碼輸入下&#xff1a; 隨后對每一行代碼的結果進行分析&#xff0c;發現87行的“FLASH_ProgramWord(WriteAddr,*pBuffer)”返回值是7&#xff0c;一…

CUDA與RISC-V的融合:打破架構霸權,重塑AI計算未來

當x86和Arm統治數據中心十余年后,一家GPU巨頭正悄悄將十億顆RISC-V核心嵌入其系統。如今,它決定拆除CPU架構的圍墻。 2025年7月,上海張江科學會堂。英偉達硬件工程副總裁Frans Sijstermanns在第五屆RISC-V中國峰會上宣布:英偉達正式啟動CUDA向RISC-V架構的移植工作。 這個…

微信二維碼掃描登錄流程詳解

二維碼掃描登錄流程細節&#xff08;項目經驗&#xff09; 1&#xff1a; 獲取二維碼信息 PC會優先存放服務器生成的唯一密鑰&#xff1a; 比如 source、secret 以密文形式存儲大致發送字段&#xff1a; sourcesecretmac(mac 地址) 服務器生成 二維碼信息&#xff1a;二維碼字符…

日本上市IT企業|8月125日將在大連舉辦赴日it招聘會

株式會社GSD的核心戰略伙伴貝斯株式會社&#xff0c;將于2025年8月25日在大連香格里拉大酒店商務會議室隆重舉辦赴日技術人才專場招聘會。本次招聘會面向全國范圍內的優秀IT人才&#xff0c;旨在為貝斯株式會社東京本社長期發展招募優質的系統開發與管理人才。招聘計劃&#xf…

Python 數據分析與可視化:從基礎到進階的技術實現與優化策略

數據分析與可視化是數據科學領域的核心技能,Python 憑借其豐富的庫生態和靈活的編程范式,成為該領域的首選工具。本文將系統講解 Python 數據分析與可視化的技術棧實現,從基礎操作到性能優化,結合實戰場景提供可復用的解決方案。 數據分析核心庫技術解析 Pandas 數據處理…