二分類問題中的性能指標【python,機器學習,算法】

平均絕對誤差(MAE)

平均絕對誤差(Mean Absolute Error, MAE)是衡量模型預測誤差的一種方法,通常用于回歸分析。它表示的是預測值與真實值之間差的絕對值的平均數。計算公式如下:
M A E = 1 N ∑ i = 1 N ∣ y i ? y ^ ∣ MAE=\frac{1}{N}\sum\limits_{i=1}^{N}|y_i-\hat{y}| MAE=N1?i=1N?yi??y^?,
其中 y i y_i yi?表示第 i i i個數據的預測值, y ^ \hat{y} y^?表示第 i i i個數據的真實值。

平均絕對誤差的特點是:

  1. 它是一個非負數,且MAE值越小,說明預測模型的效果越好。
  2. MAE 使用的是絕對值,因此它不會因為異常值而受到影響,這一點比均方誤差(Mean Squared Error, MSE)更有優勢。
  3. MAE的單位與原數據的單位相同,這使得它具有更好的解釋性。

MAE通常用于評估模型在預測連續值時的性能,例如在天氣預報、股票價格預測等領域。

均方誤差(MSE)

均方誤差(Mean Squared Error, MSE)是另一種衡量模型預測誤差的方法,常用于回歸分析。它是預測值與真實值之間差的平方的平均數。計算公式如下:
M S E = 1 N ∑ i = 1 N ( y i ? y ^ ) 2 MSE=\frac{1}{N}\sum\limits_{i=1}^{N}(y_i-\hat{y})^2 MSE=N1?i=1N?(yi??y^?)2
均方誤差的特點是:

  1. 它是一個非負數,且MSE值越小,說明預測模型的效果越好。
  2. MSE 使用的是平方,因此它會對較大的誤差給予較大的權重,這意味著大的誤差會對MSE產生較大的影響。
  3. MSE的單位是原數據單位的平方,這使得它在解釋上不如平均絕對誤差直觀。
  4. MSE通常用于評估模型在預測連續值時的性能,特別是在關注較大誤差的情況下。與MAE相比,MSE對異常值更為敏感,因此在異常值較多的情況下,使用MSE可能會導致模型性能評估的不準確。

在實際應用中,MSE的一個優點是它在數學上更容易處理,特別是當涉及到梯度下降等優化算法時。此外,MSE是最小二乘法的基礎,這是一種常用的參數估計方法。

R 平方( R 2 R^2 R2

R平方(R2或R2),也稱為決定系數,是衡量回歸模型擬合優度的一個統計量。它表示因變量的變異中有多少可以被自變量解釋。R平方的值范圍從0到1,或者以百分比形式表示從0%到100%。

R平方的計算通常基于均方誤差(MSE):
R 2 = 1 ? M S E m o d e l M S E n u l l R^2=1-\frac{MSE_{model}}{MSE_{null}} R2=1?MSEnull?MSEmodel??,
其中 M S E m o d e l MSE_{model} MSEmodel?表示模型的均方誤差, M S E n u l l MSE_{null} MSEnull?表示以實際值的均值作為 y ˉ \bar{y} yˉ?來計算的 MSE 值。

R平方的解釋如下:

  • 𝑅^2=0:表示模型沒有任何解釋能力,因變量的變異不能由自變量解釋。
  • 0<𝑅^{2}<1:表示模型可以解釋因變量的一部分變異,R平方越接近1,模型的解釋能力越強。
  • 𝑅^2=1:表示模型完美地解釋了因變量的所有變異。

雖然R平方是一個常用的統計量,但它也有一些局限性:

  1. R平方不告訴我們在實踐中模型的表現如何,它只是衡量了模型對數據的擬合程度。
  2. R平方不說明因果關系,即使R平方很高,也不能斷定自變量導致了因變量的變化。
  3. R平方對數據中的異常值非常敏感,因為異常值會增加模型的 MSE。
  4. R平方隨著自變量的增加而增加,即使這些自變量對模型沒有實際貢獻,因此可能會產生誤導。

在實際應用中,我們應該謹慎地使用R平方,并結合其他統計量和模型診斷工具來全面評估模型的性能。

可以借助sklearn庫計算這些指標:

from sklearn.metrics import mean_absolute_error
from sklearn.metrics import mean_squared_error
from sklearn.metrics import r2_scoreX_actual = [5, -1, 2, 10]
Y_predict = [3.5, -0.9, 2, 9.9]
print('R Squared =', r2_score(X_actual, Y_predict))
print('MAE =', mean_absolute_error(X_actual, Y_predict))
print('MSE =', mean_squared_error(X_actual, Y_predict))

本文來自互聯網用戶投稿,該文觀點僅代表作者本人,不代表本站立場。本站僅提供信息存儲空間服務,不擁有所有權,不承擔相關法律責任。
如若轉載,請注明出處:http://www.pswp.cn/diannao/35230.shtml
繁體地址,請注明出處:http://hk.pswp.cn/diannao/35230.shtml
英文地址,請注明出處:http://en.pswp.cn/diannao/35230.shtml

如若內容造成侵權/違法違規/事實不符,請聯系多彩編程網進行投訴反饋email:809451989@qq.com,一經查實,立即刪除!

相關文章

MacOS 上安裝和管理 Node.js

在 macOS 上安裝和管理 Node.js&#xff0c;使用 Node Version Manager (NVM) 是一種簡便且高效的方法。NVM 允許您輕松地安裝、切換和管理不同版本的 Node.js。本指南將帶您一步步完成這一過程。 步驟 1&#xff1a;安裝 Node Version Manager (NVM) 首先&#xff0c;我們需…

電巢科技CIOE中國光博會:激光雷達技術應用研討會圓滿落幕!

2024年6月20日&#xff0c;由CIOE中國光博會與電巢科技聯合主辦的“激光雷達技術應用”線上研討會成功舉行。本次線上研討會是CIOE中國光博會與電巢科技首次聯合主辦的論壇&#xff0c;旨在借助雙方自身資源優勢&#xff0c;為行業發展提供可靠的交流平臺。接下來&#xff0c;C…

Android焦點機制結合WMS

文章前提&#xff1a; 了解WMS基本作用了解window的概念&#xff0c;phoneWindow&#xff0c;rootViewImpl了解view的事件分發 開始&#xff1a; 講三件事情&#xff1a; window的創建&#xff0c;更新焦點的更新事件的分發 Window的創建&#xff0c;更新&#xff1a; wi…

基于 Redis 實現秒殺資格判斷,提升并發性能

在互聯網電商平臺上&#xff0c;秒殺活動往往會吸引大量用戶同時搶購&#xff0c;如何高效地處理高并發請求&#xff0c;保證用戶體驗&#xff0c;是一個重要的技術挑戰。本文將介紹如何基于 Redis 實現秒殺資格的判斷&#xff0c;提高并發性能。 基本思路 秒殺活動的核心流程…

AI 編程還有前景嘛?

自從各個大廠相繼出品 AI 編程助手之后&#xff0c;AI 在編程領域的發展&#xff0c;可謂是幾無寸進。 相比于 AI 在多模態領域火熱&#xff0c;AI 在編程領域的熱度已經完全下來了。 阿七在公眾號搜索了關鍵詞「AI編程」&#xff0c;發現搜索出來的公眾號寥寥無幾&#xff0…

LLM生成模型在生物蛋白質應用:ESM3

參考&#xff1a; https://github.com/evolutionaryscale/esm 通過GPT模型原理&#xff0c;輸入蛋白質序列等模態輸出預測的蛋白質序列及結構 使用 參考&#xff1a;https://colab.research.google.com/github/evolutionaryscale/esm/blob/main/examples/generate.ipynb#sc…

(六)使用統計學方法進行變量有效性測試(43道選擇題)

本文整理了使用統計學方法進行變量有效性測試相關的練習題&#xff0c;共43道&#xff0c;適用于想鞏固理論基礎的同學。來源&#xff1a;如荷學數據科學題庫&#xff08;CDA二級-第7章&#xff09;。 1&#xff09; 2&#xff09; 3&#xff09; 4&#xff09; 5&#xff09;…

【無人機三維路徑規劃】基于樹木生長算法TGA實現復雜城市地形下無人機避障三維航跡規劃附Matlab代碼

% 定義無人機起始位置和目標位置 start_point [0, 0, 0]; % 起始位置 [x, y, z] target_point [100, 100, 100]; % 目標位置 [x, y, z] % 定義城市地形和障礙物信息 city_map imread(‘city_map.png’); % 城市地形圖像 obstacles [ 20, 30, 10; % 障礙物1位置 [x, y, z] …

三分之一的違規行為未被發現

Gigamon 調查顯示&#xff0c;隨著漏洞的針對性越來越強、越來越復雜&#xff0c;企業在檢測漏洞方面也面臨越來越大的困難&#xff0c;超過三分之一的企業表示&#xff0c;現有的安全工具無法在漏洞發生時檢測到它們。 隨著混合云環境變得越來越復雜&#xff0c;以及惡意行為…

Java 語言特定指南

Java 語言特定指南 本 Java 入門指南將教您如何使用 Docker 創建一個容器化的 Spring Boot 應用程序。在本模塊中&#xff0c;您將學習如何&#xff1a; 使用 Maven 容器化并運行一個 Spring Boot 應用程序設置本地開發環境以將數據庫連接到容器、配置調試器&#xff0c;并使…

篩斗數據:引領未來,以技術創新推動在線推廣新紀元

在數字化浪潮的推動下&#xff0c;企業在線推廣已成為市場拓展的關鍵手段。然而&#xff0c;在海量信息中精準定位目標用戶&#xff0c;有效提升轉化率&#xff0c;卻是一大挑戰。篩斗數據&#xff0c;作為一家專注于數據提取與分析的技術公司&#xff0c;正以其獨特的技術優勢…

云計算基礎知識

前言&#xff1a; 隨著ICT技術的高速發展&#xff0c;企業架構對計算、存儲、網絡資源的需求更高&#xff0c;急需一種新的架構來承載業務&#xff0c;以獲得持續&#xff0c;高速&#xff0c;高效的發展&#xff0c;云計算應運而生。 云計算背景 信息大爆炸時代&#xff1a…

Linux 標準IO的fopen和fclose

getchar(),putchar() ‐‐‐‐ 一個字符 gets(buf),puts(buf) ‐‐‐‐ 一串字符 scanf(),printf() ‐‐‐‐ 一個字符&#xff0c;一串字符都可以 fopen函數的形式 FILE * fopen(constchar *path , cost char *mode) /* * description : 打開一個文件 * param ‐ path…

進階篇07——InnoDB引擎介紹

概覽 邏輯存儲結構 架構 當執行增刪改查操作時&#xff0c;操作的是緩沖區的數據&#xff0c;如果緩沖區里沒有要操作的數據&#xff0c;就會從磁盤中讀取數據加載到緩沖區中&#xff1b;緩沖區的數據會以一定的頻率通過后臺線程刷新到磁盤中永久存儲。 內存結構 磁盤結構 后…

數據結構(Java):順序表集合類ArrayList

1、線性表 線性表&#xff0c;在邏輯結構上是連續的&#xff08;可理解為連續的一條直線&#xff0c;一對一的關系&#xff09;&#xff0c;而在物理結構上不一定連續&#xff0c;通常以數組和鏈式結構進行存儲。 線性表是一種在實際中廣泛使用的數據結構&#xff0c;常見的線…

Vue介紹與入門(一篇入門)

Vue.js 是一個流行的 JavaScript 框架&#xff0c;專門用于構建用戶界面和單頁面應用程序。它簡單易學&#xff0c;但功能強大&#xff0c;能夠幫助開發者快速構建交互性強的 Web 應用。 本教程旨在幫助那些剛開始學習 Vue.js 的開發者快速入門&#xff0c;并掌握一些基礎知識…

【UE5.1 角色練習】12-坐騎——Part2(讓角色騎上坐騎)

目錄 前言 效果 步驟 一、坐騎的父類 二、將角色附加到坐騎 三、添加坐姿 四、騎上坐騎 五、從坐騎上下來 前言 在上一篇&#xff08;【UE5.1 角色練習】11-坐騎——Part1&#xff08;控制大象移動&#xff09;&#xff09;基礎上繼續實現角色騎上坐騎的功能。 效果 …

語言的數據結構:樹與二叉樹(二叉樹篇)

語言的數據結構&#xff1a;樹與二叉樹&#xff08;二叉樹篇&#xff09; 前言概念特別的二叉樹滿二叉樹完全二叉樹 存儲結構順序存儲鏈式存儲 查找方式 前言 上文說到了樹&#xff0c;有人認為二叉樹是樹的每一個分支都有兩個子節點。其實這也對。但二叉樹在此基礎上還做了限…

RS422串口通信協議介紹和基礎代碼實現

**RS-422串口協議介紹**RS-422是一種工業標準的通信接口&#xff0c;其全稱是“平衡電壓數字接口電路的電氣特性”。它是在RS-232的基礎上發展而來&#xff0c;旨在解決RS-232通信距離短和速率低的缺點。以下是對RS-422串口協議的詳細介紹&#xff1a;傳輸速率與距離&#xff1…

MyCAT 2 簡單入門

MyCAT 2 基礎 什么是 MyCAT 2&#xff1f; MyCAT 2 是一款開源的數據庫中間件&#xff0c;它主要用于解決數據庫的分庫分表、讀寫分離等問題。MyCAT 2 基于 MyCAT 1 的架構進行優化和重構&#xff0c;具有更高的性能和穩定性&#xff0c;支持多種數據庫類型&#xff0c;包括 …