? ? ? ? 模型除了從數據劃分的角度來評估,我上一篇文章介紹了數據集劃分的角度:
【機器學習300問】24、模型評估的常見方法有哪些?http://t.csdnimg.cn/LRyEt
還可以從一些指標的角度來評估,這篇文章就帶大家從兩個最經典的任務場景介紹。
一、回歸問題
(1)MSE(Mean Squared Error,均方誤差)
MSE衡量的是預測值與真實值之間差別的平方平均數。公式為:
其中,是真實的觀測值,是模型預測的值,n是樣本數量。MSE對誤差進行平方處理,因此它更關注大誤差,且其單位與目標變量相同但是平方。
(2)RMSE?(Root Mean Squared Error,均方根誤差)
RMSE是MSE的平方根,用于將MSE的結果轉換回原始尺度,與y變量的量綱相同,這樣結果更容易解讀。公式為:
二、分類問題
(1)Accuracy (準確率)
準確率是最直觀的性能度量之一,計算的是分類正確的樣本數占總樣本數的比例。然而,在類別不平衡的情況下,準確率可能不夠全面。公式為:
TP是真正例(實際正類被正確預測),TN是真負例(實際負類被正確預測),FP是假正例(實際負類被錯誤預測為正類),FN是假負例(實際正類被錯誤預測為負類)。
(2)Precision (精確率)
精確率是指模型預測為正類的樣本中真正是正類的比例,即預測正確的正例占所有預測為正例的比例。公式為:
(3)Recall (召回率)
召回率表示模型識別出所有正類的能力,即實際正類中被正確預測的比例。
(4)ROC曲線(Receiver Operating Characteristic Curve)
ROC曲線是基于不同的閾值下,模型的真正例率(True Positive Rate, TPR)和假正例率(False Positive Rate, FPR)的關系繪制的曲線。曲線下面積(AUC-ROC)可以用來作為整體評價分類器性能的一個綜合指標,AUC越大,說明分類器在各個閾值下的表現越好。
(5)F1分數(F1-Score)
F1分數(F1-Score)是二分類或多分類問題中一個常用的性能度量指標,它結合了精確率(Precision)和召回率(Recall)兩個評價指標,是精確率與召回率的調和平均值,衡量的是精確率和召回率的平衡。在二分類問題中,F1分數的計算公式如下: