模型評價指標

用訓練好的模型結果進行預測，需要采用一些評價指標來進行評價，才可以得到最優的模型

常用的指標：

1.分類任務

ConfusionMatrix? 混淆矩陣
Accuracy?? 準確率
Precision? 精確率
Recall?????? 召回率
F1 score?? H-mean值
ROC Curve? ROC曲線
PR Curve???? PR曲線
AUC

??????? ……

下面我將會具體介紹以上幾種常見的分類模型評價指標

?ConfusionMatrix 混淆矩陣

?混淆矩陣是評判模型結果的一種指標，屬于模型評估的一部分，常用于評判分類器模型的優劣

混淆矩陣（ConfusionMatrix）		真實值(labels)
混淆矩陣（ConfusionMatrix）		Positive	Negative
預測值（predict）	Positive	TP	FP
預測值（predict）	Negative	FN	TN

其中，

TP (True? Positive) ? : 真實值和預測值均為Positive
FP (False Positive)?? : 真實值為Negative,預測值為Positive
FN (False Negative) : 真實值為Positive,預測值為Negative
TN (True? Negative)? : 真實值為Negative,預測值為Negative

一般地，期望TP和TN越高越好，FN和FP越低越好

?Accuracy? 準確率、Precision 精確率、Recall 召回率

（引用 up主：霹靂吧啦Wz的個人空間-霹靂吧啦Wz個人主頁-嗶哩嗶哩視頻?? 的一張圖做說明）

準確率（正確率）：所有預測正確的樣本數 / 總樣本數?? （所有的預測正確（正類負類）的占總的比重）

?雖然準確率可以判斷總的正確率，但是在樣本不平衡 的情況下，并不能作為很好的指標來衡量結果。舉個簡單的例子，比如在一個總樣本中，正樣本占 90%，負樣本占 10%，樣本是嚴重不平衡的。對于這種情況，我們只需要將全部樣本預測為正樣本即可得到 90% 的高準確率，但實際上我們并沒有很用心的分類，只是隨便無腦一分而已。這就說明了：由于樣本不平衡的問題，導致了得到的高準確率結果含有很大的水分。即如果樣本不平衡，準確率就會失效

作者：easyAI產品經理的AI知識庫
鏈接：https://juejin.cn/post/6844903470756167688
來源：稀土掘金

精確率（查準率）：預測正類為正類的樣本數 / 預測的正類樣本數??? （真正正確的占所有預測為正的比例）

精準率和準確率看上去有些類似，但是完全不同的兩個概念。精準率代表對正樣本結果中的預測準確程度，而準確率則代表整體的預測準確程度，既包括正樣本，也包括負樣本

作者：easyAI產品經理的AI知識庫
鏈接：https://juejin.cn/post/6844903470756167688
來源：稀土掘金

召回率（查全率）：預測正類為正類的樣本數 / 真實值為正類的樣本數（真正正確的占所有實際為正的比例）

召回率的應用場景： 比如拿網貸違約率為例，相對好用戶，我們更關心壞用戶，不能錯放過任何一個壞用戶。因為如果我們過多的將壞用戶當成好用戶，這樣后續可能發生的違約金額會遠超過好用戶償還的借貸利息金額，造成嚴重償失。召回率越高，代表實際壞用戶被預測出來的概率越高，它的含義類似：寧可錯殺一千，絕不放過一個

作者：easyAI產品經理的AI知識庫
鏈接：https://juejin.cn/post/6844903470756167688
來源：稀土掘金

注意：

精確率和召回率的區別

?????? 從數學角度來看，精確率和召回率就是分母不一樣

?????? 召回率的分母是原本的正類（TP+FN),

?????? 召回率讓模型預測到所有想被預測到的樣本(就算預測錯的多一些，也能接受)

下面引用博主?清如許. 的一張圖片作總結

博客鏈接：https://blog.csdn.net/MacWx/article/details/129119016?utm_medium=distribute.pc_relevant.none-task-blog-2~default~baidujs_baidulandingword~default-1-129119016-blog-80964865.235^v39^pc_relevant_anti_t3_base&spm=1001.2101.3001.4242.2&utm_relevant_index=4

總得來說，精確率就是不錯報，召回率就是不漏報

F1-Score(F1值、調和平均數)

精確率（Precision）和召回率（Recall）之間是兩難全的關系，為了綜合兩者的表現，在兩者之間找一個平衡點，就出現了一個 F1分數?

**F = 2 / (1/Precision + 1/Recall) = （2 * Precision * Recall）/ (Precision + Recall)**

F1值越大越好，F1對 Precision 和 Recall 進行了加權

ROC曲線

PR曲線

雖然準確率可以判斷總的正確率，但是在樣本不平衡 的情況下，并不能作為很好的指標來衡量結果。舉個簡單的例子，比如在一個總樣本中，正樣本占 90%，負樣本占 10%，樣本是嚴重不平衡的。對于這種情況，我們只需要將全部樣本預測為正樣本即可得到 90% 的高準確率，但實際上我們并沒有很用心的分類，只是隨便無腦一分而已。這就說明了：由于樣本不平衡的問題，導致了得到的高準確率結果含有很大的水分。即如果樣本不平衡，準確率就會失效

作者：easyAI產品經理的AI知識庫
鏈接：https://juejin.cn/post/6844903470756167688
來源：稀土掘金

2.回歸任務

MSE???? 均方誤差??? Mean Square Error
RMSE? 均方根誤差 Root Mean Square Error
MAE??? 平均絕對誤差 Mean Absolute Error

????????? ……

本文來自互聯網用戶投稿，該文觀點僅代表作者本人，不代表本站立場。本站僅提供信息存儲空間服務，不擁有所有權，不承擔相關法律責任。
如若轉載，請注明出處：http://www.pswp.cn/news/210860.shtml
繁體地址，請注明出處：http://hk.pswp.cn/news/210860.shtml
英文地址，請注明出處：http://en.pswp.cn/news/210860.shtml

如若內容造成侵權/違法違規/事實不符，請聯系多彩編程網進行投訴反饋email:809451989@qq.com，一經查實，立即刪除！