ROC曲線(Receiver Operating Characteeristic Curve)是顯示Classification模型真正率和假正率之間折中的一種圖形化方法
解讀ROC圖的一些概念定義:
真正(True Positive , TP)被模型預測為正的正樣本
假負(False Negative , FN)被模型預測為負的正樣本
假正(False Positive , FP)被模型預測為正的負樣本
真負(True Negative , TN)被模型預測為負的負樣本
真正率(True Positive Rate , TPR)或靈敏度(sensitivity)
TPR = TP /(TP + FN)
正樣本預測結果數 / 正樣本實際數
假負率(False Negative Rate , FNR)
FNR = FN /(TP + FN)
被預測為負的正樣本結果數 / 正樣本實際數
假正率(False Positive Rate , FPR)
FPR = FP /(FP + TN)
被預測為正的負樣本結果數 /負樣本實際數
真負率(True Negative Rate , TNR)或特指度(specificity)
TNR = TN /(TN + FP)
負樣本預測結果數 / 負樣本實際數
目標屬性的被選中的那個期望值稱作是“正”(positive)
ROC曲線上幾個關鍵點的解釋:
( TPR=0,FPR=0 ) 把每個實例都預測為負類的模型
( TPR=1,FPR=1 ) 把每個實例都預測為正類的模型
( TPR=1,FPR=0 ) 理想模型
?
?
一個好的分類模型應該盡可能靠近圖形的左上角,而一個隨機猜測模型應位于連接點(TPR=0,FPR=0)和(TPR=1,FPR=1)的主對角線上。
ROC曲線下方的面積(AUC)提供了評價模型平均性能的另一種方法。如果模型是完美的,那么它的AUG = 1,如果模型是個簡單的隨機猜測模型,那么它的AUG = 0.5,如果一個模型好于另一個,則它的曲線下方面積相對較大。
?
?
?
?
?
?