- Sklearn:可以做數據預處理、分類、回歸、聚類,不能做神經網絡。
- 原始的工具包文檔:
- scikit-learn: machine learning in Python — scikit-learn 1.6.1 documentation
- 數據集:使用的是MNIST手寫數字識別技術,大小為70000,數據類型為784個像素點。
- 模型評估方法有留一法、交叉驗證法、自助法。
- 交叉驗證:將數據集劃分為K個大小相似的互斥子集,又稱K折交叉驗證,準確率為K次評估的平均值。
- Positove:正例;necative:負例。分類結果混淆矩陣(TP、FN、FP、TN)
- 查準率:TP/(TP+FP);查全率:TP/(TP+FN);
- ROC曲線全稱是“受試者工作特征”曲線,縱軸為TPR(真正例率),橫軸為FPR(假正例率)。
代碼: