机器学习性能评价指标
1.符号规定
- TP:True Positive,实际是正类,预测为正类
- FN:False Negative,实际是正类,预测为负类
- TN:True Negative,实际是负类,预测为负类
- FP:False Positive,实际是负类,预测为正类
记忆方法:第二个字母是你预测的分类,第一个字母是表示你预是否正确
2.准确率(Accuracy)
模型预测正确的数据占总数据的比例,即:
在二分类且正反例不平衡的情况下,准确度参考意义很低,比如癌症检测,100个样本中,有一个癌症样本,模型全部检测为非癌症,准确率为99%,此模型在实际任务中,无法应用
3.精确率(Precision)
针对模型预测出所有正样本总数(TP+FP),其中预测正确(TP)占比,即:
精确率又叫查准率,何为查准: 就是查出来所有的内容,其中正确的占比多少?
4.召回率(Recall)
针对实际的所有正样本(TP+FN),其中正确地预测为正(TP)占比,即:
召回率又叫查全率