机器学习性能评价指标

Posted by XP on September 1, 2019

机器学习性能评价指标

1.符号规定

  1. TP:True Positive,实际是正类,预测为正类
  2. FN:False Negative,实际是正类,预测为负类
  3. TN:True Negative,实际是负类,预测为负类
  4. FP:False Positive,实际是负类,预测为正类

记忆方法:第二个字母是你预测的分类,第一个字母是表示你预是否正确

2.准确率(Accuracy)

模型预测正确的数据占总数据的比例,即:

Acc = (TP + TN) / (TP + FP + TN +FN)

在二分类且正反例不平衡的情况下,准确度参考意义很低,比如癌症检测,100个样本中,有一个癌症样本,模型全部检测为非癌症,准确率为99%,此模型在实际任务中,无法应用

3.精确率(Precision)

针对模型预测出所有正样本总数(TP+FP),其中预测正确(TP)占比,即:

Precision = TP / (TP + FP)

精确率又叫查准率,何为查准: 就是查出来所有的内容,其中正确的占比多少?

4.召回率(Recall)

针对实际的所有正样本(TP+FN),其中正确地预测为正(TP)占比,即:

Recall = TP / (TP + FN)

召回率又叫查全率

precision