精确率和召回率指标尝试回答以下问题:
在被识别为正类别的样本中确实为正类别的比例是多少?
让我们来计算一下上一部分中用于分析肿瘤的机器学习模型的精确率和召回率:
该模型的精确率和召回率为 0.11也就是說,该模型在预测恶性肿瘤方面的正确率是 50%
召回率尝试回答以下问题:
在所有正类别样本中,被正确识别为正类别的比例是多少
从数学上讲,召回率的定义如下:
让我们来计算一下肿瘤分类器的召回率:
该模型的召回率是 0.11也就是说,该模型能够正确识别出所有恶性肿瘤的百分比是 11%
要全面评估模型的有效性,必须同时检查精确率和召回率和召回率遗憾的是,精确率和召回率和召回率往往是此消彼长的情况也就是说,提高精确率和召回率通常会降低召回率值反之亦然。请观察下图来了解这一概念该图显示了电子邮件分类模型做出的 30 项预测。分类阈值右侧的被归类为“垃圾邮件”左侧的则被归类为“非垃圾邮件”。
我们根据图 1 所示的结果来计算精確率和召回率和召回率值:
精确率和召回率指的是被标记为垃圾邮件的电子邮件中正确分类的电子邮件所占的百分比即图 1 中阈值线右侧嘚绿点所占的百分比:
召回率指的是实际垃圾邮件中正确分类的电子邮件所占的百分比,即图 1 中阈值线右侧的绿点所占的百分比:
图 2 显示叻提高分类阈值产生的效果
假正例数量会减少,但假负例数量会相应地增加结果,精确率和召回率有所提高而召回率则有所降低:
楿反,图 3 显示了降低分类阈值(从图 1 中的初始位置开始)产生的效果
假正例数量会增加,而假负例数量会减少结果这一次,精确率和召回率有所降低而召回率则有所提高:
我们已根据精确率和召回率和召回率指标制定了各种指标。
版权声明:文章内容来源于网络,版权归原作者所有,如有侵权请点击这里与我们联系,我们将及时删除。