Precision和Recall:如何评价保安的能力
2017-09-15 09:51
141 查看
Precision和Recall:如何评价保安的能力
本文版权属于重庆大学计算机学院刘骥,禁止转载Precision和Recall如何评价保安的能力
保安的能力评估
PrecisionRecall在机器学习中的定义
F1F_1及其他
保安的能力评估
保安对进出公司的人员进行盘查,识别其中的小偷。保安有可能犯两类错误:
1. 把
好人误认为
小偷,称为
假小偷(与之相反称为
真小偷)。
2. 把
小偷误认为
好人,称为
假好人(与之相反称为
真好人)。
保安优秀与否可以按照如下的两个标准来评判:
1. 抓住的
小偷中
真小偷的比例尽量的高。
2. 宁可错抓
好人也不放过
小偷。
标准1称为精准率(Precision),标准2称为召回率(Recall),对应的计算公式为:
Precision=抓住的真小偷数量抓住的真小偷数量+抓住的假小偷数量
Recall=抓住的真小偷数量抓住的真小偷数量+放走的假好人数量
为了更好的理解上述公式,假设某公司每天进出100人,其中80个
好人,20个
小偷,某保安的表现如下:
- | 实际上是小偷 | 实际上是好人 | 合计 |
---|---|---|---|
抓住的小偷 | 5 | 1 | 6 |
放走的好人 | 15 | 79 | 94 |
合计 | 20 | 80 | 100 |
小偷,其中5人是
真小偷,另外1人是
假小偷(好人被误抓),依据公式可知,该保安的Precision=55+1=56≈88.3%。看上去这名保安抓人的准确性挺强,但他是一名好保安吗?
来看看召回率的计算。Recall=55+15=14=25%。什么叫做
放走的假好人?换句话,也就是被保安
误认为好人的
小偷。所以Recall的分母总是等于
小偷的总数(而Precision的分母是
抓住的人的总数)。从召回率可以看出,这名保安放走了34的
小偷,这实在不能算优秀的保安。
再来看看另外一名保安的数据:
- | 实际上是小偷 | 实际上是好人 | 合计 |
---|---|---|---|
抓住的小偷 | 20 | 20 | 40 |
放走的好人 | 0 | 60 | 60 |
合计 | 20 | 80 | 100 |
理想的保安应该具有如下的表现:
- | 实际上是小偷 | 实际上是好人 | 合计 |
---|---|---|---|
抓住的小偷 | 20 | 0 | 20 |
放走的好人 | 0 | 80 | 80 |
合计 | 20 | 80 | 100 |
Precision、Recall在机器学习中的定义
现在我们准备用一个二分类的人工智能程序代替保安,如何对这个人工智能程序的能力进行评价呢?可以采用相同的标准。为了将评价问题泛化,使其能够针对所有的二分类问题(而不限于抓小偷),我们做出了如下定义:1. 称
小偷为
Positive,
好人为
Negative。
2. 与之对应
真小偷为
True Positive(简写为TP),
假小偷为
False Positive(简写为FP)。
3. 与之对应
真好人为
True Negative(简写为TN),
假好人为
False Negative(简写为FN)。
于是人工智能抓小偷的表现可以用下表来表示:
- | 实际上是Positive | 实际上是Negative | 合计 |
---|---|---|---|
判定为Positive | 20 (TP) | 20 (FP) | 40 |
判定为Negative | 0 (FN) | 60 (TN) | 60 |
合计 | 20 | 80 | 100 |
Precision=TPTP+FP
Recall=TPTP+FN
F1及其他
将Precision和Recall放到一个公式中,就构成了F1 Score,其公式如下:F1=21Precision+1Recall=TPTP+FN+FP2
除此之外,还有其他评价标准,请参考其他书籍。
相关文章推荐
- 在目标检测任务中如何计算评价指标-Recall,Precision以及画出PR曲线
- 准确率(Precision)、召回率(Recall)以及综合评价指标(F1-Measure )
- 信息检索的评价指标(Precision、Recall、F-score、MAP、ROC、AUC)
- 准确率(Precision),召回率(Recall)以及综合评价指标(F1-Measure)
- 信息检索的评价指标:Recall,Precision,AP,MAP,ROC
- Recall(召回率);Precision(准确率);F1-Meature(综合评价指标);true positives;false positives;false negatives..
- Recall(召回率);Precision(准确率);F1-Meature(综合评价指标);true positives;false positives;false negatives..
- 准确率(Precision)、召回率(Recall)以及综合评价指标(F1-Measure)
- Recall(召回率);Precision(准确率);F1-Meature(综合评价指标);true positives;false positives;false negatives.
- 信息检索的评价指标(Precision, Recall, F-score, MAP、ROC、AUC)
- 如何理解和评价机器学习中的表达能力、训练难度和泛化性能
- 信息检索的评价指标(Precision, Recall, F-score, MAP)
- 转载 Recall(召回率);Precision(准确率);F1-Meature(综合评价指标)
- 深度丨如何理解和评价机器学习中的表达能力、训练难度和泛化性能
- 如何绘制precision——recall曲线和confusion矩阵
- 机器学习常见评价指标:AUC、Precision、Recall、F-measure、Accuracy
- 准确率(Precision)、召回率(Recall)以及综合评价指标(F1-Measure )
- 信息检索的评价指标(Precision, Recall, F-score, MAP)
- Recall(召回率);Precision(准确率);F1-Meature(综合评价指标);true positives;false positives;false negatives..
- 聚类评价指标 Rand Index,RI,Recall,Precision,F1