您的位置:首页 > 其它

Precision和Recall:如何评价保安的能力

2017-09-15 09:51 141 查看

Precision和Recall:如何评价保安的能力

本文版权属于重庆大学计算机学院刘骥,禁止转载

Precision和Recall如何评价保安的能力
保安的能力评估

PrecisionRecall在机器学习中的定义

F1F_1及其他

保安的能力评估

保安对进出公司的人员进行盘查,识别其中的
小偷
。保安有可能犯两类错误:

1. 把
好人
误认为
小偷
,称为
假小偷
(与之相反称为
真小偷
)。

2. 把
小偷
误认为
好人
,称为
假好人
(与之相反称为
真好人
)。

保安优秀与否可以按照如下的两个标准来评判:

1. 抓住的
小偷
真小偷
的比例尽量的高。

2. 宁可错抓
好人
也不放过
小偷


标准1称为精准率(Precision),标准2称为召回率(Recall),对应的计算公式为:

Precision=抓住的真小偷数量抓住的真小偷数量+抓住的假小偷数量

Recall=抓住的真小偷数量抓住的真小偷数量+放走的假好人数量

为了更好的理解上述公式,假设某公司每天进出100人,其中80个
好人
,20个
小偷
,某保安的表现如下:

-实际上是小偷实际上是好人合计
抓住的小偷516
放走的好人157994
合计2080100
从上表可以看出,保安共计抓住6个
小偷
,其中5人是
真小偷
,另外1人是
假小偷
(好人被误抓),依据公式可知,该保安的Precision=55+1=56≈88.3%。看上去这名保安抓人的准确性挺强,但他是一名好保安吗?

来看看召回率的计算。Recall=55+15=14=25%。什么叫做
放走的假好人
?换句话,也就是被保安
误认为好人
小偷
。所以Recall的分母总是等于
小偷
的总数(而Precision的分母是
抓住的人
的总数)。从召回率可以看出,这名保安放走了34的
小偷
,这实在不能算优秀的保安。

再来看看另外一名保安的数据:

-实际上是小偷实际上是好人合计
抓住的小偷202040
放走的好人06060
合计2080100
根据上述公式计算,其Precision=50%,Recall=100%。虽然精度不高,误抓了不少好人,但这名保安抓住了全部到小偷。

理想的保安应该具有如下的表现:

-实际上是小偷实际上是好人合计
抓住的小偷20020
放走的好人08080
合计2080100
他的Precision和Recall都能够达到100%。

Precision、Recall在机器学习中的定义

现在我们准备用一个二分类的人工智能程序代替保安,如何对这个人工智能程序的能力进行评价呢?可以采用相同的标准。为了将评价问题泛化,使其能够针对所有的二分类问题(而不限于抓小偷),我们做出了如下定义:

1. 称
小偷
Positive
好人
Negative


2. 与之对应
真小偷
True Positive
(简写为TP),
假小偷
False Positive
(简写为FP)。

3. 与之对应
真好人
True Negative
(简写为TN),
假好人
False Negative
(简写为FN)。

于是人工智能抓小偷的表现可以用下表来表示:

-实际上是Positive实际上是Negative合计
判定为Positive20 (TP)20 (FP)40
判定为Negative0 (FN)60 (TN)60
合计2080100
对应Precision和Recall的公式表示为:

Precision=TPTP+FP

Recall=TPTP+FN

F1及其他

将Precision和Recall放到一个公式中,就构成了F1 Score,其公式如下:

F1=21Precision+1Recall=TPTP+FN+FP2

除此之外,还有其他评价标准,请参考其他书籍。
内容来自用户分享和网络整理,不保证内容的准确性,如有侵权内容,可联系管理员处理 点击这里给我发消息
标签:  机器学习
相关文章推荐