您的位置:首页 > 其它

概率统计:条件独立

2015-06-14 12:39 197 查看




这个例子很好理解,A是熬夜,C是懒床,B是迟到。一般情况下,熬夜会增加懒床的概率,懒床会增加迟到的概率。当然,天气冷也会增加懒床的概率,堵车也会增加迟到的概率,现实生活中的可能性是很多的,我们现在只关注A熬夜和B迟到的概率P(A)、P(B)之间的关系。

  显然,熬夜发生的情况下,迟到的概率是增加的。但有一种情况例外:就是已经知道今天已经懒床了,同时不知道是否熬夜了,也不知道是否会迟到,这时候,熬夜和迟到发生的概率就无关了。因为懒床已经确定(不管是因为熬夜、天气冷、工作轻松或者是其它任何原因产生的)的情况下,懒床导致的迟到可能性也确定了,熬夜已经不可能通过增加懒床的概率来间接增加迟到的概率了,那么迟到的概率和和熬夜的概率也就没有依赖关系了,记为:熬夜
╨ 迟到 | 懒床。

  这种本来不是独立的随机事件,在满足一定条件下,他们独立了,这就叫有条件的独立,简称条件独立,可以帮助化简不少概率计算,在模式识别中也很有用。

  Definition:if A ╨ B|C (meaning A is independent of B given C) means that given evidence at C, A is independent of B。

  除了上面熬夜到迟到的例子,我们也可以用最直观的文氏图来说明这种情况:

首先,我们把全体I分为A和非A两部分






然后,我们引入C,从下图可以看出,A中C的比例要高于非A中C的比例,所以A和C相关






最后,我们引入B,从下图可以看出,C中B的比例要高于非C中B的比例,所以C和B相关,但是,对于C中的A和B的情况,可以看出无论A发生与否,B都是大约2/3的概率,对于非C中的A和B的情况来看,无论A发生与否,B都是大约1/2的概率,也就是说,一旦C确定,B的概率就确定了,和A无关。





转载来源:http://angeleyes.diandian.com/?p=244
内容来自用户分享和网络整理,不保证内容的准确性,如有侵权内容,可联系管理员处理 点击这里给我发消息
标签: