您的位置:首页 > 其它

【信息检索导论】第11章 概率检索模型

2013-08-17 18:38 781 查看

第11章 概率检索模型

概率排序模型

利用概率模型来估计每篇文档和需求的相关概率P(R=1|d,q),然后对结果进行次序。这是PRP(probability ranking principle,概率排序原理)
最简单的PRP 情况是,检索没有任何代价因子,或者说不会对不同行为或错误采用不同的权重因子。在返回一篇不相关文档或者返回一篇相关文档不成功的情况下,将失去1 分(在计算精确率时这种基于二值的情形也往往称为1/0 风险)。而检索的目标是对于用户任意给定的k值,返回可能性最高的文档前k 篇作为结果输出。也就是说,PRP 希望可以按照P(R=1|d,q)值的降序来排列所有文档。当返回一个无序文档集而不是排序的结果时,可以通过贝叶斯最优决策原理(Bayes optimal decision rule)来基于最小损失风险作出决策,即返回相关的可能性大于不相关的可能性的文档

二值独立模型

本质上说,BIM 模型就是多元贝努利朴素贝叶斯模型。

概率模型的扩展

词项之间的树形依赖
BM25算法
IR中的贝叶斯网络方法:文档集网络、查询网络
内容来自用户分享和网络整理,不保证内容的准确性,如有侵权内容,可联系管理员处理 点击这里给我发消息
标签: