您的位置：首页 > 其它

【信息检索导论】第11章概率检索模型

2013-08-17 18:38 781 查看

第11章概率检索模型

概率排序模型

利用概率模型来估计每篇文档和需求的相关概率P(R=1|d,q)，然后对结果进行次序。这是PRP（probability ranking principle，概率排序原理）
最简单的PRP 情况是，检索没有任何代价因子，或者说不会对不同行为或错误采用不同的权重因子。在返回一篇不相关文档或者返回一篇相关文档不成功的情况下，将失去1 分（在计算精确率时这种基于二值的情形也往往称为1/0 风险）。而检索的目标是对于用户任意给定的k值，返回可能性最高的文档前k 篇作为结果输出。也就是说，PRP 希望可以按照P(R=1|d,q)值的降序来排列所有文档。当返回一个无序文档集而不是排序的结果时，可以通过贝叶斯最优决策原理（Bayes optimal decision rule）来基于最小损失风险作出决策，即返回相关的可能性大于不相关的可能性的文档

二值独立模型

本质上说，BIM 模型就是多元贝努利朴素贝叶斯模型。

概率模型的扩展

词项之间的树形依赖
BM25算法
IR中的贝叶斯网络方法：文档集网络、查询网络

内容来自用户分享和网络整理，不保证内容的准确性，如有侵权内容，可联系管理员处理

标签：

相关文章推荐

新的分享

章节导航

【信息检索导论】第11章 概率检索模型

第11章 概率检索模型

概率排序模型

二值独立模型

概率模型的扩展

【信息检索导论】第11章概率检索模型

第11章概率检索模型