您的位置：首页 > 其它

【信息检索导论】第12章基于语言建模的信息检索模型

2013-08-17 18:38 465 查看

第12章基于语言建模的信息检索模型

语言模型

一类最简单的语言模型与一个概率有穷自动机等价。
在一元语言模型中，词出现的先后次序无关紧要，因此，这类模型也往往称为词袋模型

查询似然模型

查询似然模型（query likelihood model）我们对文档集中的每篇文档d 构建其对应的语言模型Md。我们的目标是将文档按照其与查询相关的似然P(d|q)排序。
最普遍的计算P(d|q)的方法是使用多项式一元语言模型，该模型等价于多项式朴素贝叶斯模型，其中这里的文档相当于后者中的类别，每篇文档在估计中都是一门独立的“ 语言” 。
在基于语言模型（简记为LM）的检索中，可以将查询的生成看成一个随机过程。具体的方法是：
(1) 对每篇文档推导出其LM；
(2) 估计查询在每个文档di 的LM 下的生成概率P(q|Md)
(3) 按照上述概率对文档进行排序。

内容来自用户分享和网络整理，不保证内容的准确性，如有侵权内容，可联系管理员处理

标签：

相关文章推荐

新的分享

章节导航

【信息检索导论】第12章 基于语言建模的信息检索模型

第12章 基于语言建模的信息检索模型

语言模型

查询似然模型

【信息检索导论】第12章基于语言建模的信息检索模型

第12章基于语言建模的信息检索模型