您的位置：首页 > 其它

初探IR [1] 向量空间模型 Vector Space Model

2008-05-31 14:35 801 查看

向量空间模型
这是信息检索中的最基本的方法之一。用在向量空间模型（Vector Space Model）中。向量空间模型在信息检索的应用中经常用到。
举个列子：
例如，现在有一组文档d1, d2, d3, 我们要在其中搜索 “Car Insurance”。对于Car和Insurance这两个词，我们知道它们在文档上的权重，如下：
d1 d2 d3
Car 0.13 0.8 0.99
Insurance 0.99 0.6 0.13
我们把这张表映射到一个二维的平面上，X轴Insurance，Y轴为Car。将d1,d2,d3以从原点出发的向量的形式标注在平面上，就可以看到三个向量。
而查询向量q为（0.71，0.71）(Normalized)。我们将q这个向量和其他三个向量做比较，同q夹角最小的那个文档向量就是我们要找的和“Car Insurance“相关性最大的文档。

向量相似度
我们使用文档同查询之间的余弦相似度或归一相关系数（Normalized Correlation Coefficient）来计算查询向量和文档向量之间的相似程度。

2 b continued...

内容来自用户分享和网络整理，不保证内容的准确性，如有侵权内容，可联系管理员处理

标签：

相关文章推荐

新的分享

章节导航