主题式网络蜘蛛中,相关文本相似度的计算
2007-10-14 19:08
274 查看
关于相似度的计算,自己目前用的方法很简单,就是将经过人工取得到的主题词经过人工的给分之后,程序读到内存中,然后在需要分析的给定字符串中去查找是否有相关的词,如果有就加上相关的分值,,程序如下:
1{
9{
15{
21{
24{
35 score = score / (float)count;
36 }
37 return score;
38 }
39 #endregion
这样写也有不足,就是只有数据库中有相关的主题词时,才会计算到,如果有一些相关的主题词不在数据库中时,就计算不正确了,也希望高人能给些意见或代码.
作者:江南的俊马 http://www.21zhu.com
1{
9{
15{
21{
24{
35 score = score / (float)count;
36 }
37 return score;
38 }
39 #endregion
这样写也有不足,就是只有数据库中有相关的主题词时,才会计算到,如果有一些相关的主题词不在数据库中时,就计算不正确了,也希望高人能给些意见或代码.
作者:江南的俊马 http://www.21zhu.com
相关文章推荐
- 文本相似度计算--余弦定理和广义Jaccard系数
- 计算文本相似度-java实现
- 向量空间模型——计算文本(英文)相似度
- 文本相似度计算--余弦定理和广义Jaccard系数
- 搜索引擎研究---网络蜘蛛程序算法相关资料 Part III (共5部分)
- simhash计算文本相似度
- 海量数据相似度计算之simhash短文本查找
- tfidf算法+余弦相似度算法计算文本相似度
- 利用word分词来计算文本相似度
- java文本相似度计算(Levenshtein Distance算法(中文翻译:编辑距离算法))----代码和详解
- 文本相似度计算--余弦定理和广义Jaccard系数
- Java实现余弦定理计算文本相似度
- 关于文本相似度计算开发包的构想
- simhash 文本相似度计算
- 文本相似度计算基本方法小结
- 计算机网络相关计算
- 海量数据相似度计算之simhash短文本查找
- 文本相似度计算之--- 编辑距离 && 最长公共子串
- Python----python实现机器学习中的各种距离计算及文本相似度算法
- 【计算机网络】彻底明白IP地址——计算相关地址