您的位置：首页 > 理论基础 > 计算机网络

主题式网络蜘蛛中,相关文本相似度的计算

2007-10-14 19:08 274 查看

关于相似度的计算,自己目前用的方法很简单,就是将经过人工取得到的主题词经过人工的给分之后,程序读到内存中,然后在需要分析的给定字符串中去查找是否有相关的词,如果有就加上相关的分值,,程序如下:

1{

9{

15{

21{

24{

35 score = score / (float)count;

36 }

37 return score;

38 }

39 #endregion

这样写也有不足,就是只有数据库中有相关的主题词时,才会计算到,如果有一些相关的主题词不在数据库中时,就计算不正确了,也希望高人能给些意见或代码.

作者:江南的俊马 http://www.21zhu.com

内容来自用户分享和网络整理，不保证内容的准确性，如有侵权内容，可联系管理员处理

标签：

相关文章推荐

文本相似度计算--余弦定理和广义Jaccard系数
计算文本相似度-java实现
向量空间模型——计算文本（英文）相似度
文本相似度计算--余弦定理和广义Jaccard系数
搜索引擎研究---网络蜘蛛程序算法相关资料 Part III (共5部分)
simhash计算文本相似度
海量数据相似度计算之simhash短文本查找
tfidf算法+余弦相似度算法计算文本相似度
利用word分词来计算文本相似度
java文本相似度计算(Levenshtein Distance算法(中文翻译：编辑距离算法))----代码和详解
文本相似度计算--余弦定理和广义Jaccard系数
Java实现余弦定理计算文本相似度
关于文本相似度计算开发包的构想
simhash 文本相似度计算
文本相似度计算基本方法小结
计算机网络相关计算
海量数据相似度计算之simhash短文本查找
文本相似度计算之--- 编辑距离 && 最长公共子串
Python----python实现机器学习中的各种距离计算及文本相似度算法
【计算机网络】彻底明白IP地址——计算相关地址

新的分享

【Java面试】TCP协议为什么要设计三次握手？
深度学习与CV教程(11) | 循环神经网络及视觉应用
又一起 BGP 劫持事件，影响全球 200 多家云服务和 CDN 提供商
深度学习与CV教程(7) | 神经网络训练技巧 (下)
网络协议之:haproxy的Proxy Protocol代理协议
Nginx实现https、重定向https
NLP教程(9) - 句法分析与树形递归神经网络
艾瑞咨询：2020年中国疫情时期网络长视频内容价值回顾及探索
每天一个 HTTP 状态码 206
每天一个 HTTP 状态码 205
每天一个 HTTP 状态码 204
每天一个 HTTP 状态码 203

章节导航