您的位置:首页 > 理论基础 > 计算机网络

主题式网络蜘蛛中,相关文本相似度的计算

2007-10-14 19:08 274 查看
关于相似度的计算,自己目前用的方法很简单,就是将经过人工取得到的主题词经过人工的给分之后,程序读到内存中,然后在需要分析的给定字符串中去查找是否有相关的词,如果有就加上相关的分值,,程序如下:

1{

9{

15{

21{

24{

35 score = score / (float)count;

36 }

37 return score;

38 }

39 #endregion

这样写也有不足,就是只有数据库中有相关的主题词时,才会计算到,如果有一些相关的主题词不在数据库中时,就计算不正确了,也希望高人能给些意见或代码.

作者:江南的俊马 http://www.21zhu.com
内容来自用户分享和网络整理,不保证内容的准确性,如有侵权内容,可联系管理员处理 点击这里给我发消息
标签: