开源:给每个文档计算一个指纹,然后用指纹进行相似度的计算 含源码和可执行程序
2013-01-25 16:37
519 查看
开源:给每个文档计算一个指纹,然后用指纹进行相似度的计算
****************************************************************************************************
最新版5.0下载地址
http://pan.baidu.com/s/1dDnNAtr
只要不少于5个汉字,计算都已经非常精确了,有任何问题请与我本人联系:QQ 99923309
[b]更新日期 2015-04-17[/b]
[b]****************************************************************************************************
[/b]
TextSimilarity textSimilarity =newTextSimilarity();
//计算文章相似度指纹
int SourceFingerprint = textSimilarity.CalcTextFingerprint(SourceText);
int DestFingerprint = textSimilarity.CalcTextFingerprint(DestText);
//对指纹进行比较,计算相似度
var Similarity = textSimilarity.CalcTextSimilarity(SourceFingerprint, DestFingerprint);
。。。。。。
咱们顺便再分析一下百度新闻啊
看到图上说的多少条相同新闻了吗?
咱们点进去看看,这是一个怎样的检索命令啊
看到了吧,这个命令很明显就是按照文档的指纹来判断是否相同的,指纹相同那么新闻肯定内容也就是大致相同的了
在看看咱这个代码计算出来的指纹吧
看到这会大家可能有点感觉了吧?
到了这里懂编程的朋友可以直接下载代码编译运行运行,体验体验啊
http://pan.baidu.com/share/link?shareid=314821&uk=201606611
不懂编程的朋友可以下载安装,安装好了,运行找找感觉啊!
http://pan.baidu.com/share/link?shareid=314822&uk=201606611
有任何疑问请与我交流QQ群:74965947,
72133568,27236303,16592133,204725117,204724518
****************************************************************************************************
最新版5.0下载地址
http://pan.baidu.com/s/1dDnNAtr
只要不少于5个汉字,计算都已经非常精确了,有任何问题请与我本人联系:QQ 99923309
[b]更新日期 2015-04-17[/b]
[b]****************************************************************************************************
[/b]
TextSimilarity textSimilarity =newTextSimilarity();
//计算文章相似度指纹
int SourceFingerprint = textSimilarity.CalcTextFingerprint(SourceText);
int DestFingerprint = textSimilarity.CalcTextFingerprint(DestText);
//对指纹进行比较,计算相似度
var Similarity = textSimilarity.CalcTextSimilarity(SourceFingerprint, DestFingerprint);
。。。。。。
咱们顺便再分析一下百度新闻啊
看到图上说的多少条相同新闻了吗?
咱们点进去看看,这是一个怎样的检索命令啊
看到了吧,这个命令很明显就是按照文档的指纹来判断是否相同的,指纹相同那么新闻肯定内容也就是大致相同的了
在看看咱这个代码计算出来的指纹吧
看到这会大家可能有点感觉了吧?
到了这里懂编程的朋友可以直接下载代码编译运行运行,体验体验啊
http://pan.baidu.com/share/link?shareid=314821&uk=201606611
不懂编程的朋友可以下载安装,安装好了,运行找找感觉啊!
http://pan.baidu.com/share/link?shareid=314822&uk=201606611
有任何疑问请与我交流QQ群:74965947,
72133568,27236303,16592133,204725117,204724518
相关文章推荐
- 开源:给每个文档计算一个指纹,然后用指纹进行相似度的计算 含源码和可执行程序
- Python:遍历一个目录下所有的文件及文件夹,然后计算每个文件的字符和line的小程序
- 使用VSM计算文档相似度的一个程序示例
- 编写一个C#程序,要求定义一个行数和列数相等的二维数组, 并执行初始化,然后计算并输出数组两条对角线上的元素之和。
- 编写一个程序,要求用户输入最多10个高尔夫成绩,并将其存储在一个数组中。 程序允许用户提早结束输入,并在一行上显示所有成绩,然后报告平均成绩。 请使用3个数组处理函数来分别进行输入、显示和计算
- 使用Olami SDK实现一个语音输入数字进行24点计算的iOS程序
- Python源码分析2 - 一个简单的Python程序的执行
- 编写程序,提示用户输入5个学生的5门课程的成绩,然后计算每个学生的总分和
- JAVA--封装三角型 梯形 圆形三个类,用一个程序执行入口对三类对象进行测试
- 编写一个程序,在E盘下创建一个abc.txt的文本文档,通过输出流在文档内添加数据,然后在把abc.txt复制到F盘下
- 编写一个程序,要求用户输入下限整数和一个上限整数,然后,依次计算从下限到上限的每一个整数的平方的加和,最后显示结果
- Python源码分析2 - 一个简单的Python程序的执行
- 华为计算字符个数写出一个程序,接受一个有字母和数字以及空格组成的字符串,和一个字符,然后输出输入字符串中含有该字符的个数。不区分大小写。
- 使用Olami SDK实现一个语音输入数字进行24点计算的iOS程序
- C primer plus 第七章 练习4: 利用if else语句编写程序读取输入,直到#, 用一个感叹号代替每个句号,将原有的每个感叹号用两个感叹号代替,最后报告进行了多少次替代。
- 有五个学生,每个学生有3门课(语文、数学、英语)的成绩,写一个程序接收从键盘输入学生的信息,输入格式为:name,30,30,30(姓名,三门课成绩), 然后把输入的学生信息按总分从高到低的顺序写入
- 一个文本字符串相似度计算的小程序
- poj 1651 DP 从一个序列中任意选一个数,进行某种计算,然后移除这个数,直到最后
- 在股市的交易日中,假设最多可进行两次买卖(即买和卖的次数均小于等于2),规则是必须一笔成交后进行另一笔(即买-卖-买-卖的顺序进行)。给出一天中的股票变化序列,请写一个程序计算一天可以获得的最大收益。
- // 编写一个程序,在E盘下创建一个abc.txt的文本文档,通过输出流在文档内添加数据,然后在把abc.txt复制到F盘下