第八次作业Kendall's tau相似程度指标NO.3
2013-08-26 17:23
218 查看
两个序列,例如S1 = {a, b, c, d}、 S2 = {a, c, b, d},如何度量它们的相似程度,有很重要的应用背景,在投票决策、表达式搜索、top-k比较、乃至搜索引擎优化等问题上有广泛的应用ref1,ref2。Kendall's
tau则是其中一种度量指标。由同样元素组成,只是元素的排列顺序不同的两个序列,如果其顺序完全一致,则Kendall's tau值为1,如果完全反序其Kendall's tau值为0。
Kendall's tau具体的计算方式为:
1 - 2.0*reversions / (n * (n -1)),
其中n为序列本身的长度(两个序列的长度相同),reversions为逆序对的个数。
逆序对的计算方法是: 对于两个给定的序列S1 = {a, b, c, d}和S2 = {a, c, b, d}。分别找出两个序列的二元约束集。在这个例子中S1的所有二元约束集为{(a,b), (a,c), (a,d), (b,c), (b,d), (c,d)},S2的所有二元约束集为{(a,c), (a,b), (a,d), (c,b), (c,d), (b,d)}。比较两个二元约束集,其中不同的二元约束是(b,c)和(c,b),即逆序对的个数为1。
代入上面的计算公式可以得到这两个序列的Kendall's tau指标为:
1 - 2. * 1 / (4 * 3) = 2. / 3 = 0.833
输入:
两个由同样元素组成的序列,每行一个。序列长度一致,只是元素的排列顺序不同,里面的元素不重复。
输出:
对应的Kendall's tau指标值,保留到小数点后3位("%.3f\n")
样例输入:
a,b,c,d↵
a,c,b,d↵
样例输出:
0.833
tau则是其中一种度量指标。由同样元素组成,只是元素的排列顺序不同的两个序列,如果其顺序完全一致,则Kendall's tau值为1,如果完全反序其Kendall's tau值为0。
Kendall's tau具体的计算方式为:
1 - 2.0*reversions / (n * (n -1)),
其中n为序列本身的长度(两个序列的长度相同),reversions为逆序对的个数。
逆序对的计算方法是: 对于两个给定的序列S1 = {a, b, c, d}和S2 = {a, c, b, d}。分别找出两个序列的二元约束集。在这个例子中S1的所有二元约束集为{(a,b), (a,c), (a,d), (b,c), (b,d), (c,d)},S2的所有二元约束集为{(a,c), (a,b), (a,d), (c,b), (c,d), (b,d)}。比较两个二元约束集,其中不同的二元约束是(b,c)和(c,b),即逆序对的个数为1。
代入上面的计算公式可以得到这两个序列的Kendall's tau指标为:
1 - 2. * 1 / (4 * 3) = 2. / 3 = 0.833
输入:
两个由同样元素组成的序列,每行一个。序列长度一致,只是元素的排列顺序不同,里面的元素不重复。
输出:
对应的Kendall's tau指标值,保留到小数点后3位("%.3f\n")
样例输入:
a,b,c,d↵
a,c,b,d↵
样例输出:
0.833
import java.util.Scanner; /* * Kendall's tau相似程度指标 */ public class Main { public static int getRev(String [] inStr1, String [] inStr2){ int n = inStr1.length; String [] res1 = new String[(n-1)*n/2]; String [] res2 = new String[(n-1)*n/2]; for(int i=0,h=0;i<n-1;i++){ for(int j=i+1;j<n;j++){ res1[h] = inStr1[i]+inStr1[j]; res2[h++] = inStr2[i]+inStr2[j]; } } int reverse = 0; for(int i=0;i<res1.length;i++){ for(int j=0;j<res2.length;j++){ if(res1[i].equals(res2[j])){ reverse++; } } } return res1.length - reverse; } public static void main(String[] args) { Scanner in = new Scanner(System.in); String S1 = in.nextLine(); String S2 = in.nextLine(); String [] inStr1 = S1.split(","); String [] inStr2 = S2.split(","); int n = inStr1.length; int reversions = getRev(inStr1,inStr2); double val = 1 - 2.0*reversions/(n*(n-1)); System.out.printf("%.3f\n",val); } }
相关文章推荐
- Kendall's tau 相似程度指标
- Kendall's tau -- 相似程度指标
- Kendall's tau
- 创建SQL作业错误的解决方法(不能将值 NULL 插入列 'owner_sid',表 'msdb.dbo.sysjobs';列不允许有空值。) .
- 创建SQL作业错误的解决方法(不能将值 NULL 插入列 'owner_sid',表 'msdb.dbo.sysjobs';列不允许有空值。)
- Kendall’s tau-b,pearson、spearman三种相关性的区别(有空整理信息检索评价指标)
- 两幅相同大小图像的相似程度的两个评价指标-PSNR和SSIM
- 创建SQL作业错误的解决方法(不能将值 NULL 插入列 'owner_sid',表 'msdb.dbo.sysjobs';列不允许有空值。)
- POJ 2528 Mayor's Poster(还是线段树,外加离散化)
- << Oracle高可用>>部分书面作业 - 第九课 RAC+DG技术的应用
- hdu 2147 kiki's game, 入门基础博弈
- Programmer's Notepad 2.0.8 (build 718)
- 'HDEVNOTIFY' : missing storage-class or type specifiers
- mysql“Access denied for user 'root'@'localhost'”问题的解决
- 普林演算法 (Prim's algorithm)
- 关于webview调用js出现has no method 'toString'
- gem install nokogiri -v '1.6.6.2' 出错
- 关于gradle编译时'your_jdk_path\bin\java.exe'' finished with non-zero exit value 2
- Delphi 出现Never-build package 'a' requires always-build package 'b'错误的解决
- 删除N天前的归档日志 RMAN>delete archivelog until time 'sysdate-7' ;