您的位置:首页 > 其它

字符串算法之最长公共子序列

2016-05-06 13:21 274 查看
最长公共子序列,即 longest common subsequence,LCS。一个字符串删掉任意字符后所形成的字符串,不要求连续,注意和最长公共子串的区别。

LCS的应用:论文查重,图形相似度比较,基因序列比较等。

暴力求解:

分别求出X、Y串的子序列,而后进行搜索比较,容易得到该算法复杂度为O(2^m · 2^n ),显然不可取

动态规划:

设有两个字符串X[1....m],Y[1....n],求其最长公共子串

假设Xi Yi为两个字符串从1开始数的第i个字符,若xm=yn,则xm必在最长公共子序列中,即

设Z为最长公共子串,那么 Z = LCS(Xm,Yn)= LCS(Xm-1, Yn-1) + xm;

若不相等,则 Z = max{LCS(Xm-1,Yn),LCS(Xm,Yn-1)};

则使用二维数组C[m]
, C[i][j]记录序列Xi和Yi的最长公共子序列的长度,当i或者j等于0时,公共子序列长度为0,即C[i][j]=0;

那么:



实现代码:





如果是要求出最长递增序列的,可将原序列排序后求两个序列的最长公共子序列。
内容来自用户分享和网络整理,不保证内容的准确性,如有侵权内容,可联系管理员处理 点击这里给我发消息
标签: