您的位置:首页 > 其它

动态规划之最长公共子序列

2012-08-05 12:58 253 查看

最长公共子序列(LCS):

数学中,某个序列的子序列是从最初序列通过去除某些元素但不破坏余下元素的相对位置而形成的新序列。
即新序列中每个元素在原来序列中的下标是严格递增的。

最长公共子序列即在找出一个序列Z,使其既是X的子序列又是Y的子序列。

朴素的算法是枚举X序列的所有子序列,在检查该序列是否也是Y序列的子序列。而n个元素的子集是2^n个,因此时间复杂度是指数级的,数据量大的话必然不行。

而最长公共子序列有以下两个性质:

1.2个序列的最长公共子序列包含了这2个序列的前缀的最长公共子序列。
2.最长公共子序列问题具有最优子结构性质。 



设序列X={x1,x2,…,xm}和Y={y1,y2,…,yn}的最长公共子序列为Z={z1,z2,…,zk} ,则
1.若xm=yn,则zk=xm=yn,且zk-1是xm-1和yn-1的最长公共子序列。
2.若xm≠yn且zk≠xm,则Z是xm-1和Y的最长公共子序列。
3.若xm≠yn且zk≠yn,则Z是X和yn-1的最长公共子序列。

因此,最长LCS问题可以用动态规划的方法来解。
由最优子结构性质可以建立如下的递推关系:



dp值从(0~n-1)*(0~m-1)更新一下即可,但最后求出的只是最长公共子序列的长度,没有记录下具体是什么子序列或有多少个这样的最长最长上升子序列。

即记录下所有最长公共子序列的路径。

仔细分析所有的DP值以及对应的两个序列的状态,如下图:
x:ABCBDAB   y:BDCABA





图中的黄色状态表示x[i]==y[j],白色表示x[i]!=y[i]。
可以看出dp值为4的黄色状态dp[i][j]是由(i-1~0)(j-1~0)且dp值为3黄色状态转移过来的,因此可以对所有的dp状态进行dfs,即可记录下所有的最长路径。

以下为代码:

#include <stdio.h>
#include <string.h>
#define max(a,b) ((a)>(b)?(a):(b))

const int N=101;
int m,n,dp

,vis

;
char x
,y
;

void LCS()//求DP值
{
memset(dp,0,sizeof(dp));
for(int i=0;i<n;i++)
for(int j=0;j<m;j++)
{
if(x[i]==y[j]) dp[i][j]=dp[i-1][j-1]+1;
else dp[i][j]=max(dp[i-1][j],dp[i][j-1]);
}
}

char path
;
void dfs(int cur,int l,int k,int maxdp)//dfs寻找路径
{
if(maxdp==0)
{
for(int i=cur-1;i>=0;i--) printf("%c",path[i]);//打印路径,注意是从后往前,因为只从最大的DP值开始找的。
printf("\n");
return;
}
if(l<0 || k<0) return ;
for(int i=l;i>=0;i--)
for(int j=k;j>=0;j--)
{
if(dp[i][j]==maxdp && x[i]==y[j] && !vis[i][j])
{
path[cur]=x[i];
vis[i][j]=1;
dfs(cur+1,i-1,j-1,maxdp-1);
vis[i][j]=0;
}
}
}

int main()
{
while(scanf("%d%d",&n,&m)!=EOF)
{
scanf("%s%s",x,y);
printf("%s\n",x);
printf("%s\n",y);
LCS();
printf("%d\n",dp[n-1][m-1]);
for(int i=0;i<n;i++)
{
for(int j=0;j<m;j++) printf("%d ",dp[i][j]);
printf("\n");
}
printf("\n");
dfs(0,n-1,m-1,dp[n-1][m-1]);
printf("\n");
}
return 0;
}
内容来自用户分享和网络整理,不保证内容的准确性,如有侵权内容,可联系管理员处理 点击这里给我发消息
标签:  zk path ini 算法 c