您的位置:首页 > 其它

求数组中最长递增子序列

2008-07-31 18:37 429 查看
求数组中最长递增子序列[/b][/b]
写一个时间复杂度尽可能低的程序,求一个一维数组(N个元素)中的最长递增子序列的长度。
例如:在序列1,-1,2,-3,4,-5,6,-7中,其最长的递增子序列为1,2,4,6。

分析与解法[/b][/b]
根据题目的要求,求一维数组中的最长递增子序列,也就是找一个标号的序列b[0],b[1],…,b[m](0<=b[0]<b[1]<…<b[m]<N),使得array[b[0]]<array[b[1]]<…<array[b[m]]。

解法一[/b][/b]
根据无后效性的定义我们知道,将各阶段按照一定的次序排列好之后,对于某个给定的阶段状态来说,它以前各阶段的状态无法直接影响它未来的决策,而只能间接地通过当前的这个状态来影响。换句话说,每个状态都是历史的一个完整总结。
同样的,仍以序列1,-1,2,-3,4,-5,6,-7为例,我们在找到4之后,并不关心4之前的两个值具体是怎样,因为它对找到6没有直接影响。因此,这个问题满足无后效性,可以通过使用动态规划来解决。
可以通过数字的规律来分析目标串:1,-1,2,-3,4,-5,6,-7。
使用i来表示当前遍历的位置
当i=1时,显然,最长的递增序列为(1),序列长度为1.
当i=2是,由于-1<1。因此,必须丢弃第一个值后重新建立串。当前的递增序列为(-1),长度为1。
当i=3时,由于2>1,2>-1。因此,最长的递增序列为(1,2),(-1,2),长度为2。在这里,2前面是1还是-1对求出后面的递增序列没有直接影响。(但是在其它情况下可能有影响[/b])
依此类推之后,我们得出如下的结论。
假设在目标数组array[]的前i个元素中,最长递增子序列的长度为LIS[i]。那么,
LIS[i+1]=max{1,LIS[k]+1},array[i+1]>array[k],foranyk<=i
即如果array[i+1]大于array[k],那么第i+1个元素可以接在LIS[k]长的子序列后面构成一个更长的子序列。于此同时array[i+1]本身至少可以构成一个长度为1的子序列。
根据上面的分析,就可以得到代码清单
C++[/b]代码:[/b]
intMax(int*a,intn)
{
intmax=a[0];
for(inti=1;i<n;i++)
if(max<a[i])
max=a[i];
returnmax;
}
intLIS(vector<int>&array)
{
int*a=newint[array.size()];
for(inti=0;i<array.size();i++)
{
a[i]=1;//初始化默认的长度
for(intj=0;j<i;j++)//前面最长的序列
{
if(array[i]>array[j]&&a[j]+1>a[i])
{
a[i]=a[j]+1;
}
}
}
returnMax(a,array.size());
}
这种方法的时间复杂度为O(N2+N)=O(N2)

解法二[/b]
在前面的分析中,当考察第i+1个元素的时候,我们是不考虑前面i个元素的分布情况的。现在我们从另一个角度分析,即当考察第i+1个元素的时候考虑前面i个元素的情况。
对于前面i个元素的任何一个递增子序列,如果这个子序列的最大的元素比array[i+1]小,那么就可以将array[i+1]加在这个子序列后面,构成一个新的递增子序列。
比如当i=4的时候,目标序列为1,-1,2,-3,4,-5,6,-7最长递增序列为(1,2),(-1,2)。
那么,只要4>2,就可以把4直接增加到前面的子序列中形成一个新的递增子序列。
因此,我们希望找到前i个元素中的一个递增子序列,使得这个递增子序列的最大的元素比array[i+1]小,且长度尽量地长。这样将array[i+1]加在该递增子序列后,便可以找到以array[i+1]为最大元素的最长递增子序列。
仍然假设在数组的前i个元素中,以array[i]为最大元素的最长递增子序列的长度为LIS[i]。
同时,假设:
长度为1的递增子序列最大元素的最小值为MaxV[1];
长度为2的递增子序列最大元素的最小值为MaxV[2];
……
长度为LIS[i]的递增子序列最大元素的最小值为MaxV[LIS[i]];

本循环不变式P是:
P:k是序列a[0:i]的最长递增子序列的长度,0≤i<n。
容易看出,在由i-1到i的循环中,a[i]的值起关键作用。如果a[i]能扩展序列a[0;i-1]的最长递增子序列的长度,则k=k+1,否则k不变。设a[0;i-1]中长度为k的最长递增子序列的结尾元素是a[j](0≤j≤i-1),则当a[i]≥a[j]时可以扩展,否则不能扩展。如果序列a[0;i-1]中有多个长度为k的最长递增子序列,那么需要存储哪些信息?容易看出,只要存储序列a[0;i-1]中所有长度为k的递增子序列中结尾元素的最小值b[k]。因此,需要将循环不变式P增强为:
P:0≤i<n;k是序列a[0;i]的最长递增子序列的长度;
b[k]是序列a[0;i]中所有长度为k的递增子序列中最小结尾元素值。
相应地,归纳假设也增强为:已知计算序列a[0;i-1](i<n)的最长递增子序列的长度k以及序列a[0;i]中所有长度为k的递增子序列中的最小结尾元素值b[k]的正确算法。
增强归纳假设后,在由i-1到i的循环中,当a[i]≥b[k]时,k=k+1,b[k]=a[i],否则k值不变。注意到当a[i]≥b[k]时,k值增加,b[k]的值为a[i]。那么,当a[i]<b[k]时,b[l;k]的值应该如何改变?如果a[i]<b[l],则显然应该将b[l]的只改变为a[i],当b[l]≤a[i]≤b[k]时,注意到数组b是有序的,可以用二分搜索算法找到下标j,使得b[j-1]≤a[i]≤b[j]。此时,b[1;j-1]和b[j+1;k]的值不变,b[j]的值改变为a[i]。
/*Findslongeststrictlyincreasingsubsequence.O(nlogk)algorithm.*/
template<typenameT>vector<int>find_lis(vector<T>&a)
{
vector<int>b,p(a.size());//b是存储递增序列长度为k的最后元素下标
//比如b[1]是存储递增子序列最大元素的最小值的下标
//b是存储最长子序列的下标
intu,v;
if(a.size()<1)
returnb;
b.push_back(0);
for(inti=1;i<(int)a.size();i++)
{
if(a[b.back()]<a[i])
{
p[i]=b.back();
b.push_back(i);
continue;
}
for(u=0,v=b.size()-1;u<v;)//二分搜索
{
intc=(u+v)/2;
if(a[b[c]]<a[i])
u=c+1;
else
v=c;
}
if(a[i]<a[b[u]]){
if(u>0)
p[i]=b[u-1];
b[u]=i;
}
}
for(u=b.size(),v=b.back();u--;v=p[v])
b[u]=v;
returnb;
}
内容来自用户分享和网络整理,不保证内容的准确性,如有侵权内容,可联系管理员处理 点击这里给我发消息
标签: