poj3261(后缀数组+二分)
2016-08-07 16:23
260 查看
给定一个字符串,求至少出现 k 次的最长重复子串,这 k 个子串可以重叠。
二分长度,也是分组判定是否出现了k次,实际就是有没有组大于k的长度
#include<cstdio>
#include<cstring>
#include<cmath>
#include<cstdlib>
#include<algorithm>
using namespace std;
const int N=20005;
const int inf=0x3f3f3f3f;
int c[N*50],t1
,t2
,s
,sa
,height
,rank
,n,k;
void build_sa()
{
int m=1000005,*x=t1,*y=t2;
for (int i=0;i<m;i++) c[i]=0;
for (int i=0;i<n;i++) c[x[i]=s[i]]++;
for (int i=1;i<m;i++) c[i]+=c[i-1];
for (int i=n-1;i>=0;i--) sa[--c[x[i]]]=i;
for (int k=1;k<=n;k<<=1)
{
int p=0;
for (int i=n-k;i<n;i++) y[p++]=i;
for (int i=0;i<n;i++) if (sa[i]>=k) y[p++]=sa[i]-k;
for (int i=0;i<m;i++) c[i]=0;
for (int i=0;i<n;i++) c[x[y[i]]]++;
for (int i=1;i<m;i++) c[i]+=c[i-1];
for (int i=n-1;i>=0;i--) sa[--c[x[y[i]]]]=y[i];
swap(x,y);
x[sa[0]]=0;p=1;
for (int i=1;i<n;i++)
x[sa[i]]=y[sa[i]]==y[sa[i-1]]&&y[sa[i]+k]==y[sa[i-1]+k]?p-1:p++;
if (p>=n) break;
m=p;
}
}
void build_height()
{
int k=0;
for (int i=0;i<n;i++) rank[sa[i]]=i;
for (int i=0;i<n-1;i++)
{
if (k) k--;
int j=sa[rank[i]-1];
while (s[j+k]==s[i+k]) k++;
height[rank[i]]=k;
}
}
bool pan(int mid)
{
int t=0,h=inf;
for (int i=1;i<n;i++)
{
h=min(h,height[i]);
if (h<mid)
{
h=inf;t=1;
if (t>=k) return true;
continue;
}
t++;
if (t>=k) return true;
}
return false;
}
int main()
{
scanf("%d%d",&n,&k);
for (int i=0;i<n;i++) scanf("%d",&s[i]),s[i]++;
s[n++]=0;
build_sa();
build_height();
int l=0,r=n,mid,ans=0;
while (l<=r)
{
mid=(l+r)>>1;
if (pan(mid)) ans=mid,l=mid+1;
else r=mid-1;
}
printf("%d",ans);
return 0;
}
二分长度,也是分组判定是否出现了k次,实际就是有没有组大于k的长度
#include<cstdio>
#include<cstring>
#include<cmath>
#include<cstdlib>
#include<algorithm>
using namespace std;
const int N=20005;
const int inf=0x3f3f3f3f;
int c[N*50],t1
,t2
,s
,sa
,height
,rank
,n,k;
void build_sa()
{
int m=1000005,*x=t1,*y=t2;
for (int i=0;i<m;i++) c[i]=0;
for (int i=0;i<n;i++) c[x[i]=s[i]]++;
for (int i=1;i<m;i++) c[i]+=c[i-1];
for (int i=n-1;i>=0;i--) sa[--c[x[i]]]=i;
for (int k=1;k<=n;k<<=1)
{
int p=0;
for (int i=n-k;i<n;i++) y[p++]=i;
for (int i=0;i<n;i++) if (sa[i]>=k) y[p++]=sa[i]-k;
for (int i=0;i<m;i++) c[i]=0;
for (int i=0;i<n;i++) c[x[y[i]]]++;
for (int i=1;i<m;i++) c[i]+=c[i-1];
for (int i=n-1;i>=0;i--) sa[--c[x[y[i]]]]=y[i];
swap(x,y);
x[sa[0]]=0;p=1;
for (int i=1;i<n;i++)
x[sa[i]]=y[sa[i]]==y[sa[i-1]]&&y[sa[i]+k]==y[sa[i-1]+k]?p-1:p++;
if (p>=n) break;
m=p;
}
}
void build_height()
{
int k=0;
for (int i=0;i<n;i++) rank[sa[i]]=i;
for (int i=0;i<n-1;i++)
{
if (k) k--;
int j=sa[rank[i]-1];
while (s[j+k]==s[i+k]) k++;
height[rank[i]]=k;
}
}
bool pan(int mid)
{
int t=0,h=inf;
for (int i=1;i<n;i++)
{
h=min(h,height[i]);
if (h<mid)
{
h=inf;t=1;
if (t>=k) return true;
continue;
}
t++;
if (t>=k) return true;
}
return false;
}
int main()
{
scanf("%d%d",&n,&k);
for (int i=0;i<n;i++) scanf("%d",&s[i]),s[i]++;
s[n++]=0;
build_sa();
build_height();
int l=0,r=n,mid,ans=0;
while (l<=r)
{
mid=(l+r)>>1;
if (pan(mid)) ans=mid,l=mid+1;
else r=mid-1;
}
printf("%d",ans);
return 0;
}
相关文章推荐
- POJ3261---Milk Patterns(后缀数组+二分)
- poj3261(后缀数组+二分)
- 【POJ3261】Milk Patterns【后缀数组】【二分】
- poj3261(后缀数组--可重叠的k次最长重复子串+二分+离散化)
- 【后缀数组】【二分答案】poj3261
- poj3261 Milk Patterns【二分答案+后缀数组】
- bzoj1717(poj3261) [Usaco2006 Dec]Milk Patterns 产奶的模式(后缀数组,二分答案)
- POJ3261 Milk Patterns(后缀数组,二分)
- 【BZOJ1717&POJ3261】Milk Patterns(后缀数组,二分)
- POJ 3450 Corporate Identity(后缀数组+二分)
- PKU1743(Musical Theme)求不可重叠最长重复子串(后缀数组+二分)
- POJ3261 Milk Patterns,后缀数组, 出现k次的重复子串
- BZOJ_2946_[Poi2000]公共串_后缀数组+二分答案
- SPOJ 220 Relevant Phrases of Annihilation(后缀数组+二分答案)
- poj1743 Musical Theme(后缀数组--不可重叠最长重复子串+二分)
- BZOJ 2780: [Spoj]8093 Sevenk Love Oimaster( 后缀数组 + 二分 + RMQ + 树状数组 )
- poj1745(后缀数组+二分)
- 【POJ1743】Musical Theme(后缀数组,二分)
- POJ3261 求指定出现次数的可重叠的最长重复子串(后缀数组)
- |poj 1226|后缀数组|二分|Substrings