hdu5008 Boring String Problem,2014西安网络赛B题,后缀数组,RMQ
2014-09-14 20:17
405 查看
hdu5008 Boring String Problem。2014西安网络赛1002题。
295分钟惊险ac。
问一个串的不重复连续子串中,字典序第k小的子串是哪个。
如果存在多个同样的子串,要求输出l最小的那个。
显然,通过后缀数组可以求出所有的不同子串数。
对于某个点l,后缀长度减去height的值就是该点为左端点所能贡献的不同子串数量。
对于后缀排名靠前的点,以这个点为起始的所有子串都会比排名靠后的点为起始的子串字典序小。
这样,做后缀数组,统计每个起点能贡献多少个子串,再统计一下前缀和,二分就可以知道第k小的子串是哪个了。
但是对于相同的子串,需要找到l最小的那个出现位置。
这里可以注意到在后缀数组中,具有公共前缀的后缀排名相邻。
当找到重复串其中的第一个时,例如是[l,l+len-1],二分找到后缀数组中height值>=len的块的右界,再用一个RMQ求这段区间的sa值最小值就能找到l最小的那个位置了。复杂度O(nlognlogn),也可以预处理rmq长度做到O(nlogn)。
295分钟惊险ac。
问一个串的不重复连续子串中,字典序第k小的子串是哪个。
如果存在多个同样的子串,要求输出l最小的那个。
显然,通过后缀数组可以求出所有的不同子串数。
对于某个点l,后缀长度减去height的值就是该点为左端点所能贡献的不同子串数量。
对于后缀排名靠前的点,以这个点为起始的所有子串都会比排名靠后的点为起始的子串字典序小。
这样,做后缀数组,统计每个起点能贡献多少个子串,再统计一下前缀和,二分就可以知道第k小的子串是哪个了。
但是对于相同的子串,需要找到l最小的那个出现位置。
这里可以注意到在后缀数组中,具有公共前缀的后缀排名相邻。
当找到重复串其中的第一个时,例如是[l,l+len-1],二分找到后缀数组中height值>=len的块的右界,再用一个RMQ求这段区间的sa值最小值就能找到l最小的那个位置了。复杂度O(nlognlogn),也可以预处理rmq长度做到O(nlogn)。
#include<iostream> #include<cstdio> #include<cstring> using namespace std; #define maxn 101000 #define F(x) ((x)/3+((x)%3==1?0:tb)) #define G(x) ((x)<tb?(x)*3+1:((x)-tb)*3+2) int r[maxn*3],sa[maxn*3];//3×maxn!! int rank[maxn],height[maxn]; int wa[maxn],wb[maxn],wv[maxn],wd[maxn]; int c0(int *r,int a,int b) {return r[a]==r[b]&&r[a+1]==r[b+1]&&r[a+2]==r[b+2];} int c12(int k,int *r,int a,int b){ if(k==2) return r[a]<r[b]||r[a]==r[b]&&c12(1,r,a+1,b+1); else return r[a]<r[b]||r[a]==r[b]&&wv[a+1]<wv[b+1]; } void sort(int *r,int *a,int *b,int n,int m){ int i; for(i=0;i<n;i++) wv[i]=r[a[i]]; for(i=0;i<m;i++) wd[i]=0; for(i=0;i<n;i++) wd[wv[i]]++; for(i=1;i<m;i++) wd[i]+=wd[i-1]; for(i=n-1;i>=0;i--) b[--wd[wv[i]]]=a[i]; } void dc3(int *r,int *sa,int n,int m){ int i,j,*rn=r+n,*san=sa+n,ta=0,tb=(n+1)/3,tbc=0,p; r =r[n+1]=0; for(i=0;i<n;i++) if(i%3!=0) wa[tbc++]=i; sort(r+2,wa,wb,tbc,m); sort(r+1,wb,wa,tbc,m); sort(r,wa,wb,tbc,m); for(p=1,rn[F(wb[0])]=0,i=1;i<tbc;i++) rn[F(wb[i])]=c0(r,wb[i-1],wb[i])?p-1:p++; if(p<tbc) dc3(rn,san,tbc,p); else for(i=0;i<tbc;i++) san[rn[i]]=i; for(i=0;i<tbc;i++) if(san[i]<tb) wb[ta++]=san[i]*3; if(n%3==1) wb[ta++]=n-1; sort(r,wb,wa,ta,m); for(i=0;i<tbc;i++) wv[wb[i]=G(san[i])]=i; for(i=0,j=0,p=0;i<ta && j<tbc;p++) sa[p]=c12(wb[j]%3,r,wa[i],wb[j])?wa[i++]:wb[j++]; for(;i<ta;p++) sa[p]=wa[i++]; for(;j<tbc;p++) sa[p]=wb[j++]; } void calheight(int *r,int *sa,int *height,int *rank,int n){ int i,j,k; for (i=1;i<=n;i++)rank[sa[i]]=i; for (i=0,height[0]=k=0;i<n;height[rank[i++]]=k) for(k?k--:0,j=sa[rank[i]-1];r[i+k]==r[j+k];k++); } //_________________ int mi[maxn][18]; void lcpinit(int len,int *height){ int i,j,m=-1,tt=len; while(tt) {m++;tt>>=1;} for(i=1;i<=len;++i) mi[i][0]=height[i]; for(j=1;j<=m;++j) for(i=1;i<=len;++i){ if (i+(1<<(j-1))>len) mi[i][j]=mi[i][j-1]; else mi[i][j]=min(mi[i][j-1],mi[(1<<(j-1))+i][j-1]); } } int lcpquery(int l,int r){ l++; int m=-1,tt=r+1-l; while(tt) {m+=1;tt>>=1;} return min(mi[l][m],mi[r+1-(1<<m)][m]); } //------------------ //_________________ int mt[maxn][18]; void mininit(int len,int *sa){ int i,j,m=-1,tt=len; while(tt) {m++;tt>>=1;} for(i=1;i<=len;++i) mt[i][0]=sa[i]; for(j=1;j<=m;++j) for(i=1;i<=len;++i){ if (i+(1<<(j-1))>len) mt[i][j]=mt[i][j-1]; else mt[i][j]=min(mt[i][j-1],mt[(1<<(j-1))+i][j-1]); } } int query(int l,int r){ int m=-1,tt=r+1-l; while(tt) {m+=1;tt>>=1;} return min(mt[l][m],mt[r+1-(1<<m)][m]); } //------------------ char s[maxn]; long long sum[maxn]; int len; long long ll,rr; void search(long long vv){ int l=1,r=len+1,ans=r,m; while(l<=r){ m=(l+r)/2; if (sum[m]>=vv) { if (m<ans) ans=m; r=m-1; } else { l=m+1; } } if (ans==len+1) {ll=rr=0;return;} long long tmp2; tmp2=vv-sum[ans-1]+height[ans]; ll=ans; l=ll+1;r=len;ans=l-1; while(l<=r){ m=(l+r)/2; if (lcpquery(ll,m)>=tmp2){ if (m>ans) ans=m; l=m+1; } else r=m-1; } m=query(ll,ans); ll=m+1; rr=ll+tmp2-1; } int main(){ int i,tmp,tl,q; long long vv,v; while(scanf("%s",&s)!=EOF){ len=strlen(s); for(i=0;i<len;++i){ r[i]=s[i]-'a'+1; } r[len]=0; dc3(r,sa,len+1,30); calheight(r,sa,height,rank,len); lcpinit(len,height); mininit(len,sa); sum[0]=0; sum[1]=len-sa[1]; for(i=2;i<=len;++i){ tmp=height[i]; tl=len-sa[i]; sum[i]=sum[i-1]+tl-tmp; } sum[len+1]=1ll<<63; scanf("%d",&q); ll=rr=0; for(i=1;i<=q;++i){ scanf("%I64d",&v); vv=(ll^rr^v)+1; search(vv); printf("%I64d %I64d\n",ll,rr); } } return 0; }
相关文章推荐
- HDU 5008 Boring String Problem 后缀数组 RMQ
- hdu5008-Boring String Problem(后缀数组专题)
- 2014西安网络预选赛1002(后缀数组求第K大的子串)hdu5008
- HDU5008 Boring String Problem(后缀数组 + 二分 + 线段树)
- 后缀数组 - hdu5008 Boring String Problem
- 【后缀数组】 HDOJ 5008 Boring String Problem
- HDU 5008 Boring String Problem(西安网络赛B题)
- hdu 5008 Boring String Problem 【后缀数组】
- hdu 5008 Boring String Problem(后缀自动机构造后缀树)
- Hdu5008-Boring String Problem(后缀数组)
- HDU5008 Boring String Problem(后缀数组)
- 后缀数组(2014西安网络赛)hdu5008
- hdu5008 Boring String Problem 后缀数组+二分
- hdu6194 string string string 后缀数组 + RMQ
- HDU5008--Boring String Problem(SA+二分)
- HDU 5008西安网络赛B题:后缀数组求第k小子串
- HDU 6194 string string string 后缀数组 + RMQ(线段树)
- hdu5008 Boring String Problem(后缀数组)
- hdu 5008 Boring String Problem(后缀数组)
- hdu 5008 Boring String Problem