HDU 2459 Maximum repetition substring(后缀数组+RMQ-重复次数最多的子串)
2016-08-22 14:58
519 查看
传送门:http://acm.split.hdu.edu.cn/showproblem.php?pid=2459
思路:枚举子串的长度。这个思路很精髓,就是长度重复子串肯定会包含str[0],str[l],str[l * 2],str[l * 3]……中的相邻两个,然后我们求出相邻两个的最长公共前缀,然后算一下一共重复了几次,再把字符串往前推,是否能找到重复的起始位置,然后再一边用rank数组更新一下字符串的字典序等信息,细节挺多的,需要好好琢磨。
思路:枚举子串的长度。这个思路很精髓,就是长度重复子串肯定会包含str[0],str[l],str[l * 2],str[l * 3]……中的相邻两个,然后我们求出相邻两个的最长公共前缀,然后算一下一共重复了几次,再把字符串往前推,是否能找到重复的起始位置,然后再一边用rank数组更新一下字符串的字典序等信息,细节挺多的,需要好好琢磨。
#include <cstdio> #include <cstring> #include <algorithm> #include <cmath> #include <cstdlib> #include <cctype> #include <string> #include <iostream> #include <vector> #include <map> #include <set> #include <stack> #include <queue> #include <ctime> using namespace std; typedef long long ll; typedef pair<int, int> pii; #define pb push_back #define mp make_pair #define lson l,m,rt<<1 #define rson m+1,r,rt<<1|1 #define calm (l+r)>>1 const int INF = 2139062143; const int maxn=300010; struct SA{ #define F(x) ((x)/3+((x)%3==1?0:tb)) #define G(x) ((x)<tb?(x)*3+1:((x)-tb)*3+2) int wa[maxn],wb[maxn],wv[maxn],ws[maxn]; int rank[maxn],height[maxn]; int c0(int *r,int a,int b) {return r[a]==r[b]&&r[a+1]==r[b+1]&&r[a+2]==r[b+2];} int c12(int k,int *r,int a,int b){ if(k==2) return (r[a]<r[b])||(r[a]==r[b]&&c12(1,r,a+1,b+1)); else return (r[a]<r[b])||(r[a]==r[b]&&wv[a+1]<wv[b+1]); } void sort(int *r,int *a,int *b,int n,int m){ int i; for(i=0;i<n;i++) wv[i]=r[a[i]]; for(i=0;i<m;i++) ws[i]=0; for(i=0;i<n;i++) ws[wv[i]]++; for(i=1;i<m;i++) ws[i]+=ws[i-1]; for(i=n-1;i>=0;i--) b[--ws[wv[i]]]=a[i]; return; } void dc3(int *r,int *sa,int n,int m){ int i,j,*rn=r+n,*san=sa+n,ta=0,tb=(n+1)/3,tbc=0,p; r =r[n+1]=0; for(i=0;i<n;i++) if(i%3!=0) wa[tbc++]=i; sort(r+2,wa,wb,tbc,m); sort(r+1,wb,wa,tbc,m); sort(r,wa,wb,tbc,m); for(p=1,rn[F(wb[0])]=0,i=1;i<tbc;i++) rn[F(wb[i])]=c0(r,wb[i-1],wb[i])?p-1:p++; if(p<tbc) dc3(rn,san,tbc,p); else for(i=0;i<tbc;i++) san[rn[i]]=i; for(i=0;i<tbc;i++) if(san[i]<tb) wb[ta++]=san[i]*3; if(n%3==1) wb[ta++]=n-1; sort(r,wb,wa,ta,m); for(i=0;i<tbc;i++) wv[wb[i]=G(san[i])]=i; for(i=0,j=0,p=0;i<ta && j<tbc;p++) sa[p]=c12(wb[j]%3,r,wa[i],wb[j])?wa[i++]:wb[j++]; for(;i<ta;p++) sa[p]=wa[i++]; for(;j<tbc;p++) sa[p]=wb[j++]; return; } void calheight(int *r,int *sa,int n){ int i,j,k=0; for(i=1;i<=n;i++) rank[sa[i]]=i; for(i=0;i<n;height[rank[i++]]=k) for(k?k--:0,j=sa[rank[i]-1];r[i+k]==r[j+k];k++); return; } }rst; char str[maxn]; int r[maxn],sa[maxn],Case; int st[maxn][20]; void initRMQ(int len){ int x=floor(log2(len)); memset(st,127,sizeof st); for(int i=1;i<=len;i++)st[i][0]=rst.height[i]; for(int j=1;j<=x;j++){ for(int i=1;i<=len;i++){ st[i][j]=st[i][j-1]; if(i+(1<<j)-1<=len){ st[i][j]=min(st[i][j-1],st[i+(1<<(j-1))][j-1]); } } } } int queryRMQ(int l,int r){ l=rst.rank[l];r=rst.rank[r]; if(l>r)swap(l,r); l=l+1; int x=floor(log2(r-l+1)); return min(st[l][x],st[r-(1<<x)+1][x]); } int main(){ //freopen("D://input.txt","r",stdin); while(scanf("%s",str)!=EOF&&str[0]!='#'){ int len=strlen(str); if(len==1){ printf("Case %d: %c\n",++Case,str[0]); continue; } for(int i=0;i<len;i++)r[i]=str[i]; r[len]=0; rst.dc3(r,sa,len+1,300); rst.calheight(r,sa,len); initRMQ(len); int cnt=0,pos=0,w=0; for(int i=1;i<=len/2;i++){ for(int j=0;j+i<len;j+=i){ int lcp=queryRMQ(j,j+i); int now=lcp/i+1; int l=j-(i-lcp%i),k=j; if(l>=0&&lcp%i&&queryRMQ(l,l+i)>=lcp)now++,k=l; for(int m=k-1;m>=0&&m>j-i&&str[m]==str[m+i];m--){ if(rst.rank[m]<rst.rank[k]){ k=m; } } if(now>cnt){ cnt=now;pos=k;w=i; } else if(cnt==now&&rst.rank[pos]>rst.rank[k]){ cnt=now;pos=k;w=i; } } } printf("Case %d: ",++Case); str[pos+cnt*w]='\0'; printf("%s\n",str+pos); } return 0; }
相关文章推荐
- Poj 3693 & Hdu 2459 Maximum repetition substring (08合肥Online 后缀数组+RMQ 重复次数最多的连续重复子串)
- POJ 3693 Maximum repetition substring (寻找重复次数最多的连续子串)
- POJ-3693-Maximum repetition substring(后缀数组-重复次数最多的连续重复子串)
- POJ 3693 Maximum repetition substring (后缀数组+RMQ 求重复最多的连续子串)
- POJ 3693 Maximum repetition substring 后缀数组求重复次数最多子串
- 【POJ 3693】Maximum repetition substring 重复次数最多的连续重复子串
- POJ 题目 3693 Maximum repetition substring(后缀数组+RMQ+枚举求最小字典序的重复次数最多的子串)
- POJ 3693 Maximum repetition substring (后缀数组+RMQ 求重复最多的连续子串)
- poj 3693 Maximum repetition substring 重复次数最多的子串(若有多个 输出字典序最小的子串) 后缀数组 (DC3) (SA)
- POJ - 3693 Maximum repetition substring(后缀数组求重复次数最多的连续重复子串)
- POJ 3693 Maximum repetition substring(重复次数最多的连续子串 字典序最小)
- POJ 3693 Maximum repetition substring(后缀数组[重复次数最多的连续重复子串])
- POJ 3693 Maximum repetition substring (后缀数组+RMQ 求重复最多的连续子串)
- hdu 2459 后缀数组 求最多重复次数子串
- [后缀数组+枚举] hdu 2459 && poj 3693 Maximum repetition substring
- SPOJ 687 Repeats (后缀数组+RMQ 重复次数最多的连续重复子串)
- 后缀数组 POJ 3693 && hdu 2459 Maximum repetition substring
- hdu 2459 Maximum repetition substring(后缀数组)
- HDU 2459 PKU 3693 Maximum repetition substring 后缀数组 RMQ
- SPOJ题目687 Repeats(后缀数组+RMQ求重复次数最多的子串的重复次数)