您的位置:首页 > 其它

BZOJ 3790 浅谈MANACHER算法+求区间最小覆盖集经典贪心

2017-07-27 21:57 453 查看


世界真的很大

处理回文串的算法有很多,后缀数组等等,但对于manacher这种专为回文串而生的算法来说,写起来自然是比较简单的

所以说借这道题简单总结一下manacher算法吧

看题先:

description:

母亲节就要到了,小 H 准备送给她一个特殊的项链。这个项链可以看作一个用小写字
母组成的字符串,每个小写字母表示一种颜色。为了制作这个项链,小 H 购买了两个机器。第一个机器可以生成所有形式的回文串,第二个机器可以把两个回文串连接起来,而且第二个机器还有一个特殊的性质:假如一个字符串的后缀和一个字符串的前缀是完全相同的,那么可以将这个重复部分重叠。例如:aba和aca连接起来,可以生成串abaaca或 abaca。现在给出目标项链的样式,询问你需要使用第二个机器多少次才能生成这个特殊的项链。


input

输入数据有多行,每行一个字符串,表示目标项链的样式。


output

多行,每行一个答案表示最少需要使用第二个机器的次数。


首先翻译一下题目,还是挺好懂的:

给出一个字符串(len<=10^5),求这个字符串最少由几个回文串拼

接而成。注意拼接时可以把重复部分重叠起来,如: aba 和aca可以拼接成abaaca 或abaca。

由于是上课时老师讲完manacher自然给出的模板题,所以也自然没有什么自己思考的思路可言,但还是对思路流程做一个总结

首先看到回文串就需要往回文串处理工具方面想,manacher,后缀数组等等(说起来好像还没写过后缀数组的总结,这玩意儿也挺重要的)

然后题目要求是说最少由多少个回文串能拼成原字符串,考虑回文串可重叠,就是说最少多少个区间(回文串)能完美覆盖原长序列,这是一个很经典的贪心方案

总的来说就是从题目大概提及的方向入手,寻找自己熟悉的模型

然后我们发现,对于回文串的需求仅仅在于我们需要给定的区间来完成贪心,而对于同一个点,以其为中心的回文串有大有小,而既然数量都是1,肯定优先选择最大的回文串,就算重复区域较大也不会对答案有消极影响

所以我们就需要以每个点为中心的最长回文串的长度

然后在脑海里处理之前想到的处理回文串的工具,发现这道题要求的信息其实并不高,正好是manacher能解决的问题,且manacher好写好调,主算法get

还是谈一下这个经典的贪心模型

区间问题贪心有很多种了,这个是贪心用最少的区间覆盖原序列

DP加上数据结构优化肯定能做,但还是不考虑了

首先既然要覆盖原长,那么最左端点肯定需要被覆盖,我们肯定会首先选取左端点在序列最左边的区间,在这样的区间中,我们肯定会选择右端点覆盖的尽量远的点,因为可重叠,所以每一次选取的区间尽量大肯定是更优的

然后我们会选择左端点在现有已覆盖区间内,覆盖范围最大的点,以此类推

所谓贪心大概就是先想想怎么由现有状态在不会对后继状态造成消极影响的情况下,选择最优的方案,再把方案的选择方法,程序化

我们发现每次我们都是先确定左端点的范围,再在其中找一个右端点覆盖最大的点

所以我们优先对区间左端点从小到大排序,在左端点相同的情况下,对右端点从大到小排序,这样子在之后顺序选择的时候,就正好是我们贪心时的策略了,所谓程序化

还是有点细节需要注意:

manacher时为了避免奇偶回文串的尴尬常常在相邻字符串间加入’#’等符号隔开,然后在最后和末尾加上不同的且均不在原字符串中出现过的符号防止匹配时越界,比如:

如:ababa ->

a #b # a # b #a #。这样就将回文中心是字符和字符间隔两种情况统一起来

了。而为了避免溢出(因为’\0’==‘\0’),再在串头串尾加上没有出现过的不同的字符,如’+’,‘-’之类的,即变为了+#a#b#a#b#a#-

但是尽量不要写成+a#b#a#b#a-,会WA,不知为何,不及细想,欢迎留言讨论指点

完整代码:

#include<stdio.h>
#include<cstring>
#include<string.h>
#include<algorithm>
using namespace std;

struct speech
{
int lf,rg;
}sph[100010];

int pal[100010];
int tot,ans,n,m;
char ss[100010],tmp[100010];

bool cmp(const speech &a,const speech &b)
{
if(a.lf==b.lf) return a.rg>b.rg;
return a.lf<b.lf;
}

void add(int lf,int rg)
{
tot++;
sph[tot].lf=lf;
sph[tot].rg=rg;
}

void init()
{
ans=0,tot=0,m=0,n=0;
memset(pal,0,sizeof(pal));
memset(ss,0,sizeof(ss));
memset(tmp,0,sizeof(tmp));
}

void transfer(char *s)
{
n=strlen(s);
ss[0]='+';
for(int i=0;i<=n;i++)
ss[i*2+2]=s[i],ss[i*2+1]='#';
ss[2*n+2]='-';
}

void manacher(char *s)
{
int mx=0,id=0;
m=strlen(s+1);m--;
for(int i=1;i<=m;i++)
{
if(mx>=i) pal[i]=min(mx-i+1,pal[2*id-i]);
else pal[i]=1;
while(s[i+pal[i]]==s[i-pal[i]])
pal[i]++;
if(pal[i]+i-1>mx)
mx=pal[i]+i-1,id=i;
add(i-pal[i]+1,i+pal[i]-1);
}
}

int main()
{
while(scanf("%s",tmp)!=EOF)
{
transfer(tmp);
manacher(ss);
sort(sph+1,sph+tot+1,cmp);
int k=2,rg=sph[1].rg;
while(rg<m)
{
int now=rg;
while(k<=tot && sph[k].lf<=rg+1)
now=max(now,sph[k].rg),k++;
rg=now,ans++;
}
printf("%d\n",ans);
init();
}
return 0;
}
/*
Whoso pulleth out this sword from this stone and anvil is duly born King af all England
*/


嗯,就是这样
内容来自用户分享和网络整理,不保证内容的准确性,如有侵权内容,可联系管理员处理 点击这里给我发消息
标签: