hdu 1277 全文检索
2012-11-07 13:05
441 查看
描述见 题目链接: http://acm.hdu.edu.cn/showproblem.php?pid=1277 刚开始的想法是KMP算法,因为字符串匹配差不多这个已经是很多的了。。。。但是看着题目中说的关键字最多有10000个,每个字符长度最大60,原文最多有10000个。那么按照KMP算法的时间复杂度,最差的情况下时间复杂度是O(10000*(60+10000))。可想而知,超时那时肯定的了。。。但是我还是用KMP的算法打了一遍,就当再熟悉一下吧。。。不过后来慢慢的想单个处理KMP当然首选了,不过这个有10000个,那么我们想当然的想到了字典树,我们可以把这10000个关键字建立一个字典树存储,然后从根往下搜索,那么每次的时间复杂度最高只有60。。。所以时间复杂度降到了O(10000*60)。。这样就没有超时的危险了。。。以后做题的时候还是应该想想是不是我们基本不用的算法会处理我们意想不到的问题。。。。
具体代码:
//回归"大自然"。。。刚开始尝试的是KMP算法,不过超时,还是用到了暴力枚举,不是是字典树处理
#include
#include
#include
#include
#define N 600006
using namespace std;
struct data
{
int id;
charname[60],mes[66];
}ar[10005];
struct node
{
int id;
char c;
vector next;
}st
,*root;
char str[60060];
int n,m,now,flag[10005];
void Insert(char *p,int x)//建立字典树
{
int j,i,len,k;
node *h,*t=root;
for(i=0;p[i];i++)
{
len=t->next.size();
for(j=0;j
{
h=t->next[j];
if(h->c==p[i])break;
}
if(j>=len)
{
st[now].c=p[i];
st[now].id=-1;
st[now].next.clear();
t->next.push_back(&st[now]);
t=&st[now];
now+=1;
}
else
{
t=h;
}
}
t->id=x;
}
void init()//输入
{
int i,j=0,len=0;
char s[10005];
for(i=0;i
{
scanf("%s",s);
strcpy(str+len,s);
len+=strlen(s);
}
char ch;
root=new node();
root->id=-1;
now=0;
for(i=0;i
{
ar[i].id=-1;
j=0;
while(1)
{
ch=getchar();
if(ch=='\n')continue;
ar[i].name[j++]=ch;
if(ch==']')break;
}
ar[i].name[j]='\0';
scanf("%s",ar[i].mes);
Insert(ar[i].mes,i);
}
}
void get(int x)//对字典树进行遍历
{
int i,j,k=0,len;
node *h,*t=root;
while(str[x])
{
len=t->next.size();
if(len<=0)return;
for(i=0;i
{
h=t->next[i];
if(h->c==str[x])
{
if(h->id!=-1 &&ar[h->id].id==-1)//只记录最早的一次
{
ar[h->id].id=x-k;
}
t=h;
x+=1;
break;
}
}
if(i>=len)return;
k+=1;
}
}
int cmp(data p,data q)
{
return p.id
}
void make()
{
int i;
for(i=0;str[i];i++)
{
get(i);//统计从第i个字符开始的子串是否有关键字
}
sort(ar,ar+m,cmp);
i=0;
while(i
if(i>=m)
{
printf("No key can be found !\n");
return;
}
printf("Foundkey:");
for(;i
printf("\n");
}
int main()
{
while(scanf("%d%d",&n,&m)==2)
{
init();
make();
}
return 0;
}
具体代码:
//回归"大自然"。。。刚开始尝试的是KMP算法,不过超时,还是用到了暴力枚举,不是是字典树处理
#include
#include
#include
#include
#define N 600006
using namespace std;
struct data
{
int id;
charname[60],mes[66];
}ar[10005];
struct node
{
int id;
char c;
vector next;
}st
,*root;
char str[60060];
int n,m,now,flag[10005];
void Insert(char *p,int x)//建立字典树
{
int j,i,len,k;
node *h,*t=root;
for(i=0;p[i];i++)
{
len=t->next.size();
for(j=0;j
{
h=t->next[j];
if(h->c==p[i])break;
}
if(j>=len)
{
st[now].c=p[i];
st[now].id=-1;
st[now].next.clear();
t->next.push_back(&st[now]);
t=&st[now];
now+=1;
}
else
{
t=h;
}
}
t->id=x;
}
void init()//输入
{
int i,j=0,len=0;
char s[10005];
for(i=0;i
{
scanf("%s",s);
strcpy(str+len,s);
len+=strlen(s);
}
char ch;
root=new node();
root->id=-1;
now=0;
for(i=0;i
{
ar[i].id=-1;
j=0;
while(1)
{
ch=getchar();
if(ch=='\n')continue;
ar[i].name[j++]=ch;
if(ch==']')break;
}
ar[i].name[j]='\0';
scanf("%s",ar[i].mes);
Insert(ar[i].mes,i);
}
}
void get(int x)//对字典树进行遍历
{
int i,j,k=0,len;
node *h,*t=root;
while(str[x])
{
len=t->next.size();
if(len<=0)return;
for(i=0;i
{
h=t->next[i];
if(h->c==str[x])
{
if(h->id!=-1 &&ar[h->id].id==-1)//只记录最早的一次
{
ar[h->id].id=x-k;
}
t=h;
x+=1;
break;
}
}
if(i>=len)return;
k+=1;
}
}
int cmp(data p,data q)
{
return p.id
}
void make()
{
int i;
for(i=0;str[i];i++)
{
get(i);//统计从第i个字符开始的子串是否有关键字
}
sort(ar,ar+m,cmp);
i=0;
while(i
if(i>=m)
{
printf("No key can be found !\n");
return;
}
printf("Foundkey:");
for(;i
printf("\n");
}
int main()
{
while(scanf("%d%d",&n,&m)==2)
{
init();
make();
}
return 0;
}
相关文章推荐
- HDU 1277 - 全文检索
- hdu 1277 全文检索
- 解题报告:HDU_1277 全文检索 字典树
- hdu 1277 全文检索
- HDU 1277 全文检索 (Trie树应用 好题)
- hdu 1277 全文检索
- hdu 1277 全文检索(AC自动机)
- HDU 1277 全文检索
- HDU 1277 全文检索【AC自动机】
- HDU-1277 全文检索 AC自动机
- hdu 1277 全文检索
- hdu 1277 全文检索(ac自动机模板)
- hdu 1277 全文检索 (直接映射查找 || 自动机)
- HDU 1277 全文检索
- hdu 1277 全文检索
- hdu 1277 全文检索 ac 自动机
- HDOJ1277 全文检索(AC自动机)
- 最老程序员创业札记:全文检索、数据挖掘、推荐引擎应用8
- 最老程序员创业札记:全文检索、数据挖掘、推荐引擎应用11
- 关于jforum2.1.6的全文检索问题(采用lucene实现)