您的位置:首页 > 其它

hdu 1277 全文检索

2012-11-07 13:05 441 查看
描述见 题目链接: http://acm.hdu.edu.cn/showproblem.php?pid=1277    刚开始的想法是KMP算法,因为字符串匹配差不多这个已经是很多的了。。。。但是看着题目中说的关键字最多有10000个,每个字符长度最大60,原文最多有10000个。那么按照KMP算法的时间复杂度,最差的情况下时间复杂度是O(10000*(60+10000))。可想而知,超时那时肯定的了。。。但是我还是用KMP的算法打了一遍,就当再熟悉一下吧。。。不过后来慢慢的想单个处理KMP当然首选了,不过这个有10000个,那么我们想当然的想到了字典树,我们可以把这10000个关键字建立一个字典树存储,然后从根往下搜索,那么每次的时间复杂度最高只有60。。。所以时间复杂度降到了O(10000*60)。。这样就没有超时的危险了。。。以后做题的时候还是应该想想是不是我们基本不用的算法会处理我们意想不到的问题。。。。
具体代码:

//回归"大自然"。。。刚开始尝试的是KMP算法,不过超时,还是用到了暴力枚举,不是是字典树处理

#include
#include
#include
#include
#define N 600006

using namespace std;

struct data
{
    int id;
    charname[60],mes[66];
}ar[10005];

struct node
{
    int id;
    char c;
    vector next;
}st
,*root;

char str[60060];
int n,m,now,flag[10005];

void Insert(char *p,int x)//建立字典树
{
    int j,i,len,k;
    node *h,*t=root;
    for(i=0;p[i];i++)
    {
       len=t->next.size();
       for(j=0;j
       {
          h=t->next[j];
          if(h->c==p[i])break;
       }
       if(j>=len)
       {
          st[now].c=p[i];
          st[now].id=-1;
          st[now].next.clear();
          t->next.push_back(&st[now]);
          t=&st[now];
          now+=1;
       }
       else
       {
           t=h;
       }
    }
    t->id=x;
}

void init()//输入
{
    int i,j=0,len=0;
    char s[10005];
    for(i=0;i
    {
       scanf("%s",s);
       strcpy(str+len,s);
       len+=strlen(s);
    }
    char ch;
    root=new node();
    root->id=-1;
    now=0;
    for(i=0;i
    {
       ar[i].id=-1;
       j=0;
       while(1)
       {
          ch=getchar();
          if(ch=='\n')continue;
          ar[i].name[j++]=ch;
          if(ch==']')break;
       }
       ar[i].name[j]='\0';
       scanf("%s",ar[i].mes);

       Insert(ar[i].mes,i);
    }
}

void get(int x)//对字典树进行遍历
{
    int i,j,k=0,len;
    node *h,*t=root;
    while(str[x])
    {
       len=t->next.size();
       if(len<=0)return;
       for(i=0;i
       {
          h=t->next[i];
          if(h->c==str[x])
           {
              if(h->id!=-1 &&ar[h->id].id==-1)//只记录最早的一次
              {
                ar[h->id].id=x-k;
              }
              t=h;
              x+=1;
              break;
           }
       }
       if(i>=len)return;
       k+=1;
    }
}

int cmp(data p,data q)
{
    return p.id
}
void make()
{
    int i;
   for(i=0;str[i];i++)
    {
       get(i);//统计从第i个字符开始的子串是否有关键字
    }
    sort(ar,ar+m,cmp);
    i=0;
    while(i
    if(i>=m)
    {
       printf("No key can be found !\n");
       return;
    }
    printf("Foundkey:");
    for(;i
    printf("\n");
}

int main()
{
   while(scanf("%d%d",&n,&m)==2)
    {
       init();
       make();
    }
    return 0;
}
内容来自用户分享和网络整理,不保证内容的准确性,如有侵权内容,可联系管理员处理 点击这里给我发消息
标签: