您的位置:首页 > 其它

KMP算法

2018-03-08 17:00 127 查看
问题描述
给出一个字符串和多行文字,在这些文字中找到字符串出现的那些行。你的程序还需支持大小写敏感选项:当选项打开时,表示同一个字母的大写和小写看作不同的字符;当选项关闭时,表示同一个字母的大写和小写看作相同的字符。
输入格式
输入的第一行包含一个字符串 S,由大小写英文字母组成。
第二行包含一个数字,表示大小写敏感的选项,当数字为0时表示大小写不敏感,当数字为1时表示大小写敏感。
第三行包含一个整数 n,表示给出的文字的行数。
 接下来 n 行,每行包含一个字符串,字符串由大小写英文字母组成,不含空格和其他字符。
输出格式
输出多行,每行包含一个字符串,按出现的顺序依次给出那些包含了字符串 S 的行。
样例输入
Hello 
1
5
HelloWorld
HiHiHelloHiHi
GrepIsAGreatTool
HELLO
HELLOisNOTHello
样例输出HelloWorldHiHiHelloHiHiHELLOisNOTHello样例说明
在上面的样例中,第四个字符串虽然也是 Hello,但是大小写不正确。如果将输入的第二行改为0,则第四个字符串应该输出。
评测用例规模与约定
1<=n<=100,每个字符串的长度不超过100。

朴素的模式匹配算法
#include<stdio.h>
#include<string.h>
#include<stdlib.h>
int index_BM1(char *S, char *T)
{
int i;
int j;

i = 0;
j = 0;

while ( (i < strlen(S)) && (j < strlen(T)) )
{
if (S[i] == T[j])
{
i++;
j++;
}
else
{
i = i - j + 1;
j = 0;
}
}

/* 注意strlen(T)意味着j的取值范围为0 ~ (strlen(T) - 1) */
if (strlen(T) == j)
{
return 0;
}
else
{
return -1;
}
}
int index_BM0(char *S, char *T)
{
int i;
int j;

i = 0;
j = 0;

while ( (i < strlen(S)) && (j < strlen(T)) )
{
if (S[i] == T[j]||S[i] == T[j]+'a'-'A'||S[i] == T[j]-'a'+'A')
{
i++;
j++;
}
else
{
i = i - j + 1;
j = 0;
}
}

/* 注意strlen(T)意味着j的取值范围为0 ~ (strlen(T) - 1) */
if (strlen(T) == j)
{
return 0;
}
else
{
return -1;
}
}

int main()
{
int i,m,n;
char *s;
s=(char *)malloc(10*sizeof(char));
gets(s);
scanf("%d",&m);
scanf("%d",&n);
getchar();
char *str[10];
for(i=0;i<=n;i++){
str[i]=(char *)malloc(10*sizeof(char));
}
for(i=0;i<n;i++){
gets(str[i]);
}
if(m==1){
for(i=0;i<n;i++){
if(index_BM1(str[i],s)==0)
printf("%s\n",str[i]);

}
}
else
{
for(i=0;i<n;i++){
if(index_BM0(str[i],s)==0)
printf("%s\n",str[i]);

}
}
return 0;

}KMP算法#include<stdio.h>
#include<string.h>
#include<stdlib.h>
int next[100]={-999};

void get_next(char *T, int *next,int m)
{
int k = -1;
int j = 0;

next[j] = k;

if(m==1)
{while (j < strlen(T))
{
if ( (k == -1) || (T[j] == T[k]) ) //注意等号是==,而不是=
{
++k; // 注意是先加后使用
++j;
next[j] = k;
}
else
{
k = next[k];
}
}
}
else{
while (j < strlen(T))
{
if ( k == -1|| T[j] == T[k]|| T[j] == T[k]-'a'+'A'||T[j] == T[k]+'a'-'A') //注意等号是==,而不是=
{
++k; // 注意是先加后使用
++j;
next[j] = k;
}
else
{
k = next[k];
}
}
}
}
int index_KMP(char *S, char *T,int m)
{
int i,j;
i=0;
j=0;
int len1 = strlen(S);
int len2 = strlen(T);
if(m==1){
while ( i <len1 && j <len2 )
{
/* j = -1 表示next[0], 说明失配处在模式串T的第0个字符。所以这里特殊处理,然后令i+1和j+1。*/
if ( (j == -1) || S[i] == T[j])
{
i++;
j++;
}
else
{
j = next[j];
}
}

if (j>=len2)
{
return 0;
}
else
{
return -1;
}
}
else{
while ( i <len1 && j <len2 )
{
/* j = -1 表示next[0], 说明失配处在模式串T的第0个字符。所以这里特殊处理,然后令i+1和j+1。*/
if ( (j == -1) || S[i] == T[j]||S[i] == T[j]-'a'+'A'||S[i] == T[j]||S[i] == T[j]+'a'-'A')
{
i++;
j++;
}
else
{
j = next[j];
}
}

if (j>=len2)
{
return 0;
}
else
{
return -1;
}
}
}
void print_next(int next[], int n)
{
int i;

for (i = 0; i < n; i++)
{
printf("next[%d] = %d\n", i, next[i]);
}
}
int main()
{
int i,m,n;
int pos=0;
char *s;
s=(char *)malloc(10*sizeof(char));
gets(s);
scanf("%d",&m);
scanf("%d",&n);
getchar();
char *str[10];
for(i=0;i<=n;i++){
str[i]=(char *)malloc(10*sizeof(char));
}
for(i=0;i<n;i++){
gets(str[i]);
}
get_next(s,next,m);
for(i=0;i<n;i++){
if(index_KMP(str[i],s,m)!=-1)
printf("%s\n",str[i]);

}
return 0;

}
内容来自用户分享和网络整理,不保证内容的准确性,如有侵权内容,可联系管理员处理 点击这里给我发消息
标签: