HDU 3746 KMP的运用。【求字符串添加几个字符,可以成有循环节字符串】
2016-08-19 12:37
267 查看
比如
a,添加一个a变为aa,循环节为a
abcab添加一个c,变为[abc][abc]循环节为abc
abcxxxa 添加bcxxx变为abcxxxabcxxx,循环节为abcxxx
做法:
next数组的实际含义是, s[0] .....s[next[i] - 1] 的字符串,与s[i - next[i]]...s[i]这两段字符串是完全相同的。
![](https://img-blog.csdn.net/20160819122233772?watermark/2/text/aHR0cDovL2Jsb2cuY3Nkbi5uZXQv/font/5a6L5L2T/fontsize/400/fill/I0JBQkFCMA==/dissolve/70/gravity/Center)
显然,对于next[len],如果相同的两串字符串和上图一样是红色的部分,那么循环节一定是绿色的部分。
原因是,如果有更短的,无论如何,最后红色的部分一定有一部分是循环节的一部分。如果循环节更短的话,(右边的绿色向左边移动一些),那么右边红色部分作为一个循环的起点显然是不够的…… 所以这就是最小的循环节了。
![](https://img-blog.csdn.net/20160819122515478?watermark/2/text/aHR0cDovL2Jsb2cuY3Nkbi5uZXQv/font/5a6L5L2T/fontsize/400/fill/I0JBQkFCMA==/dissolve/70/gravity/Center)
如果利用next[i]得到的两个相同的区域,是上图蓝色的区域(有重叠部分),那么循环节一定是绿色的部分。
(我的图错啦!!绿色应该框左边的绿色,不是右边的!)
嗯,你想象绿色在左边……(因为我不想画图了)
首先简单说明为什么这样是对的。
![](https://img-blog.csdn.net/20160819122857420?watermark/2/text/aHR0cDovL2Jsb2cuY3Nkbi5uZXQv/font/5a6L5L2T/fontsize/400/fill/I0JBQkFCMA==/dissolve/70/gravity/Center)
左边两块绿色是完全相同的。(因为两个串的首部一定是相同的)
然后第二个绿色方框,不仅是第二个串的前缀,还是第一个串的一部分。把两个方框看为一个整体,视为第一个串的一部分的话。可以得到
![](https://img-blog.csdn.net/20160819123055600?watermark/2/text/aHR0cDovL2Jsb2cuY3Nkbi5uZXQv/font/5a6L5L2T/fontsize/400/fill/I0JBQkFCMA==/dissolve/70/gravity/Center)
三个绿色方框的字符都是相同的……
最终可以证明出,绿色方框是循环串的一部分。
但是为啥绿色就是最小的?
假设绿色方框变小一点点……变为下图红色的那样
![](https://img-blog.csdn.net/20160819123251788?watermark/2/text/aHR0cDovL2Jsb2cuY3Nkbi5uZXQv/font/5a6L5L2T/fontsize/400/fill/I0JBQkFCMA==/dissolve/70/gravity/Center)
至少说,我们不能保证这2个红色串是相同的……
【假设】两个红色部分是相同的,假设这是一个合法情况,那么会出现什么情况呢?
对,情况就是,蓝色部分一定是画错了…… 第二个蓝色部分的开始位置一定是图中2个红色方框结合的位置……
所以我们可以得到一个循环节长度的公式:
cir = len - next[len] (公式由上2个图得到,化简后结果为这个。一个式子满足上述2个图的情况,所有下标为从0开始。 KMP程序采用前面我的程序模板)
特判1:整个串为 abcd的情况(没有重复部分)
特判2:整个串为a一个字母的情况(需要整体复制一份……)
然后这题就做完了。
/*
#include <bits/stdc++.h>
#include <ext/pb_ds/priority_queue.hpp>
#include <tr1/unordered_map>
#include <ctime>
using std::tr1::unordered_map;
*/
#include <iostream>
#include <cstring>
#include <queue>
#include <algorithm>
#include <cstdio>
#include <map>
using namespace std;
/*
using std::sort;
using std::bitset;
using std::max;
using std::cout;
using std::stack;
using std::cin;
using std::endl;
using std::swap;
using std::pair;
using std::vector;
using std::set;
using std::map;
using std::multiset;
using std::queue;
using std::greater;
using std::string;
using std::priority_queue;
using std::max_element;
using std::min_element;
using __gnu_pbds::pairing_heap_tag;
__gnu_pbds::priority_queue<int, greater<int>, pairing_heap_tag> heap;
#define Hash unordered_map
*/
#define pr(x) cout<<#x<<" = "<<x<<" "
#define prln(x) cout<<#x<<" = "<<x<<endl
#define lson o*2, L, M
#define rson o*2+1, M + 1,R
#define MAXN 1000010
//pattern为模板串,从0下标,长度为len。 返回next数组
template<typename T>
void kmp_pre(T pattern[], int len, int next[])
{
next[0] = next[1] = 0;
for(int i = 1 ; i < len ; i++)
{
int j = next[i];
while(j && pattern[i] != pattern[j])
j = next[j];
next[i+1] = pattern[i] == pattern[j] ? j+1 : 0;
}
}
//text为匹配串,lenT为其长度。pattern为模板串,lenP为其长度,next为上面得到的next数组。
//返回一个vector,表示所有匹配成功的在text的下标(从0开始)
//还返回一个true/false表示是否有匹配成功的
template<typename T>
bool find(T text[], int lenT, T pattern[], int lenP, int next[], vector<int> &ret)//下标皆为从0开始
{
ret.clear();
int j = 0; //初始化在模式串第一个位置
for (int i = 0; i < lenT; ++ i)
{
while (j && pattern[j] != text[i]) j = next[j];
if (pattern[j] == text[i]) j++;
if (j == lenP)
{
ret.push_back(i-lenP+1);
}
}
return ret.size();
}
vector<int>ans;
int nxt[1000010];
char pattern[1000010], text[1000010];
void doit()
{
int lenP = strlen(pattern);
int pos = nxt[lenP];
int cir = lenP - pos;
if (cir == lenP) cout<< cir <<endl;
else if (lenP % cir == 0) cout << 0 << endl;
else
{
cout << cir - lenP % cir << endl;
}
}
int main()
{
int T;
scanf("%d\n", &T);
while (T--)
{
gets(pattern);
//gets(text);
int lenP = strlen(pattern);
//int lenT = strlen(text);
kmp_pre(pattern, lenP, nxt);
//find(text, lenT, pattern, lenP, nxt, ans);
doit();
}
return 0;
}
a,添加一个a变为aa,循环节为a
abcab添加一个c,变为[abc][abc]循环节为abc
abcxxxa 添加bcxxx变为abcxxxabcxxx,循环节为abcxxx
做法:
next数组的实际含义是, s[0] .....s[next[i] - 1] 的字符串,与s[i - next[i]]...s[i]这两段字符串是完全相同的。
显然,对于next[len],如果相同的两串字符串和上图一样是红色的部分,那么循环节一定是绿色的部分。
原因是,如果有更短的,无论如何,最后红色的部分一定有一部分是循环节的一部分。如果循环节更短的话,(右边的绿色向左边移动一些),那么右边红色部分作为一个循环的起点显然是不够的…… 所以这就是最小的循环节了。
如果利用next[i]得到的两个相同的区域,是上图蓝色的区域(有重叠部分),那么循环节一定是绿色的部分。
(我的图错啦!!绿色应该框左边的绿色,不是右边的!)
嗯,你想象绿色在左边……(因为我不想画图了)
首先简单说明为什么这样是对的。
左边两块绿色是完全相同的。(因为两个串的首部一定是相同的)
然后第二个绿色方框,不仅是第二个串的前缀,还是第一个串的一部分。把两个方框看为一个整体,视为第一个串的一部分的话。可以得到
三个绿色方框的字符都是相同的……
最终可以证明出,绿色方框是循环串的一部分。
但是为啥绿色就是最小的?
假设绿色方框变小一点点……变为下图红色的那样
至少说,我们不能保证这2个红色串是相同的……
【假设】两个红色部分是相同的,假设这是一个合法情况,那么会出现什么情况呢?
对,情况就是,蓝色部分一定是画错了…… 第二个蓝色部分的开始位置一定是图中2个红色方框结合的位置……
所以我们可以得到一个循环节长度的公式:
cir = len - next[len] (公式由上2个图得到,化简后结果为这个。一个式子满足上述2个图的情况,所有下标为从0开始。 KMP程序采用前面我的程序模板)
特判1:整个串为 abcd的情况(没有重复部分)
特判2:整个串为a一个字母的情况(需要整体复制一份……)
然后这题就做完了。
/*
#include <bits/stdc++.h>
#include <ext/pb_ds/priority_queue.hpp>
#include <tr1/unordered_map>
#include <ctime>
using std::tr1::unordered_map;
*/
#include <iostream>
#include <cstring>
#include <queue>
#include <algorithm>
#include <cstdio>
#include <map>
using namespace std;
/*
using std::sort;
using std::bitset;
using std::max;
using std::cout;
using std::stack;
using std::cin;
using std::endl;
using std::swap;
using std::pair;
using std::vector;
using std::set;
using std::map;
using std::multiset;
using std::queue;
using std::greater;
using std::string;
using std::priority_queue;
using std::max_element;
using std::min_element;
using __gnu_pbds::pairing_heap_tag;
__gnu_pbds::priority_queue<int, greater<int>, pairing_heap_tag> heap;
#define Hash unordered_map
*/
#define pr(x) cout<<#x<<" = "<<x<<" "
#define prln(x) cout<<#x<<" = "<<x<<endl
#define lson o*2, L, M
#define rson o*2+1, M + 1,R
#define MAXN 1000010
//pattern为模板串,从0下标,长度为len。 返回next数组
template<typename T>
void kmp_pre(T pattern[], int len, int next[])
{
next[0] = next[1] = 0;
for(int i = 1 ; i < len ; i++)
{
int j = next[i];
while(j && pattern[i] != pattern[j])
j = next[j];
next[i+1] = pattern[i] == pattern[j] ? j+1 : 0;
}
}
//text为匹配串,lenT为其长度。pattern为模板串,lenP为其长度,next为上面得到的next数组。
//返回一个vector,表示所有匹配成功的在text的下标(从0开始)
//还返回一个true/false表示是否有匹配成功的
template<typename T>
bool find(T text[], int lenT, T pattern[], int lenP, int next[], vector<int> &ret)//下标皆为从0开始
{
ret.clear();
int j = 0; //初始化在模式串第一个位置
for (int i = 0; i < lenT; ++ i)
{
while (j && pattern[j] != text[i]) j = next[j];
if (pattern[j] == text[i]) j++;
if (j == lenP)
{
ret.push_back(i-lenP+1);
}
}
return ret.size();
}
vector<int>ans;
int nxt[1000010];
char pattern[1000010], text[1000010];
void doit()
{
int lenP = strlen(pattern);
int pos = nxt[lenP];
int cir = lenP - pos;
if (cir == lenP) cout<< cir <<endl;
else if (lenP % cir == 0) cout << 0 << endl;
else
{
cout << cir - lenP % cir << endl;
}
}
int main()
{
int T;
scanf("%d\n", &T);
while (T--)
{
gets(pattern);
//gets(text);
int lenP = strlen(pattern);
//int lenT = strlen(text);
kmp_pre(pattern, lenP, nxt);
//find(text, lenT, pattern, lenP, nxt, ans);
doit();
}
return 0;
}
相关文章推荐
- hdu 3746 Cyclic Nacklace(求最少添加几个字符使得字符串是由n(n>=2)个循环节组成的)
- (KMP 1.4)hdu 3746 Cyclic Nacklace(使用next数组来求循环节的长度——求一个字符串需要添加多少个字符才能使该字符串的循环节的个数>=2)
- hdu 3746 kmp求字符串循环节
- hdoj 3746 Cyclic Nacklace 【kmp 求至少在结尾添加多少个字符可以凑够至少两次循环】
- hdu 3746 kmp求字符串循环节
- hdoj 3746 Cyclic Nacklace【KMP求在结尾加上多少个字符可以使字符串至少有两次循环】
- hdu_3746_kmp_给你一个字符串要求你添加最少的字符串使字符串最少循环两次
- HDU 3746 将字符串的全部字符最少循环2次需要添加的字符数
- HDU 3746 KMP 求最少需要在结尾后面补几个字符才能凑成至少两个循环
- HDU 3746 字符串匹配(字符串的最小循环节问题)
- HDU 3746利用KMP找循环节
- HDU 3746 KMP_Next 找循环节
- hdu 3746 Cyclic Nacklace (kmp扩展—最小循环节)
- [KMP-求循环节]HDU 3746 Cyclic Nacklace
- HDU 3746 Cyclic Nacklace (KMP找循环节)
- hdu 3746 Cyclic Nacklace(KMP 最短循环节)
- kmp的next数组的运用(求字符串的最小循环节)
- (KMP 1.5)hdu 1358 Period(使用next数组来求最小循环节——求到第i个字符的循环节数)
- HDU 3746 Cyclic Nacklace(KMP找循环节)
- kmp的next数组的运用(求字符串的最小循环节)