您的位置：首页 > 其它

HDU 3746 KMP的运用。【求字符串添加几个字符，可以成有循环节字符串】

2016-08-19 12:37 267 查看

比如

a，添加一个a变为aa，循环节为a

abcab添加一个c，变为[abc][abc]循环节为abc

abcxxxa 添加bcxxx变为abcxxxabcxxx，循环节为abcxxx

做法：

next数组的实际含义是， s[0] .....s[next[i] - 1] 的字符串，与s[i - next[i]]...s[i]这两段字符串是完全相同的。

显然，对于next[len]，如果相同的两串字符串和上图一样是红色的部分，那么循环节一定是绿色的部分。

原因是，如果有更短的，无论如何，最后红色的部分一定有一部分是循环节的一部分。如果循环节更短的话，（右边的绿色向左边移动一些），那么右边红色部分作为一个循环的起点显然是不够的…… 所以这就是最小的循环节了。

如果利用next[i]得到的两个相同的区域，是上图蓝色的区域（有重叠部分），那么循环节一定是绿色的部分。

（我的图错啦！！绿色应该框左边的绿色，不是右边的！）

嗯，你想象绿色在左边……（因为我不想画图了）

首先简单说明为什么这样是对的。

左边两块绿色是完全相同的。（因为两个串的首部一定是相同的）

然后第二个绿色方框，不仅是第二个串的前缀，还是第一个串的一部分。把两个方框看为一个整体，视为第一个串的一部分的话。可以得到

三个绿色方框的字符都是相同的……

最终可以证明出，绿色方框是循环串的一部分。

但是为啥绿色就是最小的？

假设绿色方框变小一点点……变为下图红色的那样

至少说，我们不能保证这2个红色串是相同的……

【假设】两个红色部分是相同的，假设这是一个合法情况，那么会出现什么情况呢？

对，情况就是，蓝色部分一定是画错了…… 第二个蓝色部分的开始位置一定是图中2个红色方框结合的位置……

所以我们可以得到一个循环节长度的公式：

cir = len - next[len] (公式由上2个图得到，化简后结果为这个。一个式子满足上述2个图的情况，所有下标为从0开始。 KMP程序采用前面我的程序模板)

特判1：整个串为 abcd的情况（没有重复部分）

特判2：整个串为a一个字母的情况(需要整体复制一份……)

然后这题就做完了。

/*
#include <bits/stdc++.h>
#include <ext/pb_ds/priority_queue.hpp>
#include <tr1/unordered_map>
#include <ctime>
using std::tr1::unordered_map;
*/

#include <iostream>
#include <cstring>
#include <queue>
#include <algorithm>
#include <cstdio>
#include <map>
using namespace std;

/*
using std::sort;
using std::bitset;
using std::max;
using std::cout;
using std::stack;
using std::cin;
using std::endl;
using std::swap;
using std::pair;
using std::vector;
using std::set;
using std::map;
using std::multiset;
using std::queue;
using std::greater;
using std::string;
using std::priority_queue;
using std::max_element;
using std::min_element;

using __gnu_pbds::pairing_heap_tag;
__gnu_pbds::priority_queue<int, greater<int>, pairing_heap_tag> heap;
#define Hash unordered_map
*/
#define pr(x) cout<<#x<<" = "<<x<<" "
#define prln(x) cout<<#x<<" = "<<x<<endl

#define lson o*2, L, M
#define rson o*2+1, M + 1,R

#define MAXN 1000010

//pattern为模板串，从0下标，长度为len。返回next数组
template<typename T>
void kmp_pre(T pattern[], int len, int next[])
{
next[0] = next[1] = 0;
for(int i = 1 ; i < len ; i++)
{
int j = next[i];
while(j && pattern[i] != pattern[j])
j = next[j];
next[i+1] = pattern[i] == pattern[j] ? j+1 : 0;
}
}

//text为匹配串，lenT为其长度。pattern为模板串，lenP为其长度，next为上面得到的next数组。
//返回一个vector，表示所有匹配成功的在text的下标（从0开始）
//还返回一个true/false表示是否有匹配成功的
template<typename T>
bool find(T text[], int lenT, T pattern[], int lenP, int next[], vector<int> &ret)//下标皆为从0开始
{
ret.clear();
int j = 0; //初始化在模式串第一个位置
for (int i = 0; i < lenT; ++ i)
{
while (j && pattern[j] != text[i]) j = next[j];
if (pattern[j] == text[i]) j++;
if (j == lenP)
{
ret.push_back(i-lenP+1);
}
}
return ret.size();
}
vector<int>ans;
int nxt[1000010];
char pattern[1000010], text[1000010];

void doit()
{
int lenP = strlen(pattern);
int pos = nxt[lenP];
int cir = lenP - pos;
if (cir == lenP) cout<< cir <<endl;
else if (lenP % cir == 0) cout << 0 << endl;
else
{
cout << cir - lenP % cir << endl;

}
}

int main()
{
int T;
scanf("%d\n", &T);
while (T--)
{
gets(pattern);
//gets(text);
int lenP = strlen(pattern);
//int lenT = strlen(text);
kmp_pre(pattern, lenP, nxt);
//find(text, lenT, pattern, lenP, nxt, ans);
doit();
}
return 0;
}

内容来自用户分享和网络整理，不保证内容的准确性，如有侵权内容，可联系管理员处理

标签：

相关文章推荐

新的分享

章节导航