您的位置:首页 > 其它

【模板】 字符串哈希

2017-08-16 14:41 176 查看
哈希(Hash)算法,即散列函数。它是一种单向密码体制,即它是一个从明文到密文的不可逆的映射,只有加密过程,没有解密过程。同时,哈希函数可以将任意长度的输入经过变化以后得到固定长度的输出。哈希函数的这种单向特征和输出数据长度固定的特征使得它可以生成消息或者数据。

纯裸的模板题

因为要使字符串的哈希值各不相同,所以要取一些奇奇怪怪的质数进行MOD,比如19260817(逃)

常见的质数 1e9+7,1e9+9,233,19260817,19660813 等

为了防止相同,经常会使用双膜数,即取两次模,判断是否相等,就能使运算更加精确。

刚刚知道有一种操作,unsigned long long 可以溢出自动取模,所以如果不刻意去卡的话,可以用unsigned long long去做。

//hash
#include <bits/stdc++.h>
#define MOD1 19260817
#define MOD2 19660813
#define base 133
using namespace std;
char s[1000000];
struct H{
int one,two;
}hs[10001];
int hash1(char s[])
{
int len=strlen(s);
int ans=0;
for(int i=0;i<len;i++)
{
ans=(ans*base+(int)s[i])%MOD1;
}
return ans;
}
int hash2(char s[])
{
int len=strlen(s);
int ans=0;
for(int i=0;i<len;i++)
{
ans=(ans*base+(int)s[i])%MOD2;
}
return ans;
}
int comp(H a,H b)
{
return a.one<b.one;
}
int main()
{
int n;
cin>>n;
for(int i=1;i<=n;i++)
{
scanf("%s",s);
hs[i].one=hash1(s);
hs[i].two=hash2(s);
}
int ans=1;
sort(hs+1,hs+n+1,comp);
for(int i=2;i<=n;i++)
if(hs[i].one!=hs[i-1].one||hs[i].two!=hs[i-1].two)
ans++;
cout<<ans<<endl;
return 0;
}
内容来自用户分享和网络整理,不保证内容的准确性,如有侵权内容,可联系管理员处理 点击这里给我发消息
标签: