哈希表的创建
2015-10-06 22:28
387 查看
在记录的存储位置和它的关键字之间建立一个确定的对应关系f,使每个关键字和表中唯一的存储位置相对应,称这个对应关系f为哈希(散列)函数,根据这个思想建立的表为哈希表。
若key1≠key2, 而f(key1)=f(key2), 则这种现象称为冲突,且key1和key2对哈希函数f来说是同义词。
根据设定的哈希函数f=H(key)和处理冲突的方法,将一组关键字映像到一个有限的连续的地址集上,并以关键字在地址集中的”象”作为记录在表中的存储位置,这一映像过程,称为构造哈希表(散列表)。
哈希函数常见的构造方法有5种:
直接定址法、数字分析法、平方取中法、除留余数法、随机数法等。
注意,在使用除留余数法 H(key)=key Mod p (p≤m)时,对除数p的选择很重要,若p选的不好,则很容易产生同义词。一般,将p选为素数。
哈希函数处理冲突的方法常见的有2种:
a) 开放地址法
在该方法中,又细分为:线性探查法、平方探查法、伪随机数序列法、双哈希函数法等等。
b)拉链法
拉链法是把所有的同义词,用单链表链接起来的方法。在这种方法中,哈希表每个单元中存放的不再是记录本身,而是相应同义词单链表的头指针。
哈希表的平均查找长度ASL = F(α),即哈希表的平均查找长度只与装填因子α有关,与哈希表的长度n无关。哈希表的时间复杂度一般为O(1)。
例如,设计一个哈希表ha[0..m-1]存放n个元素,哈希函数采用除留余数法H(key)=key % p (p≤m), 解决冲突的方法采用开放定址法中的线性探查法。
1) 设计哈希表的类型;
2) 设计在哈希表中查找指定关键字的算法;
3) 设计在哈希表中删除指定关键字的算法;
4) 设计在哈希表中插入指定关键字的记录的算法;
5) 设计一组关键字建立哈希表的算法;
6) 设计输出哈希表的算法
7) 求查找成功时,平均查找长度的算法;
解:
哈希表 ha[0..m-1]
存放元素个数 n个
哈希函数 H(key)= key % p (p≤m)
线性探查法 Hi(k)=(H(k)+i)modm,(1≤i≤m−1)
1)设计哈希表的类型如下:
2)在哈希表中查找关键字为k的记录的过程:根据建表时设定的哈希函数H, 计算出哈希地址H(k), 若表中该地址单元不为空(关键字值NULLKEY表示为空)且该地址的关键字不等于k, 则按建表时设定的处理冲突的方法找下一个地址(这里采用线性探查法找下一个地址),如此反复下去,直到某个地址单位为空(查找失败,返回-1)或者关键字比较相等(查找成功,返回该地址)为止。对应的算法如下:
3) 在哈希表中删除关键字为k的记录的过程:采用开放定址法处理冲突的哈希表上执行删除操作,只能在被删记录上做删除标记,而不能真正删除记录。在这里设删除标记为DELKEY。对应的算法如下:
4) 插入算法首先调用查找算法,若在表中找到待插入的关键字,则插入失败;若在表中找到一个开放地址,则将待插入的结点插入其中,即插入成功。对应的算法如下:
5) 建立哈希表的过程:先要将表中个结点的关键字清空,使其地址为开放的,然后调用插入算法将给定的关键字序列依次插入表中。对应的算法如下:
6) 输出一个哈希表的算法如下:
7) 求查找成功时的平均查找长度的算法如下:
完整代码如下:
效果如下:
![](http://t2.qpic.cn/mblogpic/5b7a817a242a6df8dff6/2000.jpg)
图(1) 哈希函数选为 H(key)= key % 13
若key1≠key2, 而f(key1)=f(key2), 则这种现象称为冲突,且key1和key2对哈希函数f来说是同义词。
根据设定的哈希函数f=H(key)和处理冲突的方法,将一组关键字映像到一个有限的连续的地址集上,并以关键字在地址集中的”象”作为记录在表中的存储位置,这一映像过程,称为构造哈希表(散列表)。
哈希函数常见的构造方法有5种:
直接定址法、数字分析法、平方取中法、除留余数法、随机数法等。
注意,在使用除留余数法 H(key)=key Mod p (p≤m)时,对除数p的选择很重要,若p选的不好,则很容易产生同义词。一般,将p选为素数。
哈希函数处理冲突的方法常见的有2种:
a) 开放地址法
在该方法中,又细分为:线性探查法、平方探查法、伪随机数序列法、双哈希函数法等等。
b)拉链法
拉链法是把所有的同义词,用单链表链接起来的方法。在这种方法中,哈希表每个单元中存放的不再是记录本身,而是相应同义词单链表的头指针。
哈希表的平均查找长度ASL = F(α),即哈希表的平均查找长度只与装填因子α有关,与哈希表的长度n无关。哈希表的时间复杂度一般为O(1)。
例如,设计一个哈希表ha[0..m-1]存放n个元素,哈希函数采用除留余数法H(key)=key % p (p≤m), 解决冲突的方法采用开放定址法中的线性探查法。
1) 设计哈希表的类型;
2) 设计在哈希表中查找指定关键字的算法;
3) 设计在哈希表中删除指定关键字的算法;
4) 设计在哈希表中插入指定关键字的记录的算法;
5) 设计一组关键字建立哈希表的算法;
6) 设计输出哈希表的算法
7) 求查找成功时,平均查找长度的算法;
解:
哈希表 ha[0..m-1]
存放元素个数 n个
哈希函数 H(key)= key % p (p≤m)
线性探查法 Hi(k)=(H(k)+i)modm,(1≤i≤m−1)
1)设计哈希表的类型如下:
#define MaxSize 100 //定义最大哈希表长度 #define NULLKEY -1 //定义空关键字值 #define DELKEY -2 //定义被删关键字值 typedef int KeyType; //关键字类型 typedef char *InfoType; //其他数据类型 typedef struct{ KeyType key; //关键字域 InfoType data; //其他数据域 int count; //探查次数域 }HashTable[MaxSize]; //哈希表类型
2)在哈希表中查找关键字为k的记录的过程:根据建表时设定的哈希函数H, 计算出哈希地址H(k), 若表中该地址单元不为空(关键字值NULLKEY表示为空)且该地址的关键字不等于k, 则按建表时设定的处理冲突的方法找下一个地址(这里采用线性探查法找下一个地址),如此反复下去,直到某个地址单位为空(查找失败,返回-1)或者关键字比较相等(查找成功,返回该地址)为止。对应的算法如下:
//在哈希表中查找关键字k int SearchHT(HashTable ha,int p,KeyType k){ int i=0,adr; adr = k%p; while (ha[adr].key!=NULLKEY && ha[adr].key!=k) { i++; //采用线性探查法找下一个地址 adr = (adr+1)%p; } if(ha[adr].key==k) //查找成功 return adr; else //查找失败 return -1; }
3) 在哈希表中删除关键字为k的记录的过程:采用开放定址法处理冲突的哈希表上执行删除操作,只能在被删记录上做删除标记,而不能真正删除记录。在这里设删除标记为DELKEY。对应的算法如下:
//删除哈希表中关键字k int DeleteHT(HashTable ha,int p,int k,int &n){ int adr; adr = SearchHT(ha,p,k); if (adr!=-1) //在哈希表中找到关键字 { ha[adr].key=DELKEY; n--; //哈希表长度减1 return 1; } else //在哈希表中未找到该关键字 return 0; }
4) 插入算法首先调用查找算法,若在表中找到待插入的关键字,则插入失败;若在表中找到一个开放地址,则将待插入的结点插入其中,即插入成功。对应的算法如下:
//将关键字k插入到哈希表中 void InsertHT(HashTable ha,int &n,KeyType k,int p){ int i,adr; adr = k%p; if (ha[adr].key==NULLKEY || ha[adr].key==DELKEY) //x[j]可以直接放在哈希表中 { ha[adr].key=k; ha[adr].count=1; } else //发生冲突时,采用线性探查法解决冲突 { i=1; //i记录x[j]发生冲突的次数 do { adr = (adr+1)%p; i++; } while (ha[adr].key!=NULLKEY && ha[adr].key!=DELKEY); ha[adr].key=k; ha[adr].count=i; } n++; }
5) 建立哈希表的过程:先要将表中个结点的关键字清空,使其地址为开放的,然后调用插入算法将给定的关键字序列依次插入表中。对应的算法如下:
//创建哈希表 void CreateHT(HashTable ha,KeyType x[],int n,int m,int p){ int i,n1=0; for (i=0;i<m;i++) //哈希表置初值 { ha[i].key=NULLKEY; ha[i].count=0; } for(i=0;i<n;i++) InsertHT(ha,n1,x[i],p); }
6) 输出一个哈希表的算法如下:
//输出哈希表 void DispHT(HashTable ha,int n,int m){ float avg=0; int i; printf(" 哈希表地址:\t"); for(i=0;i<m;i++) printf(" %3d",i); printf("\n"); printf(" 哈希表关键字:\t"); for(i=0;i<m;i++) if(ha[i].key==NULLKEY || ha[i].key==DELKEY) printf(" "); //输出3个空格 else printf(" %3d",ha[i].key); printf(" \n"); printf(" 搜索次数:\t"); for(i=0;i<m;i++) if(ha[i].key==NULLKEY || ha[i].key==DELKEY) printf(" "); //输出3个空格 else printf(" %3d",ha[i].count); printf("\n"); for(i=0;i<m;i++) if(ha[i].key!=NULLKEY && ha[i].key!=DELKEY) avg=avg+ha[i].count; avg=avg/n; printf(" 平均搜索长度ASL(%d)=%.3g\n",n,avg); }
7) 求查找成功时的平均查找长度的算法如下:
//查找成功时,平均查找长度 void CompASL(HashTable ha,int m){ int i; int s=0,n=0; for (i=0;i<m;i++) if(ha[i].key!=DELKEY && ha[i].key!=NULLKEY) { s=s+ha[i].count; n++; } printf(" 查找成功的ASL=%.3g\n",s*1.0/n); }
完整代码如下:
#include <stdio.h>
#define MaxSize 100 //定义最大哈希表长度 #define NULLKEY -1 //定义空关键字值 #define DELKEY -2 //定义被删关键字值 typedef int KeyType; //关键字类型 typedef char *InfoType; //其他数据类型 typedef struct{ KeyType key; //关键字域 InfoType data; //其他数据域 int count; //探查次数域 }HashTable[MaxSize]; //哈希表类型
//将关键字k插入到哈希表中 void InsertHT(HashTable ha,int &n,KeyType k,int p){ int i,adr; adr = k%p; if (ha[adr].key==NULLKEY || ha[adr].key==DELKEY) //x[j]可以直接放在哈希表中 { ha[adr].key=k; ha[adr].count=1; } else //发生冲突时,采用线性探查法解决冲突 { i=1; //i记录x[j]发生冲突的次数 do { adr = (adr+1)%p; i++; } while (ha[adr].key!=NULLKEY && ha[adr].key!=DELKEY); ha[adr].key=k; ha[adr].count=i; } n++; }
//创建哈希表 void CreateHT(HashTable ha,KeyType x[],int n,int m,int p){ int i,n1=0; for (i=0;i<m;i++) //哈希表置初值 { ha[i].key=NULLKEY; ha[i].count=0; } for(i=0;i<n;i++) InsertHT(ha,n1,x[i],p); }
//在哈希表中查找关键字k int SearchHT(HashTable ha,int p,KeyType k){ int i=0,adr; adr = k%p; while (ha[adr].key!=NULLKEY && ha[adr].key!=k) { i++; //采用线性探查法找下一个地址 adr = (adr+1)%p; } if(ha[adr].key==k) //查找成功 return adr; else //查找失败 return -1; }
//删除哈希表中关键字k int DeleteHT(HashTable ha,int p,int k,int &n){ int adr; adr = SearchHT(ha,p,k); if (adr!=-1) //在哈希表中找到关键字 { ha[adr].key=DELKEY; n--; //哈希表长度减1 return 1; } else //在哈希表中未找到该关键字 return 0; }
//输出哈希表 void DispHT(HashTable ha,int n,int m){ float avg=0; int i; printf(" 哈希表地址:\t"); for(i=0;i<m;i++) printf(" %3d",i); printf("\n"); printf(" 哈希表关键字:\t"); for(i=0;i<m;i++) if(ha[i].key==NULLKEY || ha[i].key==DELKEY) printf(" "); //输出3个空格 else printf(" %3d",ha[i].key); printf(" \n"); printf(" 搜索次数:\t"); for(i=0;i<m;i++) if(ha[i].key==NULLKEY || ha[i].key==DELKEY) printf(" "); //输出3个空格 else printf(" %3d",ha[i].count); printf("\n"); for(i=0;i<m;i++) if(ha[i].key!=NULLKEY && ha[i].key!=DELKEY) avg=avg+ha[i].count; avg=avg/n; printf(" 平均搜索长度ASL(%d)=%.3g\n",n,avg); }
//查找成功时,平均查找长度 void CompASL(HashTable ha,int m){ int i; int s=0,n=0; for (i=0;i<m;i++) if(ha[i].key!=DELKEY && ha[i].key!=NULLKEY) { s=s+ha[i].count; n++; } printf(" 查找成功的ASL=%.3g\n",s*1.0/n); }
void main()
{
int x[]={16,74,60,43,54,90,46,31,29,88,77};
int n=11,m=13,p=13,i,k=29;
HashTable ha;
CreateHT(ha,x,n,m,p);
printf("\n");DispHT(ha,n,m);
i=SearchHT(ha,p,k);
if (i!=-1)
printf(" ha[%d].key=%d\n",i,k);
else
printf(" 未找到%d\n",k);
k=77;
printf(" 删除关键字%d\n",k);
DeleteHT(ha,p,k,n);
DispHT(ha,n,m);
i=SearchHT(ha,p,k);
if (i!=-1)
printf(" ha[%d].key=%d\n",i,k);
else
printf(" 未找到%d\n",k);
printf(" 插入关键字%d\n",k);
InsertHT(ha,n,k,p);
DispHT(ha,n,m);
printf("\n");
}
效果如下:
![](http://t2.qpic.cn/mblogpic/5b7a817a242a6df8dff6/2000.jpg)
图(1) 哈希函数选为 H(key)= key % 13
相关文章推荐
- 如何解决双网卡冲突
- Mootools 1.2教程 定时器和哈希简介
- 两个打印机服务spoolsv.exe存在冲突的解决方法
- "虚拟路径"..."映射到另一个应用程序,这是不允许的!
- C#获取哈希加密生成随机安全码的类实例
- setAttribute 与 class冲突解决
- jQuery与其它库冲突的解决方法
- 解决jquery版本冲突的有效方法
- 快速解决jQuery与其他库冲突的方法介绍
- C#计算字符串哈希值(MD5、SHA)的方法小结
- 加载jQuery后$冲突的解决办法
- 显示非站点目录及映射网络磁盘路径的图片
- 关于svn冲突的解决方法
- PowerShell中定义哈希散列(Hash)和调用例子
- PHP中创建和验证哈希的简单方法实探
- Perl 哈希的创建和引用介绍
- Perl 哈希Hash用法之入门教程
- perl哈希hash的常见用法介绍
- perl哈希的一个实例分析
- 避免Smarty与CSS语法冲突的方法