您的位置:首页 > 其它

哈希表的创建

2015-10-06 22:28 387 查看
  在记录的存储位置和它的关键字之间建立一个确定的对应关系f,使每个关键字和表中唯一的存储位置相对应,称这个对应关系f为哈希(散列)函数,根据这个思想建立的表为哈希表。

  若key1≠key2, 而f(key1)=f(key2), 则这种现象称为冲突,且key1和key2对哈希函数f来说是同义词。

  根据设定的哈希函数f=H(key)和处理冲突的方法,将一组关键字映像到一个有限的连续的地址集上,并以关键字在地址集中的”象”作为记录在表中的存储位置,这一映像过程,称为构造哈希表(散列表)。

  哈希函数常见的构造方法有5种:

  直接定址法、数字分析法、平方取中法、除留余数法、随机数法等。

  注意,在使用除留余数法 H(key)=key Mod p (p≤m)时,对除数p的选择很重要,若p选的不好,则很容易产生同义词。一般,将p选为素数。

  哈希函数处理冲突的方法常见的有2种:

  a) 开放地址法

  在该方法中,又细分为:线性探查法、平方探查法、伪随机数序列法、双哈希函数法等等。

  b)拉链法

  拉链法是把所有的同义词,用单链表链接起来的方法。在这种方法中,哈希表每个单元中存放的不再是记录本身,而是相应同义词单链表的头指针。

  哈希表的平均查找长度ASL = F(α),即哈希表的平均查找长度只与装填因子α有关,与哈希表的长度n无关。哈希表的时间复杂度一般为O(1)。

  例如,设计一个哈希表ha[0..m-1]存放n个元素,哈希函数采用除留余数法H(key)=key % p (p≤m), 解决冲突的方法采用开放定址法中的线性探查法。

  1) 设计哈希表的类型;

  2) 设计在哈希表中查找指定关键字的算法;

  3) 设计在哈希表中删除指定关键字的算法;

  4) 设计在哈希表中插入指定关键字的记录的算法;

  5) 设计一组关键字建立哈希表的算法;

  6) 设计输出哈希表的算法

  7) 求查找成功时,平均查找长度的算法;

  解:

   哈希表 ha[0..m-1]

   存放元素个数 n个

   哈希函数 H(key)= key % p (p≤m)

   线性探查法 Hi(k)=(H(k)+i)modm,(1≤i≤m−1)

    1)设计哈希表的类型如下:  

#define MaxSize 100      //定义最大哈希表长度
#define NULLKEY -1       //定义空关键字值
#define DELKEY -2        //定义被删关键字值
typedef int KeyType;     //关键字类型
typedef char *InfoType;  //其他数据类型
typedef struct{
KeyType key;        //关键字域
InfoType data;      //其他数据域
int count;          //探查次数域
}HashTable[MaxSize];    //哈希表类型


 2)在哈希表中查找关键字为k的记录的过程:根据建表时设定的哈希函数H, 计算出哈希地址H(k), 若表中该地址单元不为空(关键字值NULLKEY表示为空)且该地址的关键字不等于k, 则按建表时设定的处理冲突的方法找下一个地址(这里采用线性探查法找下一个地址),如此反复下去,直到某个地址单位为空(查找失败,返回-1)或者关键字比较相等(查找成功,返回该地址)为止。对应的算法如下: 

//在哈希表中查找关键字k
int SearchHT(HashTable ha,int p,KeyType k){
int i=0,adr;
adr = k%p;
while (ha[adr].key!=NULLKEY && ha[adr].key!=k)
{
i++;             //采用线性探查法找下一个地址
adr = (adr+1)%p;
}
if(ha[adr].key==k)  //查找成功
return adr;
else                //查找失败
return -1;

}


 3) 在哈希表中删除关键字为k的记录的过程:采用开放定址法处理冲突的哈希表上执行删除操作,只能在被删记录上做删除标记,而不能真正删除记录。在这里设删除标记为DELKEY。对应的算法如下: 

//删除哈希表中关键字k
int DeleteHT(HashTable ha,int p,int k,int &n){
int adr;
adr = SearchHT(ha,p,k);
if (adr!=-1)   //在哈希表中找到关键字
{
ha[adr].key=DELKEY;
n--;       //哈希表长度减1
return 1;
}
else            //在哈希表中未找到该关键字
return 0;

}


 4) 插入算法首先调用查找算法,若在表中找到待插入的关键字,则插入失败;若在表中找到一个开放地址,则将待插入的结点插入其中,即插入成功。对应的算法如下: 

//将关键字k插入到哈希表中
void InsertHT(HashTable ha,int &n,KeyType k,int p){
int i,adr;
adr = k%p;
if (ha[adr].key==NULLKEY || ha[adr].key==DELKEY)  //x[j]可以直接放在哈希表中
{
ha[adr].key=k;
ha[adr].count=1;
}
else      //发生冲突时,采用线性探查法解决冲突
{
i=1;  //i记录x[j]发生冲突的次数
do
{
adr = (adr+1)%p;
i++;
} while (ha[adr].key!=NULLKEY && ha[adr].key!=DELKEY);
ha[adr].key=k;
ha[adr].count=i;
}
n++;
}


 5) 建立哈希表的过程:先要将表中个结点的关键字清空,使其地址为开放的,然后调用插入算法将给定的关键字序列依次插入表中。对应的算法如下: 

//创建哈希表
void CreateHT(HashTable ha,KeyType x[],int n,int m,int p){
int i,n1=0;
for (i=0;i<m;i++)  //哈希表置初值
{
ha[i].key=NULLKEY;
ha[i].count=0;
}
for(i=0;i<n;i++)
InsertHT(ha,n1,x[i],p);
}


 6) 输出一个哈希表的算法如下: 

//输出哈希表
void DispHT(HashTable ha,int n,int m){
float avg=0;
int i;
printf(" 哈希表地址:\t");
for(i=0;i<m;i++)
printf(" %3d",i);
printf("\n");
printf(" 哈希表关键字:\t");
for(i=0;i<m;i++)
if(ha[i].key==NULLKEY || ha[i].key==DELKEY)
printf("   "); //输出3个空格
else
printf(" %3d",ha[i].key);
printf(" \n");
printf(" 搜索次数:\t");
for(i=0;i<m;i++)
if(ha[i].key==NULLKEY || ha[i].key==DELKEY)
printf("   "); //输出3个空格
else
printf(" %3d",ha[i].count);
printf("\n");
for(i=0;i<m;i++)
if(ha[i].key!=NULLKEY && ha[i].key!=DELKEY)
avg=avg+ha[i].count;
avg=avg/n;
printf(" 平均搜索长度ASL(%d)=%.3g\n",n,avg);

}


 7) 求查找成功时的平均查找长度的算法如下:

//查找成功时,平均查找长度
void CompASL(HashTable ha,int m){
int i;
int s=0,n=0;
for (i=0;i<m;i++)
if(ha[i].key!=DELKEY && ha[i].key!=NULLKEY)
{
s=s+ha[i].count;
n++;
}
printf(" 查找成功的ASL=%.3g\n",s*1.0/n);

}


完整代码如下:

#include <stdio.h>
#define MaxSize 100 //定义最大哈希表长度 #define NULLKEY -1 //定义空关键字值 #define DELKEY -2 //定义被删关键字值 typedef int KeyType; //关键字类型 typedef char *InfoType; //其他数据类型 typedef struct{ KeyType key; //关键字域 InfoType data; //其他数据域 int count; //探查次数域 }HashTable[MaxSize]; //哈希表类型

//将关键字k插入到哈希表中 void InsertHT(HashTable ha,int &n,KeyType k,int p){ int i,adr; adr = k%p; if (ha[adr].key==NULLKEY || ha[adr].key==DELKEY) //x[j]可以直接放在哈希表中 { ha[adr].key=k; ha[adr].count=1; } else //发生冲突时,采用线性探查法解决冲突 { i=1; //i记录x[j]发生冲突的次数 do { adr = (adr+1)%p; i++; } while (ha[adr].key!=NULLKEY && ha[adr].key!=DELKEY); ha[adr].key=k; ha[adr].count=i; } n++; }

//创建哈希表 void CreateHT(HashTable ha,KeyType x[],int n,int m,int p){ int i,n1=0; for (i=0;i<m;i++) //哈希表置初值 { ha[i].key=NULLKEY; ha[i].count=0; } for(i=0;i<n;i++) InsertHT(ha,n1,x[i],p); }

//在哈希表中查找关键字k int SearchHT(HashTable ha,int p,KeyType k){ int i=0,adr; adr = k%p; while (ha[adr].key!=NULLKEY && ha[adr].key!=k) { i++; //采用线性探查法找下一个地址 adr = (adr+1)%p; } if(ha[adr].key==k) //查找成功 return adr; else //查找失败 return -1; }

//删除哈希表中关键字k int DeleteHT(HashTable ha,int p,int k,int &n){ int adr; adr = SearchHT(ha,p,k); if (adr!=-1) //在哈希表中找到关键字 { ha[adr].key=DELKEY; n--; //哈希表长度减1 return 1; } else //在哈希表中未找到该关键字 return 0; }

//输出哈希表 void DispHT(HashTable ha,int n,int m){ float avg=0; int i; printf(" 哈希表地址:\t"); for(i=0;i<m;i++) printf(" %3d",i); printf("\n"); printf(" 哈希表关键字:\t"); for(i=0;i<m;i++) if(ha[i].key==NULLKEY || ha[i].key==DELKEY) printf(" "); //输出3个空格 else printf(" %3d",ha[i].key); printf(" \n"); printf(" 搜索次数:\t"); for(i=0;i<m;i++) if(ha[i].key==NULLKEY || ha[i].key==DELKEY) printf(" "); //输出3个空格 else printf(" %3d",ha[i].count); printf("\n"); for(i=0;i<m;i++) if(ha[i].key!=NULLKEY && ha[i].key!=DELKEY) avg=avg+ha[i].count; avg=avg/n; printf(" 平均搜索长度ASL(%d)=%.3g\n",n,avg); }

//查找成功时,平均查找长度 void CompASL(HashTable ha,int m){ int i; int s=0,n=0; for (i=0;i<m;i++) if(ha[i].key!=DELKEY && ha[i].key!=NULLKEY) { s=s+ha[i].count; n++; } printf(" 查找成功的ASL=%.3g\n",s*1.0/n); }
void main()
{
int x[]={16,74,60,43,54,90,46,31,29,88,77};
int n=11,m=13,p=13,i,k=29;
HashTable ha;
CreateHT(ha,x,n,m,p);
printf("\n");DispHT(ha,n,m);
i=SearchHT(ha,p,k);
if (i!=-1)
printf(" ha[%d].key=%d\n",i,k);
else
printf(" 未找到%d\n",k);
k=77;
printf(" 删除关键字%d\n",k);
DeleteHT(ha,p,k,n);
DispHT(ha,n,m);
i=SearchHT(ha,p,k);
if (i!=-1)
printf(" ha[%d].key=%d\n",i,k);
else
printf(" 未找到%d\n",k);
printf(" 插入关键字%d\n",k);
InsertHT(ha,n,k,p);
DispHT(ha,n,m);
printf("\n");
}


效果如下:



图(1) 哈希函数选为 H(key)= key % 13
内容来自用户分享和网络整理,不保证内容的准确性,如有侵权内容,可联系管理员处理 点击这里给我发消息
标签:  哈希 冲突 映射