您的位置:首页 > 其它

区分几个概念:Dictionary, Direct-address Tables, Hash Tables

2007-02-12 16:46 288 查看
Dictionary是一种抽象数据类型,用来存储可以用键值(key)索引的数据项,基本的操作包括插入、查找和删除。它是一个相对比较广义的概念,并没有规定具体的实现,比如在底层用什么数据结构存储数据项。因此,只要存储的每一个数据项是一对(key, value),并可以用key索引到这一项,就可以将这样的数据类型称为Dictionary。

Direct-address Tables和Hash Tables都是Dictionary的具体实现方式。Direct-address Tables其实就是普通的数组,数组的第k项只被用来存储键值为k的数据项。显然,要应用这种数据结构必须给每一个可能的键值预留一个数组项,因此它只适用于键值的集合比较小的情况。虽然Direct-address Tables看起来比较浪费内存,但也有它的优点:插入、查找和删除操作的时间复杂度为O(1)。

Hash Tables是Dictionary的一种有效实现,它解决了Direct-address Tables在键值集合比较大的情况下不适用的问题。假设U表示所有可能的键值的集合,K表示实际要存储的键值的集合。在|U|远远大于|K|的时候,Hash Tables只分配和|K|大小成比例的数据表项,然后通过哈希函数将K映射到各个表项中。Hash Tables通过将取值范围很大的键值映射到较小的集合中,极大地节省了存储空间,但同时引入了碰撞(Collision)的因素,即几个键值映射到同一表项的情况。由于处理碰撞而增加的复杂度,常常使查找或删除等操作的时间复杂度不再为O(1),在最差的情况下甚至为O(n)(n = |K|)。但在实际中,通过选择合适的哈希函数,上述操作的时间复杂度常常能控制在接近O(1)。
内容来自用户分享和网络整理,不保证内容的准确性,如有侵权内容,可联系管理员处理 点击这里给我发消息
标签: