您的位置：首页 > 编程语言 > Java开发

Java之HashMap

2014-03-08 15:08 211 查看

HashMap

Hashmap实际上是一个数组和链表的结合体（在数据结构中，一般称之为“链表散列“）。就是说HashMap是采用链表解决哈希冲突的，而不是开放地址法解决冲突。

HashMap的大小和扩张

size：新建一个HashMap时会初始化一个数组，数组大小默认为16，负载因子默认为0.75。
也可以使用构造器HashMap(int initialCapacity)来构建一个自定义初始容量，负载因子为 0.75 的 HashMap。这里的自定义初始容量是这样的：取与initialCapacity最相近的2的整数次幂。也可以使用构造器 HashMap(int
initialCapacity, float loadFactor) 来指定容量和负载因子。
resize：对于默认的容量16，负载因子0.75的hashmap而已，当数组中的元素个数超过16*0.75时，冲突变的十分严重，数组要进行扩展，扩展为原来容量的2倍，即为16*2=32，扩张后要重新定位元素在新数组中的位置，消耗比较大。可以采用平摊分析进行复杂度分析。

HashMap的存取操作

存： Entry是数组元素，每个Entry对象都是一个<key,value>的键值对，当我们往HashMap中put元素的时候，先根据key的hashCode重新计算hash值，根据hash值得到这个元素在数组中的位置（即下标），如果数组该位置上已经存放有其他元素了，那么在这个位置上的元素将以链表的形式存放，新加入的放在链头，最先加入的放在链尾。如果数组该位置上没有元素，就直接将该元素放到此数组中的该位置上。
取：在HashMap中要找到某个元素，需要根据key的hash值来求得对应数组中的位置“模”运算的消耗还是比较大的，在HashMap中是这样做的：调用 indexFor(int
h, int length) 方法来计算该对象应该保存在 table 数组的哪个索引处。indexFor(int h, int length) 方法的代码如下：

static int indexFor(int h, int length) {
return h & (length-1);
}

这个方法通过 h & (table.length -1) 来得到该对象的保存位，而HashMap底层数组的长度总是 2 的n 次方，这是HashMap在速度上的优化。

对于任意给定的对象，只要它的 hashCode() 返回值相同，那么程序调用 hash(int h) 方法所计算得到的 hash 码值总是相同的，而hash值是根据key来计算的，所以在HashMap中不能存在重复的key，但是不同key的value可以相同。

fail-fast机制

我们知道java.util.HashMap不是线程安全的，因此如果在使用迭代器的过程中有其他线程修改了map，那么将抛出 ConcurrentModificationException，这就是所谓fail-fast策略。这一策略在源码中的实现是通过modCount域，modCount顾名思义就是修改次数，对HashMap内容的修改都将增加这个值，那么在迭代器初始化过程中会将这个值赋给迭代器的expectedModCount。在迭代过程中，判断modCount跟expectedModCount是否相等，如果不相等就表示已经有其他线程修改了Map。
因此不能在并发场景下使用HashMap。

注意的几点：

HashMap中允许key和value是null；
在迭代时，按照数组的index从0到length-1遍历，把不为null的数据取出来；
在HashMap中不能存在重复的key，但是不同key的value可以相同。

参考：深入理解HashMap ，通过分析 JDK 源代码研究
Hash 存储机制

内容来自用户分享和网络整理，不保证内容的准确性，如有侵权内容，可联系管理员处理

标签：

相关文章推荐

新的分享

章节导航