您的位置:首页 > 编程语言 > Java开发

Java HashMap的实现原理

2017-11-21 22:08 351 查看

HashMap

HashMap是一个用于存储Key-Value键值对的集合,每一个键值对称为Entry。这些个键值对(Entry)分散存储在一个Entry数组当中,HashMap数组每一个元素的初始值都是Null。

几个重要参数:

1、初始容量,必须为2的幂次,默认为16;

/**
* The default initial capacity - MUST be a power of two.
*/
static final int DEFAULT_INITIAL_CAPACITY = 1 << 4; // aka 16


2、最大容量,2^30;

/**
* The maximum capacity, used if a higher value is implicitly specified
* by either of the constructors with arguments.
* MUST be a power of two <= 1<<30.
*/
static final int MAXIMUM_CAPACITY = 1 << 30;


3、装载因子,默认为0.75;

/**
* The load factor used when none specified in constructor.
*/
static final float DEFAULT_LOAD_FACTOR = 0.75f;


4、Java8 中,HashMap初始采用链表解决hash冲突,在同一个位置的冲突节点达到一定阈值后,调节为红黑树存储,是为了防止查找时间过长。默认值为:链表长度超过8就转红黑树,红黑树由于删除操作,节点数小于6就转链表。

/**
* The bin count threshold for using a tree rather than list for a
* bin.  Bins are converted to trees when adding an element to a
* bin with at least this many nodes. The value must be greater
* than 2 and should be at least 8 to mesh with assumptions in
* tree removal about conversion back to plain bins upon
* shrinkage.
*/
static final int TREEIFY_THRESHOLD = 8;
static final int UNTREEIFY_THRESHOLD = 6;


几个重要方法:

1、
put(K key, V value)


首先,利用一个哈希函数来确定Entry的插入位置index;如果发生hash冲突,可以利用链表来解决。新来的Entry节点插入链表时,使用的是“头插法”,这是基于时间局部性,认为后插入的Entry被查找的可能性更大。

2、
get(Object key)


计算该key的hash值,定位到具体位置,如果该位置存在多个节点,则遍历链表或在红黑树中查询。

几个注意事项:

1、为什么数组容量必须为2的幂次?

这是为了快速计算hash值,Length是HashMap的长度

index =  HashCode(Key) % Length ?
index =  HashCode(Key) &  (Length - 1)


第二种位运算速度更快!为了保证hash算法的均匀分布,Length - 1的二进制表示应该全为1

2、每次扩容的容量

扩容的时机有两个,

1)元素总个数大于
capacity*factor
时;

2)当同一数组位置(bin),由于hash冲突太多,由链表转化为树,而此时数组总容量 <
static final int MIN_TREEIFY_CAPACITY = 64
时,也会进行
resize


数组容量必须为2的幂次,所以每次都2倍扩容,使得所有元素rehash后要么在原位置,要么移动2的幂次距离。
内容来自用户分享和网络整理,不保证内容的准确性,如有侵权内容,可联系管理员处理 点击这里给我发消息
标签:  java 数据结构 hashmap