HashMap 是Map接口的实现类,主要用来存放键值对,是常用的 Java 集合之一,是非线程安全的。
HashMap 可以存储 null 的 key 和 value,但 null 作为键只能有一个,null 作为值可以有多个。因为HashMap的键不能重复,而值可以重复。
JDK1.8 之前 HashMap 由 数组+链表 组成的,采用“拉链法”解决哈希冲突。
JDK1.8 以后,当链表长度大于阈值(默认为 8)时,会首先调用 treeifyBin()方法。这个方法会根据 HashMap 数组来决定是否转换为红黑树。只有当数组长度大于或者等于 64 的情况下,才会执行转换红黑树操作,以减少搜索时间。否则,就是只是执行 resize() 方法对数组扩容。
HashMap 默认的初始化大小为 16。之后每次扩充,容量变为原来的 2 倍。并且, HashMap 总是使用 2 的幂作为哈希表的大小。
[JDK1.8 之前]
HashMap 通过 key 的 hashCode 经过扰动函数处理过后得到 hash 值,然后通过 (n - 1) & hash 判断当前元素存放的位置(这里的 n 指的是数组的长度),如果当前位置存在元素的话,就判断该元素与要存入的元素的 hash 值以及 key 是否相同,如果相同的话,直接覆盖,不相同就通过拉链法解决冲突。
所谓 “拉链法” 就是:创建一个链表数组,数组中每一格就是一个链表。若遇到哈希冲突,则将冲突的值加到链表中即可。
使用扰动函数之后可以减少碰撞,它在JDK1.8之后的原理没变,但实现更简单,性能也有所提升。代码如下:
JDK 1.8 的 hash 方法(扰动函数):
static final int hash(Object key) {
int h;
/**
key.hashCode():返回散列值也就是hashcode
^:按位异或
>>>:无符号右移,忽略符号位,空位都以0补齐
*/
return key == null ? 0 : (h = key.hashCode()) ^ h >>> 16;
}
JDK1.7 的 HashMap 的 hash 方法源码: 扰动了4次(四次右移操作),帮助打乱原始哈希值的高位和低位,从而减少冲突。性能较低。
static int hash(int h) {
h ^= (h >>> 20) ^ (h >>> 12);
return h ^ (h >>> 7) ^ (h >>> 4); }