数据结构之Map集合——HashMap(一)

168 阅读4分钟

一起养成写作习惯!这是我参与「掘金日新计划 · 4 月更文挑战」的第1天,点击查看活动详情

对于Map这个容器大家一定不陌生了,下面我就Map中底层的一些知识做一个大致的总结,下面我把对Map的一些简单了解与大家分享一下,希望可以帮助到大家。

了解Map之前,相信大家已经对Collection的一些知识有了大概的了解,包括List、Set集合的基本特征和其实现类的使用方法,Map集合相比于Collection集合是比较复杂的,它是一个具有映射关系的集合,许多资料中称这种集合为【映射】。

我们要清楚的知道一点,Map集合非常适用于存储对象,这也是这种集合比较流行的原因之一。常用的Map功能有以下几个: Map集合的功能概述:

1 :添加功能

V put (K key , V value) :添加元素

如果键是第一次存储,就直接存储元素,返回null

如果键不是第一次存在,就用值把以前的值替换掉,返回以前的值

2:删除功能

void clear() :移除所有的键值对元素

V remove (Object key) :根据键删除值,并把值返回

3:判断功能

boolean containsKey (Object key) :判断集合是否包含指定的键

boolean conta insVa lue (Object value) :判断集合是否包含指定的值

boolean isEmpty() :判断集合是否为空

4:获取功能

Set<Map. Entry<K key, V value> entrySet() :返回的是键值对对象的集合

V get (0bject key) :根据键获取值

Set keySet () :获取集合中所有的键的集合

Collection values() :获取集合中所有值的集合

5:长度功能

Int size() :返回集合中键值对的对数

Map集合的常见实现类有HashMap、LinkedHashMap、TreeMap和ConcurrentHashMap,对于初学者来说了解HashMap这种最常用的实现类就可以啦~

HashMap

首先我们来看看HashMap的类继承图,毕竟要知其然,才能知其所以然。

image.png

再看一下HashMap的属性:

image.png

上面的图片来源于HashMap实现类中的源码,从源码中我们可以知道几个关键信息:

1,HashMap的默认容量是16,这意味着定义HashMap集合的时候,不指定默认大小的情况下,定义的HashMap大小就是16。(HashMap的⼤⼩只能是2次幂的,假设你传⼀个10进去,实际上最终HashMap的⼤⼩是16))。

2,HashMap的默认装载因子为0.75。许多初学的同学可能不知道这是什么意思,他的意思就是当定义的HashMap的容量超过了75%时,会触发HashMap的扩容机制。举个例子,我们定义的HashMap大小是16,当HashMap中的数据超过了16*0.75=12时,就会触发扩容机制了。

3,HashMap的最大容量是2的30次方。

HashMap构造方法

HashMap的构造方法有4个,我们需要关注的就是如下所示的这个

public HashMap(int initialCapacity, float loadFactor) {
    if (initialCapacity < 0)
        throw new IllegalArgumentException("Illegal initial capacity: " +
                                           initialCapacity);
    if (initialCapacity > MAXIMUM_CAPACITY)
        initialCapacity = MAXIMUM_CAPACITY;
    if (loadFactor <= 0 || Float.isNaN(loadFactor))
        throw new IllegalArgumentException("Illegal load factor: " +
                                           loadFactor);
    this.loadFactor = loadFactor;
    this.threshold = tableSizeFor(initialCapacity);
}

在代码最后,我们可以看到这串代码

this.threshold = tableSizeFor(initialCapacity);

这串代码的作用就是返回一个大于输入参数且最近的2的整数次幂的数,这就解释了我们前面为什么HashMap的大小只能是2的次幂了,感兴趣的同学可以去看一下这块代码。

HashMap的Put()方法

要想搞懂HashMap,一定要搞懂HashMap中的put()方法。 put()方法一共是以下几个步骤

1.扩容 2.判断数组中是否已有元素 3.没有,则放入数组中;有,则放入链表中。(当数组的长度大于等于64且链表的长度大于8的时候,将链表转为红黑树)

final V putVal(int hash, K key, V value, boolean onlyIfAbsent,
                   boolean evict) {
    Node<K,V>[] tab; Node<K,V> p; int n, i;
    // table未初始化或者长度为0,进行扩容
    if ((tab = table) == null || (n = tab.length) == 0)
        n = (tab = resize()).length;
    // (n - 1) & hash 确定元素存放在哪个桶中,桶为空,新生成结点放入桶中(此时,这个结点是放在数组中)
    if ((p = tab[i = (n - 1) & hash]) == null)
        tab[i] = newNode(hash, key, value, null);
    // 桶中已经存在元素
    else {
        Node<K,V> e; K k;
        // 比较桶中第一个元素(数组中的结点)的hash值相等,key相等
        if (p.hash == hash &&
            ((k = p.key) == key || (key != null && key.equals(k))))
                // 将第一个元素赋值给e,用e来记录
                e = p;
        // hash值不相等,即key不相等;为红黑树结点
        else if (p instanceof TreeNode)
            // 放入树中
            e = ((TreeNode<K,V>)p).putTreeVal(this, tab, hash, key, value);
        // 为链表结点
        else {
            // 在链表最末插入结点
            for (int binCount = 0; ; ++binCount) {
                // 到达链表的尾部
                if ((e = p.next) == null) {
                    // 在尾部插入新结点
                    p.next = newNode(hash, key, value, null);
                    // 结点数量达到阈值(默认为 8 ),执行 treeifyBin 方法
                    // 这个方法会根据 HashMap 数组来决定是否转换为红黑树。
                    // 只有当数组长度大于或者等于 64 的情况下,才会执行转换红黑树操作,以减少搜索时间。否则,就是只是对数组扩容。
                    if (binCount >= TREEIFY_THRESHOLD - 1) // -1 for 1st
                        treeifyBin(tab, hash);
                    // 跳出循环
                    break;
                }
                // 判断链表中结点的key值与插入的元素的key值是否相等
                if (e.hash == hash &&
                    ((k = e.key) == key || (key != null && key.equals(k))))
                    // 相等,跳出循环
                    break;
                // 用于遍历桶中的链表,与前面的e = p.next组合,可以遍历链表
                p = e;
            }
        }
        // 表示在桶中找到key值、hash值与插入元素相等的结点
        if (e != null) {
            // 记录e的value
            V oldValue = e.value;
            // onlyIfAbsent为false或者旧值为null
            if (!onlyIfAbsent || oldValue == null)
                //用新值替换旧值
                e.value = value;
            // 访问后回调
            afterNodeAccess(e);
            // 返回旧值
            return oldValue;
        }
    }
    // 结构性修改
    ++modCount;
    // 实际大小大于阈值则扩容
    if (++size > threshold)
        resize();
    // 插入后回调
    afterNodeInsertion(evict);
    return null;
}

OK,今天我们就说到这里吧~明天我们来讲一下HashMap的index值是如何计算的,以及HashMap其他需要知道的点。