Java实习生面试复习(三):ArrayList

995 阅读6分钟

如果你觉得内容对你有帮助的话,不如给个赞🐱‍👓?(σ゚∀゚)σ..:*☆哎哟不错哦

ArrayList 我们几乎每天都会使用到,本文就一起来看看同样是面试高频问到的ArrayList的相关知识吧。

ArrayList分析

底层结构分析

其实ArrayList是很简单的, ArrayList 其实就是围绕底层数组结构,各个 API 都是对数组的操作进行封装,看下图: 在这里插入图片描述

  //默认数组大小10
  private static final int DEFAULT_CAPACITY = 10;

  //数组使用的大小
  private int size;
  
  //数组存放的容器
  transient Object[] elementData; // non-private to simplify nested class access
  

图中展示是长度为 8 的数组(为了画图方便,其实默认是10),长度从 1 开始计数,index 表示数组的下标,从 0 开始计数,elementData 表示数组本身。

源码中除了这两个概念,还有以下三个基本概念:

  • DEFAULT_CAPACITY 表示数组的初始大小,默认是 10,这个数字要记住;
  • size 表示当前数组的大小,类型 int,没有使用 volatile 修饰,非线程安全的;
  • modCount 统计当前数组被修改的版本次数,数组结构有变动,就会 +1。 modCount继承自AbstractList,主要应用快速失败机制,在上一篇HashMap中有提到这个机制,这里就不在赘述了

三种初始化办法:无参数直接初始化、指定大小初始化、指定初始数据初始化

  //  无参数构造器,默认是空数组
  public ArrayList() {
    this.elementData = DEFAULTCAPACITY_EMPTY_ELEMENTDATA;
  }
  
  // 指定大小初始化
  public ArrayList(int initialCapacity) {
    if (initialCapacity > 0) {
      this.elementData = new Object[initialCapacity];
    } else if (initialCapacity == 0) {
      this.elementData = EMPTY_ELEMENTDATA;
    } else {
      throw new IllegalArgumentException("Illegal Capacity: "+
                                         initialCapacity);
    }
  }
  // 指定初始数据初始化
  public ArrayList(Collection<? extends E> c) {
    //elementData 是保存数组的容器,默认为 null
    elementData = c.toArray();
    //如果给定的集合(c)数据有值,则进行拷贝赋值操作
    if ((size = elementData.length) != 0) {
      //如果集合元素类型不是 Object 类型,才开始拷贝,否则不执行
      if (elementData.getClass() != Object[].class) {
        elementData = Arrays.copyOf(elementData, size, Object[].class);
      }
    } else {
      // 给定集合(c)无值,则默认空数组
      this.elementData = EMPTY_ELEMENTDATA;
    }
  }

注意:ArrayList 无参构造器初始化时,默认大小是空数组,跟HashMap一样,都是在第一次 add 的时候扩容的数组值。

新增和扩容实现

新增的代码其实很简短

  // 添加到数组尾部
  public boolean add(E e) {
    //确保数组大小足够,不够需要扩容
    ensureCapacityInternal(size + 1);  // Increments modCount!!
    //直接赋值,线程不安全的
    elementData[size++] = e;
    return true;
  }
  
  // 添加到指定位置
  public void add(int index, E element) {
    rangeCheckForAdd(index);
    ensureCapacityInternal(size + 1);  // Increments modCount!!
 /**
   * @param      src      the source array. 源数组
   * @param      srcPos   starting position in the source array. 源数组的起始位置
   * @param      dest     the destination array. 目标数组
   * @param      destPos  starting position in the destination data. 目标数组的起始位置
   * @param      length   the number of array elements to be copied. 复制的长度
   */
    System.arraycopy(elementData, index, elementData, index + 1,
                     size - index);
    elementData[index] = element;
    size++;
  }

我们可以看到两个add方法,我们来分析一下这两个方法: 添加到数组尾部 时间复杂度O(1):

  • 其实就是两步,判断是否需要扩容,如果需要就执行扩容操作;然后赋值;

添加到指定位置 时间复杂度O(n):

  • rangeCheckForAdd 先判断下标是否正确
  • ensureCapacityInternal 判断是否需要扩容
  • arraycopy 将原数组从下标开始的数据全部往后移一位
  • 给指定下标的位置赋值 添加到指定位置
  // 扩容
  private void grow(int minCapacity) {
  
    int oldCapacity = elementData.length;
    // oldCapacity >> 1 是把 oldCapacity / (2 ^ 1) 的意思
    int newCapacity = oldCapacity + (oldCapacity >> 1);

    // 如果扩容后的值 < 我们的期望值,扩容后的值就等于我们的期望值
    if (newCapacity - minCapacity < 0)
      newCapacity = minCapacity;

    // 如果扩容后的值 > jvm 所能分配的数组的最大值,那么就去 Integer 的最大值
    if (newCapacity - MAX_ARRAY_SIZE > 0)
      newCapacity = hugeCapacity(minCapacity);

    // 通过复制进行扩容  底层实际上还是System.arraycopy方法
    elementData = Arrays.copyOf(elementData, newCapacity);
  }

我们可以看到扩容是通过这行代码来实现的:Arrays.copyOf(elementData, newCapacity);,这行代码指的就是数组之间的拷贝,扩容是会先新建一个预期容量的新数组,然后把老数组的数据拷贝过去,底层还是System.arraycopy 方法进行拷贝,此方法是 native 的方法 这里需要注意:扩容的规则是原来容量大小 + 容量大小的一半,也就是原来容量的 1.5 倍;ArrayList 中的数组的最大值是 Integer.MAX_VALUE。且 ArrayList 是允许 null 值的。

删除实现

ArrayList 删除元素有很多种方式,比如根据数组索引删除、根据值删除或批量删除等等,原理和思路都差不多,我们选取根据值和下标删除方式来进行说明:

//根据数组下标去删除
public E remove(int index) {
    rangeCheck(index);

    modCount++;
    E oldValue = elementData(index);

    int numMoved = size - index - 1;
    if (numMoved > 0)
      System.arraycopy(elementData, index+1, elementData, index,
                       numMoved);
    elementData[--size] = null; // 方便GC,防止造成内存溢出

    return oldValue;
}
// 按值删除
public boolean remove(Object o) {
  // 如果要删除的值是 null,找到第一个值是 null 的删除
  if (o == null) {
    for (int index = 0; index < size; index++)
      if (elementData[index] == null) {
        fastRemove(index);
        return true;
      }
  } else {
    // 如果要删除的值不为 null,找到第一个和要删除的值相等的删除
    for (int index = 0; index < size; index++)
      // 这里是根据  equals 来判断值相等的,相等后再根据索引位置进行删除
      if (o.equals(elementData[index])) {
        fastRemove(index);
        return true;
      }
  }
  return false;
}

删除元素 我们需要注意的是:

  • 在新增的时候我有提到是可以add null的,所以删除的时候也是允许删除 null 值的,只不过是删除找到的第一个null;
  • 按值删除,需要先找到值在数组中的索引位置,是通过 equals 来判断的,如果数组元素不是基本类型,就需要我们做 equals 的具体实现。

总结: 我们可以看出其实新增和删除都涉及到了数组的复制,这也是为什么ArrayList适合查找,LinkedList适合新增删改,但是如果是直接添加到数组尾部的话,还是很快的。但是这是有条件的,也就是我们不指定位置直接添加元素时(add(E element)),元素会默认会添加在最后,不会触发底层数组的复制,不考虑底层数组自动扩容的话,时间复杂度为O(1) ,在指定位置添加元素(add(int index, E element)),需要复制底层数组,根据最坏打算,时间复杂度是O(n)。

迭代器

我们都知道所有集合都是Collection接口的实现类,又因为Collection继承了Iterable接口,因此所有集合都是可迭代的。我们常常会采用集合的迭代器来遍历集合元素,我们来看看ArrayList对迭代器的实现,从而深入分析为什么对集合执行相关修改操作时为什么会抛出ConcurrentModificationException

  // 实现 Iterator 接口
  private class Itr implements Iterator<E> {
    // 迭代过程中,下一个元素的位置,从 0 开始,用来控制拿下一个元素
    int cursor; 
    // 新增时表示上一次迭代过程中,索引的位置,删除成功时为 -1
    int lastRet = -1; 
    // 迭代过程中期望数组修改版本号
    int expectedModCount = modCount;

    public boolean hasNext() {...}

    public E next() {
      //迭代过程中,判断版本号有无被修改,有被修改,抛 ConcurrentModificationException 异常
      checkForComodification();
	  ... 省略代码
      // 返回元素值
      return (E) elementData[lastRet = i];
}

    public void remove() {
      //迭代过程中,判断版本号有无被修改,有被修改,抛 ConcurrentModificationException 异常
      checkForComodification();
      try {
      // 调用自身的remove
        ArrayList.this.remove(lastRet);
		... 省略代码
        expectedModCount = modCount;
      } catch (IndexOutOfBoundsException ex) {
        throw new ConcurrentModificationException();
      }
  }
  // 对比迭代器的删除,你发现了什么?
  public E remove(int index) {
	... 省略代码
    modCount++;
    ... 省略代码
    return oldValue;
  }

该迭代器实现了Iterator接口并实现了相关方法,提供我们对集合的遍历能力。

总结:ArrayList的迭代器默认是其内部类实现,实现一个自定义迭代器只需要实现Iterator接口并实现相关方法即可。而实现Iterable接口表示该实现类具有像for-each loop迭代遍历的能力。

我们都知道,如果在迭代的过程中调用非迭代器内部的remove或者clear方法将会抛出ConcurrentModificationException异常,那到底是为什么呢

首先这里涉及到两个很重要的变量,一个是expectedModCount,另一个是modCountexpectedModCount在集合内部迭代器中定义,就像上面源码所示,modCount在AbstractList中定义。,默认迭代器初始化的时候expectedModCount = modCount说明两者是相等的,我们可以看到next方法和remove方法都会去判断,只有当不相等的情况下才会抛出异常。我们可以看到ArrayList自身的remove方法在删除元素的时候会将modCount++,虽然迭代器本质上也是this.remove,但它在删除之后执行了一行expectedModCount = modCount,以此保证了两个值的相等,这也是java.util下的集合类的快速失败机制的实现。

总结: 迭代器迭代集合时不能对被迭代集合进行修改,原因是modCount和expectedModCount两个变量值不想等导致的!如果想删除需要调用Iterator.remove (),另外快速失败机制并不能保证ArrayList是线程安全的。

回顾一下,看完这篇文章你答的上以下问题了吗?

  • 说说你自己对 ArrayList 的理解?
  • ArrayList 无参数构造器构造,现在 add 一个值进去,此时数组的大小是多少,下一次扩容前最大可用大小是多少?
  • 现在我有一个很大的数组需要拷贝,原数组大小是 5k,请问如何快速拷贝?
  • 为什么说扩容会消耗性能?
  • ArrayList 数组,我们通过增强 for 循环进行删除,可以么?