浅谈 ArrayList 的机制与原理

100 阅读4分钟

这是我参与8月更文挑战的第25天,活动详情查看:8月更文挑战

1. 简介

ArrayList 集成自 AbstractList<E>.class,实现了 List<E>RandomAccessCloneable 以及 Serializable 接口

public class ArrayList<E> extends AbstractList<E>
        implements List<E>, RandomAccess, Cloneable, java.io.Serializable

ArrayList 是一个顺序容器,允许放入 null 元素,底层的数据结构是数组;为追求效率,ArrayList没有实现同步,所以它是线程不安全的,如果需要多个线程并发访问,可以使用 Collections.synchronizedList 创建一个线程同步的 ArrayList,当然,也可以手动同步

2. 底层数据结构详解

先来看看源码:

//底层的数组结构
transient Object[] elementData; 
//存放的元素大小
private int size;
//默认的数组容量
private static final int DEFAULT_CAPACITY = 10;

ArrayList 的数据都存储在 elementData 中,其中 size 是这个数组存放元素的数量,当第一次往 ArrayList 存放元素时,数组会被扩容成默认的长度 DEFAULT_CAPACITY 也就是 10,当然这个值是可以通过构造方法来设定的

从源码可以看到,它的底层数据结构实际上是一个 Object 类型的数组,那为什么 ArrayList 是一个泛型呢?

实际上 Java 泛型只是编译器提供的语法糖,所以这里的数组是一个Object数组,以便能够容纳任何类型的对象。

ArrayList 的三个构造函数:

// 设定初始化的数组容量
public ArrayList(int initialCapacity) {
    if (initialCapacity > 0) {
        this.elementData = new Object[initialCapacity];
    } else if (initialCapacity == 0) {
        this.elementData = EMPTY_ELEMENTDATA;
    } else {
        throw new IllegalArgumentException("Illegal Capacity: "+
                                           initialCapacity);
    }
}
​
// 创建一个默认的 ArrayList
public ArrayList() {
    this.elementData = DEFAULTCAPACITY_EMPTY_ELEMENTDATA;
}
​
// 讲一个 Collection 的元素全部拷贝到新创建的 ArrayList 中
public ArrayList(Collection<? extends E> c) {
    Object[] a = c.toArray();
    if ((size = a.length) != 0) {
        if (c.getClass() == ArrayList.class) {
            elementData = a;
        } else {
            elementData = Arrays.copyOf(a, size, Object[].class);
        }
    } else {
        // replace with empty array.
        elementData = EMPTY_ELEMENTDATA;
    }
}

3. 扩容机制

每当向数组中添加元素时,都要去检查添加后元素的个数是否会超出当前数组的长度,如果超出,数组将会进行扩容,以满足添加数据的需求;数组扩容通过一个公开的方法 ensureCapacity(int minCapacity) 来实现。在实际添加大量元素前,我也可以调用这个方法来手动增加ArrayList实例的容量,以减少递增式再分配的数量。

数组进行扩容时,会将老数组中的元素重新拷贝一份到新的数组中,每次数组容量的增长大约是其原容量的1.5倍。这种操作的代价是很高的,因此在实际使用时,我们应该尽量避免数组容量的扩张

在实际使用时,我们在创建的时候就应该预估一个大小,并且有大量元素添加时,可以手动扩容

ArrayList 自动扩容过程

4. ArrayList 和 LinkedList 有什么区别

  1. 是否保证线程安全: ArrayListLinkedList 都是不同步的,也就是不保证线程安全;

  2. 底层数据结构: Arraylist 底层使用的是 Object 数组LinkedList 底层使用的是 双向链表 数据结构(JDK1.6 之前为循环链表,JDK1.7 取消了循环。注意双向链表和双向循环链表的区别,下面有介绍到!)

  3. 插入和删除是否受元素位置的影响:

    • ArrayList 采用数组存储,所以插入和删除元素的时间复杂度受元素位置的影响。 比如:执行add(E e)方法的时候, ArrayList 会默认在将指定的元素追加到此列表的末尾,这种情况时间复杂度就是 O(1)。但是如果要在指定位置 i 插入和删除元素的话(add(int index, E element))时间复杂度就为 O(n-i)。因为在进行上述操作的时候集合中第 i 和第 i 个元素之后的(n-i)个元素都要执行向后位/向前移一位的操作。
    • LinkedList 采用链表存储,所以,如果是在头尾插入或者删除元素不受元素位置的影响(add(E e)addFirst(E e)addLast(E e)removeFirst()removeLast()),近似 O(1),如果是要在指定位置 i 插入和删除元素的话(add(int index, E element)remove(Object o)) 时间复杂度近似为 O(n) ,因为需要先移动到指定位置再插入。
  4. 是否支持快速随机访问: LinkedList 不支持高效的随机元素访问,而 ArrayList 支持。快速随机访问就是通过元素的序号快速获取元素对象(对应于get(int index)方法)。

  5. 内存空间占用: ArrayList 的空 间浪费主要体现在在 list 列表的结尾会预留一定的容量空间,而 LinkedList 的空间花费则体现在它的每一个元素都需要消耗比 ArrayList 更多的空间(因为要存放直接后继和直接前驱以及数据)

\