90%的人答错！一文带你彻底搞懂ArrayList引言在Java集合中，ArrayList是最常用到的数据结构，无论是

引言

在Java集合中，ArrayList是最常用到的数据结构，无论是在日常开发还是面试中，但是很多人对它的源码并不了解。下面提问几个问题，检验一下大家对ArrayList的了解程度。

ArrayList的初始容量是多少？（90%的人都会答错）
ArrayList的扩容机制
并发修改ArrayList元素会有什么问题
如何快速安全的删除ArrayList中的元素

接下来一块分析一下ArrayList的源码，看完ArrayList源码之后，可以轻松解答上面四个问题。

简介

ArrayList底层基于数组实现，可以随机访问，内部使用一个Object数组来保存元素。它维护了一个 elementData 数组和一个 size 字段，elementData数组用来存放元素，size字段用于记录元素个数。它允许元素为null，可以动态扩容。

ArrayList的核心操作流程如下：

flowchart TD
    A[创建ArrayList] --> B{是否指定初始容量?}
    B -->|是| C[创建指定容量数组]
    B -->|否| D[初始化为空数组]
    D --> E[第一次add元素]
    E --> F[设置默认容量10]
    C --> G[add元素]
    F --> G
    G --> H{容量是否够用?}
    %% 修改点：给包含特殊符号的文本加上双引号
    H -->|是| I["直接赋值 elementData[size++] = e"]
    H -->|否| J[扩容: 新容量 = 旧容量 * 1.5]
    J --> K[创建新数组并拷贝数据]
    K --> I
    L[remove元素] --> M[找到元素位置]
    M --> N[后面元素整体左移一位]
    N --> O[最后一个位置置为null]
    O --> P[size--]
    Q[遍历ArrayList] --> R{遍历过程中修改了结构?}
    R -->|是| S[抛出ConcurrentModificationException]
    R -->|否| T[正常遍历结束]

初始化

当我们调用ArrayList的构造方法的时候，底层实现逻辑是什么样的？

// 调用无参构造方法，初始化ArrayList
List<Integer> list1 = new ArrayList<>();

// 调用有参构造方法，初始化ArrayList，指定容量为10
List<Integer> list2 = new ArrayList<>(10);

看一下底层源码实现：

// 默认容量大小
private static final int DEFAULT_CAPACITY = 10;

// 空数组，用于有参构造指定容量为0的情况
private static final Object[] EMPTY_ELEMENTDATA = {};

// 默认容量的空数组对象，用于无参构造
private static final Object[] DEFAULTCAPACITY_EMPTY_ELEMENTDATA = {};

// 存储元素的数组
transient Object[] elementData;

// 数组中元素个数，默认是0
private int size;

// 无参初始化，默认是空数组
public ArrayList() {
    this.elementData = DEFAULTCAPACITY_EMPTY_ELEMENTDATA;
}

// 有参初始化，指定容量大小
public ArrayList(int initialCapacity) {
    if (initialCapacity > 0) {
        // 直接使用指定的容量大小
        this.elementData = new Object[initialCapacity];
    } else if (initialCapacity == 0) {
        this.elementData = EMPTY_ELEMENTDATA;
    } else {
        throw new IllegalArgumentException("Illegal Capacity: "+initialCapacity);
    }
}

可以看到当我们调用ArrayList的无参构造方法 new ArrayList<>() 的时候，只是初始化了一个空对象，并没有指定数组大小，所以初始容量是零。至于什么时候指定数组大小，接着往下看。

为什么要有两个空数组常量？

EMPTY_ELEMENTDATA 和 DEFAULTCAPACITY_EMPTY_ELEMENTDATA 虽然都是空数组，但作用不同：

DEFAULTCAPACITY_EMPTY_ELEMENTDATA 专门用于无参构造，它是一个标记。当第一次添加元素时，通过判断 elementData == DEFAULTCAPACITY_EMPTY_ELEMENTDATA 来触发默认容量10的设置。
EMPTY_ELEMENTDATA 用于有参构造且指定容量为0的情况（new ArrayList<>(0)）。使用这个标记可以区分"用户明确指定容量为0"和"无参构造尚未确定容量"两种场景，避免在 calculateCapacity 中误将用户明确指定为0的容量扩展为10。

这种设计让ArrayList能准确判断是否应该使用默认容量10。

添加元素

再看一下往ArrayList中添加元素时，调用的 add() 方法源码：

// 添加元素
public boolean add(E e) {
  // 确保数组容量够用，size是元素个数
  ensureCapacityInternal(size + 1);
  // 直接在下个位置赋值
  elementData[size++] = e;
  return true;
}

// 确保数组容量够用
private void ensureCapacityInternal(int minCapacity) {
    ensureExplicitCapacity(calculateCapacity(elementData, minCapacity));
}

// 计算所需最小容量
private static int calculateCapacity(Object[] elementData, int minCapacity) {
  	// 如果是无参构造且第一次添加元素，就设置默认容量为10
    if (elementData == DEFAULTCAPACITY_EMPTY_ELEMENTDATA) {
        return Math.max(DEFAULT_CAPACITY, minCapacity);
    }
    return minCapacity;
}

// 确保容量够用
private void ensureExplicitCapacity(int minCapacity) {
    modCount++;
  	// 如果所需最小容量大于数组长度，就进行扩容
    if (minCapacity - elementData.length > 0)
        grow(minCapacity);
}

看一下扩容逻辑：

// 扩容，就是把旧数据拷贝到新数组里面
private void grow(int minCapacity) {
  int oldCapacity = elementData.length;
  // 计算新数组的容量大小，是旧容量的1.5倍
  int newCapacity = oldCapacity + (oldCapacity >> 1);

  // 如果扩容后的容量小于最小容量，扩容后的容量就等于最小容量
  if (newCapacity - minCapacity < 0)
    newCapacity = minCapacity;

  // 如果扩容后的容量超过MAX_ARRAY_SIZE，就取最大值
  if (newCapacity - MAX_ARRAY_SIZE > 0)
    newCapacity = hugeCapacity(minCapacity);
 
  // 扩容并赋值给原数组
  elementData = Arrays.copyOf(elementData, newCapacity);
}

// ArrayList中定义的数组最大容量
private static final int MAX_ARRAY_SIZE = Integer.MAX_VALUE - 8;

可以看到：

扩容的触发条件是数组全部被占满
扩容是以旧容量的1.5倍扩容，并不是2倍扩容
最大容量是 Integer.MAX_VALUE - 8（MAX_ARRAY_SIZE），这是因为部分虚拟机实现需要保留少量的 header words 在数组中
添加元素时，没有对元素校验，允许为null，也允许元素重复。

再看一下数组拷贝的逻辑，这里都是Arrays类里面的方法了：

/**
 * @param original  原数组
 * @param newLength 新的容量大小
 */
public static <T> T[] copyOf(T[] original, int newLength) {
    return (T[]) copyOf(original, newLength, original.getClass());
}

public static <T,U> T[] copyOf(U[] original, int newLength, Class<? extends T[]> newType) {
    // 创建一个新数组，容量是新的容量大小
    T[] copy = ((Object)newType == (Object)Object[].class)
        ? (T[]) new Object[newLength]
        : (T[]) Array.newInstance(newType.getComponentType(), newLength);
  	// 把原数组的元素拷贝到新数组
    System.arraycopy(original, 0, copy, 0,
                     Math.min(original.length, newLength));
    return copy;
}

最终调用了System类的数组拷贝方法，是native方法：

/**
 * @param src     原数组
 * @param srcPos  原数组的开始位置
 * @param dest    目标数组
 * @param destPos 目标数组的开始位置
 * @param length  被拷贝的长度
 */
public static native void arraycopy(Object src,  int  srcPos,
                                    Object dest, int destPos,
                                    int length);

总结一下ArrayList的 add() 方法的逻辑：

检查容量是否够用，如果够用，直接在下一个位置赋值结束。
如果是第一次添加元素（无参构造），则设置容量默认大小为10。
如果不是第一次添加元素，并且容量不够用，则执行扩容操作。扩容就是创建一个新数组，容量是原数组的1.5倍，再把原数组的元素拷贝到新数组，最后用新数组对象覆盖原数组。

需要注意的是，每次扩容都会创建新数组和拷贝数组，会有一定的时间和空间开销。在创建ArrayList的时候，如果我们可以提前预估元素的数量，最好通过有参构造函数，设置一个合适的初始容量，以减少动态扩容的次数。

随机访问

ArrayList支持通过索引快速获取元素，这是数组结构的优势：

public E get(int index) {
    rangeCheck(index);
    return elementData(index);
}

private void rangeCheck(int index) {
    if (index >= size)
        throw new IndexOutOfBoundsException(outOfBoundsMsg(index));
}

E elementData(int index) {
    return (E) elementData[index];
}

get() 方法的时间复杂度是 O(1)，因为底层是连续的数组内存，可以通过索引直接定位到元素位置，无需遍历。

删除单个元素

再看一下删除元素的方法 remove() 的源码：

public boolean remove(Object o) {
  	// 判断要删除的元素是否为null
    if (o == null) {
      	// 遍历数组
        for (int index = 0; index < size; index++)
          	// 如果和当前位置上的元素相等，就删除当前位置上的元素
            if (elementData[index] == null) {
                fastRemove(index);
                return true;
            }
    } else {
      	// 遍历数组
        for (int index = 0; index < size; index++)
          	// 如果和当前位置上的元素相等，就删除当前位置上的元素
            if (o.equals(elementData[index])) {
                fastRemove(index);
                return true;
            }
    }
    return false;
}

// 删除该位置上的元素
private void fastRemove(int index) {
    modCount++;
  	// 计算需要移动的元素的个数
    int numMoved = size - index - 1;
    if (numMoved > 0)
      	// 从index+1位置开始拷贝，也就是后面的元素整体向左移动一个位置
        System.arraycopy(elementData, index+1, elementData, index, numMoved);
  	// 设置数组最后一个元素赋值为null，防止会导致内存泄漏
    elementData[--size] = null;
}

删除元素的流程是：

判断要删除的元素是否为null，如果为null，则遍历数组，使用双等号比较元素是否相等。如果不是null，则使用 equals() 方法比较元素是否相等。这里就显得啰嗦了，可以使用 Objects.equals()方法，合并ifelse逻辑。
如果找到相等的元素，则把后面位置的所有元素整体向左移动一个位置，并把数组最后一个元素赋值为null结束。

为什么最后一个元素要置为null？

因为删除元素后，size 减小了，但 elementData 数组的容量并没有变。如果不把最后一个位置（原 size-1 位置）置为null，数组仍然持有该对象的引用，会导致该对象无法被GC回收，造成内存泄漏。这是ArrayList的内存泄漏防护机制。

可以看到遍历数组的时候，找到相等的元素，删除就结束了。如果ArrayList中存在重复元素，也只会删除其中一个元素。remove(Object o) 方法的时间复杂度是 O(n)，因为需要遍历查找 + 数组移动。

批量删除

再看一下批量删除元素方法 removeAll() 的源码：

// 批量删除ArrayList和集合c都存在的元素
public boolean removeAll(Collection<?> c) {
    // 非空校验
    Objects.requireNonNull(c);
    // 批量删除
    return batchRemove(c, false);
}

private boolean batchRemove(Collection<?> c, boolean complement){
    final Object[] elementData = this.elementData;
    int r = 0, w = 0;
    boolean modified = false;
    try {
        for (; r < size; r++)
            if (c.contains(elementData[r]) == complement)
                // 把需要保留的元素左移
                elementData[w++] = elementData[r];
    } finally {
		// 当出现异常情况的时候，可能不相等
        if (r != size) {
            // 可能是其它线程添加了元素，把新增的元素也左移
            System.arraycopy(elementData, r,
                             elementData, w,
                             size - r);
            w += size - r;
        }
      	// 把不需要保留的元素设置为null
        if (w != size) {
            for (int i = w; i < size; i++)
                elementData[i] = null;
            modCount += size - w;
            size = w;
            modified = true;
        }
    }
    return modified;
}

批量删除元素的逻辑，并不是大家想象的：

遍历数组，判断要删除的集合中是否包含当前元素，如果包含就删除当前元素。删除的流程就是把后面位置的所有元素整体左移，然后把最后位置的元素设置为null。

这样删除的操作，涉及到多次的数组拷贝，性能较差，而且还存在并发修改的问题，就是一边遍历，一边更新原数组。

批量删除元素的逻辑，设计充满了巧思，具体流程就是：

使用读写双指针：r 是读指针遍历所有元素，w 是写指针记录需要保留的元素位置。遍历过程中，需要保留的元素被紧凑地写到数组左边 elementData[w++] = elementData[r]，这一步没有数组拷贝，只是覆盖写入。
虽然ArrayList不是线程安全的，也考虑了并发修改的问题。如果上面过程中，有其他线程新增了元素，把新增的元素也移动到数组左边。
最后把数组中下标 w 右边的元素都设置为null，并更新 size。

这种双指针方案只需要遍历一次数组，不需要频繁的 System.arraycopy，性能远优于逐个删除。所以当需要批量删除元素的时候，尽量使用 removeAll() 方法，性能更好。

并发修改的问题

当遍历ArrayList的过程中，同时增删ArrayList中的元素，会发生什么情况？测试一下：

import java.util.ArrayList;
import java.util.List;

public class Test {

    public static void main(String[] args) {
        // 创建ArrayList，并添加4个元素
        List<Integer> list = new ArrayList<>();
        list.add(1);
        list.add(2);
        list.add(2);
        list.add(3);
        // 遍历ArrayList
        for (Integer key : list) {
            // 判断如果元素等于2，则删除
            if (key.equals(2)) {
                list.remove(key);
            }
        }
    }
}

运行结果：

Exception in thread "main" java.util.ConcurrentModificationException
	at java.util.ArrayList.checkForComodification(ArrayList.java:911)
	at java.util.ArrayList.next(ArrayList.java:861)
	at com.yideng.Test.main(Test.java:14)

报出了并发修改的错误，ConcurrentModificationException。

这是因为 forEach 使用了ArrayList内置的迭代器。这个迭代器实现了 fail-fast（快速失败） 机制：在迭代的过程中，会校验修改次数 modCount，如果 modCount 被修改过，则抛出 ConcurrentModificationException 异常，快速失败，避免出现不可预料的结果。

fail-fast 原理：

// ArrayList内置的迭代器
private class Itr implements Iterator<E> {
    int cursor;       
    int lastRet = -1; 
    int expectedModCount = modCount;
    
    // 迭代下个元素
    public E next() {
        // 校验 modCount
        checkForComodification();
        int i = cursor;
        if (i >= size)
            throw new NoSuchElementException();
        Object[] elementData = ArrayList.this.elementData;
        if (i >= elementData.length)
            throw new ConcurrentModificationException();
        cursor = i + 1;
        return (E)elementData[lastRet = i];
    }

    // 校验 modCount 是否被修改过
    final void checkForComodification() {
        if (modCount != expectedModCount)
            throw new ConcurrentModificationException();
    }
}

迭代器初始化时，用 expectedModCount 记录当前的 modCount
每次调用 next() 时，都会检查 modCount != expectedModCount
ArrayList 的 add()、remove() 等方法都会递增 modCount
如果迭代过程中有其他线程修改了列表，modCount 会变化，从而触发异常

modCount 是 AbstractList 中的字段，记录ArrayList结构性修改的次数。每次添加、删除、清空元素时都会递增。

如果想要安全的删除某个元素，可以使用迭代器的 remove() 方法，或者使用 removeIf() 方法。

import java.util.ArrayList;
import java.util.Iterator;
import java.util.List;

public class Test {

    public static void main(String[] args) {
        // 创建ArrayList，并添加4个元素
        List<Integer> list = new ArrayList<>();
        list.add(1);
        list.add(2);
        list.add(2);
        list.add(3);

        // 方式1：使用迭代器的 remove() 方法（不会触发 fail-fast）
        Iterator<Integer> it = list.iterator();
        while (it.hasNext()) {
            if (it.next().equals(2)) {
                it.remove();
            }
        }

        // 方式2：使用 removeIf() 方法（Java 8+）
        list.removeIf(key -> key.equals(2));
    }

}

注意：使用传统的 for (int i = 0; i < list.size(); i++) 索引遍历虽然不会触发 ConcurrentModificationException，但删除元素后后面的元素会左移，可能导致跳过某些元素，逻辑上也是不安全的。

总结

现在可以回答文章开头提出的问题了吧：

ArrayList的初始容量是多少？

答案：初始容量是0，在第一次添加元素的时候，才会设置容量为10。

ArrayList的扩容机制

答案：

创建新数组，容量是原来的1.5倍。
把旧数组元素拷贝到新数组中
使用新数组覆盖旧数组对象
并发修改ArrayList元素会有什么问题

答案：会触发 fail-fast 机制，抛出 ConcurrentModificationException 异常。

如何快速安全的删除ArrayList中的元素

答案：使用迭代器的 remove() 方法、removeIf() 方法或者 removeAll() 方法。

核心操作时间复杂度

操作	方法	时间复杂度	说明
添加元素	`add(E e)`	O(1) ~ O(n)	平均O(1)，触发扩容时O(n)
随机访问	`get(int index)`	O(1)	直接通过索引定位
查找元素	`indexOf(Object o)`	O(n)	需要遍历数组
删除元素	`remove(Object o)`	O(n)	查找O(n) + 移动元素O(n)
按索引删除	`remove(int index)`	O(n)	移动元素O(n-index)
批量删除	`removeAll(Collection<?> c)`	O(n×m)	m为集合c的大小
是否包含	`contains(Object o)`	O(n)	底层调用indexOf

使用建议

提前预估容量：创建ArrayList时如果知道大致数量，通过有参构造函数指定初始容量，避免频繁扩容带来的数组拷贝开销。
遍历时删除用 removeIf()：Java 8+ 推荐使用 removeIf() 方法，语义清晰且内部已做好fail-safe处理，避免在迭代过程中直接修改导致的 ConcurrentModificationException。
频繁删除/插入考虑 LinkedList：如果业务场景涉及大量在列表中间位置的插入和删除操作，ArrayList 的 O(n) 移动代价较高，可考虑 LinkedList 或其他数据结构。
线程安全场景用 CopyOnWriteArrayList：ArrayList不是线程安全的。多线程场景下，读多写少用 CopyOnWriteArrayList（写时拷贝，读无锁），读写均衡用 Collections.synchronizedList()。

// 读多写少的线程安全场景
List<Integer> list1 = new CopyOnWriteArrayList<>();

// 读写均衡的线程安全场景
List<Integer> list2 = Collections.synchronizedList(new ArrayList<>());