340. Java Stream API - 理解并行流的额外开销

0 阅读2分钟

340. Java Stream API - 理解并行流的额外开销

—— 并行,不等于免费午餐!


🚀 并行流的潜在收益是有代价的!

使用 parallelStream() 看似能提升性能,但背后要付出不少额外开销

  1. 数据必须被拆分成子任务
  2. 子任务由多个线程并发执行
  3. 所有子任务的结果需要合并

⚠️ 如果你的任务本来就很轻量,或者数据不适合拆分,那么使用并行流反而会更慢!


📦 拆分数据的开销

数据的拆分(Splitting)不是“白送的”,它会消耗资源:

  • 易于拆分的源:比如 ArrayList,因为支持按索引随机访问
  • 难以拆分的源:比如 LinkedList,只能顺序遍历,拆分非常低效

🔍 举例:

List<Integer> arrayList = IntStream.range(0, 1_000_000)
                                   .boxed()
                                   .collect(Collectors.toCollection(ArrayList::new));

List<Integer> linkedList = IntStream.range(0, 1_000_000)
                                    .boxed()
                                    .collect(Collectors.toCollection(LinkedList::new));

long t1 = System.nanoTime();
arrayList.parallelStream().map(x -> x * 2).toList();
System.out.println("ArrayList time: " + (System.nanoTime() - t1));

long t2 = System.nanoTime();
linkedList.parallelStream().map(x -> x * 2).toList();
System.out.println("LinkedList time: " + (System.nanoTime() - t2));

📉 你会发现 LinkedList 表现很差,因为拆分难!


⚙️ 合并结果的成本

并行处理完后,所有子线程都要把结果汇总回来,这也有开销:

合并类型性能成本说明
✅ 求和每个线程只返回一个整数
✅ 收集到 List常见 Collector 支持高效合并
⚠️ 合并 HashMap存在键冲突时需要协调、加锁或合并逻辑

示例:合并 HashMap

Map<Integer, String> map = IntStream.range(0, 10_000)
    .parallel()
    .boxed()
    .collect(Collectors.toMap(
        i -> i % 1000,          // ❗会产生重复 key
        i -> "Val" + i,
        (v1, v2) -> v1 + "/" + v2  // 手动合并冲突值
    ));

💥 如果你忘了写 merge 函数,程序会抛出 IllegalStateException


🚧 并发副作用的地雷区

一旦你引入共享状态,并行流的所有优势都可能崩塌!

List<Integer> result = new ArrayList<>();

IntStream.range(0, 1000)
         .parallel()
         .forEach(result::add);  // ❌ 并发写入非线程安全集合

☠️ 有副作用的代码不仅慢,而且错得离谱!


📏 判断是否使用并行流的 4 条黄金法则

🧪 法则内容
Rule #1不要为了“酷”而优化。只有在确实性能不达标时才考虑并行。
Rule #2明智地选择数据源。避免使用不能高效拆分的结构(如 LinkedList)。
Rule #3不要修改外部状态,不要共享可变状态。
Rule #4不要猜性能!请使用基准测试(如 JMH)来实测

🧪 使用 JMH 快速比较并行与串行性能

@Benchmark
public void serialSum() {
    IntStream.range(0, 1_000_000).sum();
}

@Benchmark
public void parallelSum() {
    IntStream.range(0, 1_000_000).parallel().sum();
}

📊 有些场景下,串行甚至更快!


✅ 小结语:

并行不是“开个线程就能快”。你要考虑数据结构、任务粒度、副作用、合并成本。否则,你是在用8核CPU完成一个人5秒能搞定的事,还掉进了坑里!