Java Lambda 表达式不为人熟知的知识点Lambda 表达式是 Java 8 的新语法，可以极大地简化代码，增强

Lambda 表达式是 Java 8 的新语法，可以极大地简化代码，增强语言的表达力。这里不赘述 Lambda 表达式的语法，主要从一道题目出发来说 Lambda 表达式的一个特性。

从前阵子开始，坚持每天在 LeetCode 做一道题。这是前话。今天在做这道题的时候，碰到一个问题，记录下来备忘。

从题目说起

题目本身很好理解：给几个区间，将其中重叠相交的合并，返回合并后的区间。

做法也不难：将区间按照"起点小的在前，起点一样的则终点小的在前"排序。

选定第一个区间 A，按序依次遍历剩下的区间 B，如果 B 的起点比 A 的终点小，则 A 和 B 可以合并。

不断重复这个选定第一个区间的操作，直至将所有可合并的区间进行合并。

最后返回剩下的区间即可。

按理说不难，做完之后，也能通过了。代码如下：

public int[][] merge(int[][] intervals) {
    Arrays.sort(intervals, (o1, o2) -> {
        if (o1[0] != o2[0]) {
            return Integer.compare(o1[0], o2[0]);
        }
        return Integer.compare(o1[1], o2[1]);
    });

    boolean[] vis = new boolean[intervals.length];
    Arrays.fill(vis, true);

    for (int i = 0; i < intervals.length; i++) {
        if (!vis[i]) {
            continue;
        }

        for (int j = i + 1; j < intervals.length; j++) {
            if (intervals[j][0] <= intervals[i][1]) {
                vis[j] = false;
                if (intervals[i][1] < intervals[j][1]) {
                    intervals[i][1] = intervals[j][1];    
                }
            }
        }
    }
    int count = 0;
    for (boolean v : vis) {
        if (v) {
            count++;
        }
    }
    int[][] ans = new int[count][];
    for (int i = 0, j = 0; i < intervals.length; i++) {
        if (!vis[i]) {
            continue;
        }
        ans[j++] = intervals[i];
    }

    return ans;
}

不太理解的是 LeetCode 上的执行时间是 84 ms，已经战胜 28.32 % 的 java 提交记录。我左思右想，这已经是 O(N) 复杂度的解法(当然还有常数级别的优化空间)，难道还能有更高效的做法？

效率差距的疑惑

于是我看了一下别人的解法，大体上是一样的，复杂的也是 O(N)。因为一些细节上的处理，会有常数级别的差距，但应该不至于有这么大的差距才对。

一开始怀疑是数据量很大，在遍历的过程需要访问当前数据和之前的数据，可能是在这时发生了取数据的耗时操作。于是尝试把需要比较的数据用临时变量存储下来。结果发现耗时并没有什么变化。

最后实在想不出来，于是照着别人的代码，一点点改，边改边看执行时间。

最后发现是排序这里的 lambda 表达式造成了效率的差距。

Java 的 Lambda

Google 搜索后看到了 Stack Overflow 上的这个提问 Java lambdas 20 times slower than anonymous classes。

可以看到 Lambda 表达式的一些特性：

Lambda 表达式对应的类是在运行时动态生成的。运行时动态生成，并不是这里慢的原因。动态生成一个结构简单的类，比从外部资源加载同样的字节流要更快。
程序必须要加载用于生成 Lambda 类的框架，才能使用 Lambda 表达式。加载框架才是这里慢的原因。(Oracle JDK 使用 ASM 来实现。)
如果不考虑加载 Lambda 框架的时间，使用 Lambda 表达式的效率会比使用类高一点。

所以，程序使用 Lambda 表达式后慢的原因也就呼之而出了：LeetCode 执行提交的代码之前，没有使用到 Lambda 表达式。当执行我们的代码时，要先加载处理 Lambda 表达式的框架。加载框架的时间会算到程序的运行时间里。

进一步的验证

虽然原理已经知道，但也要用代码从实际来验证一遍。

就像该回答中提到的，定义更多的 Lambda 表达式，也不会对运行时间有明显的影响。
我自己也做了一个实验：在程序的一次运行期间，多次执行"合并区间"的操作。每次都使用相同的数据，可以明显看到第一次执行的时间明显比后面每一次的时间都要长。这也验证了的确存在"加载 Lambda 框架"这个步骤的存在，以及这个加载过程也是主要的耗时操作。