一个Java方法能使用多少个参数?

1,509 阅读4分钟

本文作者:justinblank, 翻译:1 Way 原文链接:justinblank.com/experiments… 译文首发:blog.didispace.com/howmanytype…

最近给我fork的项目QuickTheories增加了一个接口:

@FunctionalInterface
public interface QuadFunction<A, B, C, D, E> {
    E apply(A a, B b, C c, D d);
}

这让非常好奇一个方法能够有多少个类型参数呢?据我所知,Java的语言规范并没有提到这个问题。1

关于在实现上这个阈值的定义,我有两个猜测:

  1. 编译器会强制一个可预测的阈值,例如255或者65535。
  2. 由于实现细节的原因,编译器的异常处理会施加意想不到的限制。

我不想通过我薄弱的C++技能来测试源代码,所以我决定直接来测试编译器2。我写了一个Python脚本,通过二分法找到一个会触发错误的最小值。完整的代码请见连接Github Repo

最直接的办法就是生成方法。幸运的是,我们不必使用任何已有的类型参数,只需要按照<A,B,C..>的形式来生成:

def write_type_plain(count):
    with open('Test.java', 'w') as f:
        f.write("public class Test {\n")
        f.write("public <")
        for i in range(count):
            if (i > 0):
                f.write(", ")
            f.write("A" + str(i + 1))
        f.write("> void testMethod() {}")
        f.write("}")

运行这个二分法的代码会有如下输出:

>>> error: UTF8 representation for string "<A1:Ljava/lang/Objec..." is too long for the constant pool 
>>> largest type: 2776

这个错误让人有点费解,但是从事后来看还是可以理解的。编译器生成的类文件包含多个字符串,包括每个方法的方法签名。这些字符串保存在常量池内,而常量池的内容有最大65535字节数的限制,这个是JVM的所定义的。

所以,我之前的猜测都不是完全的正确。类型参数的最大个数是一个意料之外的值,而不是一个确定值。但是,编译器的实现本身并不是导致错误的原因3。相反,是JVM类文件的格式要求限制了类型参数可使用的数量。其实JVM对泛型本身一无所知。

这同时也表示类型参数的最大个数取决于你写的方法代码4。我尝试用另外一种类型参数的编码方案(先前链接文中的write_type_compact),使用全部合法的ASCII字符。这个实现是有点繁琐的,因为字符0-9是合法的,但不能作为标识符的首字母,并且Java关键字也不能作为类型参数。我仅仅将ifdo替换为等长的UTF-8字符。采用这种更紧凑的编码方案让类型参数的个数从2776提升到了3123。

还是有一些不太方便的地方,例如_A是一个合法的Java标识符,但是_不是。我的编码在不使用_作为首字幕的情况下,最高生成了3392个2字节的类型参数。所以我觉得不用考虑_作为首字母的情况了。

另外一个技巧

通过反编译类文件,我观察到65536个字符中大部分都不是我生成的类型参数,而是重复的字符串Ljava/lang/Object;。这是因为类型参数没有包含额外的信息,所以类文件将其视为Object的继承,并将它们编入方法签名内。我通过修改我的生成器来优化这个问题。

循环的关键代码修改为:

s = type_var(i)
f.write(s)
if (s != 'A'):
    f.write(" extends A")

除开一个实例之外,所有的类型参数都从继承java/lang/Object改为继承A。这个修改将类型参数的数量提升到9851个。

类型参数的数量提升了非常多,而我所使用的编码方法还可以继续改进。例如使用非ASCII unicode标识符,不过我已经比较满意现在的效果了。

这些都不重要

在实际情况中是不太可能达到上述数量限制的。代码生成时可能会达到语言或者编译器的某些极限,就算罕见的遇到了生成上百个类型参数的情况,那距离几千个的限制仍然还相距很远。

尽管如此,如果我是规则的制定者,我将不允许任何类或者方法使用超过255个类型参数的情况。即使只影响了百万分之一的程序,有明确的限制会更好。

  1. §4.4, §8.1.2, §9.1.2, §8.4.4, §8.8.4 这些章节都和方法或者类的类型参数有关,但是都没有指明允许有多少个类型参数。
  2. 当我写这段话时,我想起了Hotspot是C++写的,javac是Java写的。就算这样我依然会选择做代码实验,而不是阅读代码。阅读别人代码是种煎熬
  3. 逗号之后的空格不会影响,因为编译器会规范化它的输出。
  4. 这也表示与我使用哪个JVM无关。为了完整性,我在Fedora 29上使用了1.8.0_191-b13版本的OpenJdk。

本文有spring4all技术翻译组完成,更多国外前沿知识和干货好文,欢迎关注公众号:后端面试那些事儿。