理解ECMAScript规范(2)

881 阅读9分钟

译者:李松峰

翻译本文的目的是尝试给出 ECMAScript 规范中核心术语的译法,供同好品评。

原文链接:v8.dev/blog/unders…

要理解规范,可以拿一个我们知道的 JavaScript 特性,看看它是怎么规定的。

注意,本文包含从 2020 年 2 月的 ECMAScript 规范中复制的算法,请以正式规范为准。

我们知道,访问对象的属性需要走查(walk)原型链。如果对象上没有要读的属性,就会沿原型链逐级查找,直到找到这个属性(或者找到一个没有原型的对象)。(这个过程我们可以称其为原型链走查或走查原型链。——译者注)

比如:

const o1 = { foo: 99 };
const o2 = {};
Object.setPrototypeOf(o2, o1);
o2.foo;
// → 99

这种原型走查是在哪里定义的?

最好的起点是对象内部方法

有两个与查找属性相关的内部方法:[[GetOwnProperty]][[Get]]。我们感兴趣的是不限制自有(own)属性的,所以就搜[[Get]]吧。

可是,属性描述符规范类型(Property Descriptor)也有一个字段叫[[Get]]。因此搜索的时候要注意从它们不同的用法来区分。

[[Get]]是一个基本内部方法(essential interal mehtod)。普通对象(ordinary object)都必须实现基本内部方法定义的默认行为。而异质对象(exotic object)则可以定义自己的内部方法[[Get]],其行为与默认行为不同。本文只涉及普通对象,因而不涉及自定义内部方法。

[[Get]]的默认实现委托到了 OrdinaryGet(这是一个抽象操作。——译者注):

[[Get]] ( P, Receiver )
在以属性键P和 ECMAScript 语言值 Receiver 调用 O 的内部方法[[Get]]时,执行如下步骤:
1.返回? OrdinaryGet(O, P, Receiver)

在调用访问器属性的获取函数(getter)时,Receiver 将被用作 this 值。稍后还会看到。

OrdinaryGet 的定义如下:

OrdinaryGet ( O, P, Receiver )
在以对象 O、属性键 P 和 ECMAScript 语言值 Receiver调用抽象操作OrdinaryGet 时,将执行以下步骤:
1.断言:IsPropertyKey(P)true
2.令 desc? O.[[GetOwnProperty]](P "[GetOwnProperty]")
3.若 descundefined,则
a. 令 parent? O.[[GetPrototypeOf]]( "[GetPrototypeOf]")
b. 若 parentnull,返回 undefined
c. 返回? parent.[[Get]](P, Receiver "[Get]")
4.若 IsDataDescriptor(desc)true,返回 desc.[[Value]]
5.断言:IsAccessorDescriptor(desc)true
6.令 getterdesc.[[Get]]
7.若 getterundefined,返回 undefined
8.返回? Call(getter, Receiver)

原型链走查是在第 3 步定义的:如果上一步没找到同名的自有属性,则调用原型的[[Get]]方法,于是又会委托到OrdinaryGet 抽象操作。如果在第一个原型上还没找到属性,则调用它的原型的[[Get]]方法,于是又会委托到 OrdinaryGet抽象操作。如此往复,直至找到属性或者遇到一个没有原型的对象。

下面通过分析访问o2.foo的过程来理解这个算法。首先,以o2O"foo"P 调用OrdinaryGetO.[[GetOwnProperty]]("foo")返回 undefined,因为 o2没有叫"foo"的自有属性。于是就进入第 3 步的分支。在 3.a 中,把parent 设置为 o2 的原型,也就是 o1parent 不是 null,因此不会在 3.b 返回。在 3.c 中,调用 parent[[Get]]方法,传入"foo",并返回调用的结果。

parento1)是普通对象,因此其[[Get]]方法会再次调用OrdinaryGet。这一次 Oo1P"foo"o1 有一个叫"foo"的自有属性,因此第 2 步 O.[[GetOwnProperty]]("foo")返回相应的属性描述符,并将其保存在 desc中。

属性描述符是一种规范类型。数据属性描述符把属性的值直接保存在[[Value]]字段。访问器属性描述符把访问器函数保存在[[Get]]和/或[[Set]]字段。这里与"foo"关联的属性描述符是一个数据属性描述符。

第 2 步保存在 desc 中的数据属性描述符不是 undefined,因此不会走到第 3 步的分支。接着执行第 4 步,因为这个属性描述符是数据属性描述符,所以返回了其[[Value]]字段的值 99。这样到第 4 步就结束了。

Receiver 是什么?它是从哪来的?

Receiver 参数在算法第 8 步是访问器属性的情况下才用到。在调用访问器属性的获取函数(getter)时,Receiver 将被用作this 值。

OrdinaryGet 在(3.c)递归期间始终如一地传递最初的 Receiver,不作修改。下面我们来看看这个 Receiver 是从哪里来的!

通过搜索调用[[Get]]方法的地方,我们发现一个抽象操作 GetValue,它操作的是一个引用。引用是一种规范类型,包含一个基础值(base value)、一个引用名(referenced name)和一个严格引用标志(strict reference flag)。对于o2.foo 来讲,基础值是对象 o2,引用名是字符串"foo",而严格引用标志是false(因为示例代码未启用严格模式)。

扩展学习:为什么是引用而不是记录?

引用不是记录,尽管它可以是记录。引用由 3 部分组成,可以对等地用 3 个命名字段来表示。引用不是记录属于历史遗留问题。

说回 GetValue

下面看看 GetValue的定义:

GetValue ( V )
1.ReturnIfAbrupt(V)
2.若 Type(V)非引用,返回 V
3.令 baseGetBase(V)
4.若 IsUnresolvableReference(V)true,抛出 ReferenceError 异常;
5.若 IsPropertyReference(V)true,则
a. 若 HasPrimitiveBase(V)true,则
i. 断言:此时,base 决非 undefinednull
ii. 设 base! ToObject(base)
b. 返回? base.[[Get]](GetReferencedName(V "[Get]"), GetThisValue(V))
6.否则
a. 断言 base 为环境记录;
b. 返回? base.GetBindingValue(GetReferencedName(V), IsStrictReference(V))

我们例子中的引用是 o2.foo,是个属性引用。因此,进入第 5 步。但不会进 5.a,因为 base 不是原始值(Number、String、Symbol、BigInt、Boolean、Undefined 或 Null)。

然后在 5.b 调用[[Get]],而 Receiver是通过 GetThisValue(V)传入的。这里,它就是引用的基础值。

GetThisValue( V )
1.断言:IsPropertyReference(V)true
2.若 IsSuperReference(V)true,则
a. 返回引用 VthisValue 组件的值;
3.返回 GetBase(V)

o2.foo 而言,不会进入第 2 步,因为它不是一个超类(super)引用(如 super.foo),而会进入第 3 步并返回引用的基础值 o2

综上所述,Receiver 就是原始引用的基础值,这个值在原型链走查过程中保持不变。如果要找的是一个访问器属性,则在调用获取访问器时以这个 Receiver 作为 this 值。

注意,获取函数中的 this 值引用的是我们想从中获取属性的原始对象,而不是在原型走查时从中找到属性的对象。

看个例子就明白了:

const o1 = { x: 10, get foo() { return this.x; } };
const o2 = { x: 50 };
Object.setPrototypeOf(o2, o1);
o2.foo;
// → 50

这里通过定义获取函数定义了一个访问器属性 foo。获取函数返回 this.x

然后,访问 o2.foo。你觉得这个获取函数会返回哪个值?

我们发现,调用获取函数时,this 值是我们最初尝试从中获取属性的对象,而不是从中找到这个属性的对象。具体说,就是 this 值是 o2,不是 o1。可以从返回的是 o2.x还是 o1.x 来判断:返回的是o2.x

我们通过阅读规范就可以预测这段代码的行为!

访问属性时为什么调用[[Get]]

规范哪里说在访问属性(如 o2.foo)时要调用对象的内部方法[[Get]]了?没错,一定在哪个地方规定了。不要别人说什么就信什么!

我们发现对象内部方法[[Get]]是在抽象操作 GetValue 中调用的,而 GetValue 操作的是引用。那又是哪里调用的 GetValue 呢?

MemberExpression 的运行时语义

规范的文法规则定义了语言的语法。运行时语义定义了语法构造的“含义”(如何在运行时对它们求值)。

如果你不熟悉上下文无关文法,那现在应该点开链接去了解一下。

本文后面将深入研究相关文法规则,现在先保持简单。比如,可以忽略产生式中的下标(YieldAwait,等等)。

下面的产生式(production)描述了 MemberExpression

MemberExpression :
PrimaryExpression
MemberExpression [ Expression ]
MemberExpression . IdentifierName
MemberExpression TemplateLiteral
SuperProperty
MetaProperty
new MemberExpression Arguments

这里有 7 个 MemberExpression 的产生式。意思是,MemberExpression 可以只是一个 PrimaryExpression。此外,MemberExpression 也可以构建于另一个 MemberExpressionExpression 的组合:MemberExpression [ Expression ],如 o2['foo']。或者,也可以表现为 MemberExpression . IdentifierName,如 o2.foo(这是与我们例子相关的产生式)。

产生式 MemberExpression: MemberExpression . IdentifierName 的运行时语义定义了对它求值时的步骤:

运行时语义:求值 MemberExpression : MemberExpression . IdentifierName
1.令 baseReference 为求值 MemberExpression 的结果;
2.令 baseValue? GetValue(baseReference)
3.若MemberExpression 匹配的代码为严格模式代码,令 stricttrue;否则令 strictfalse
4.返回? EvaluatePropertyAccessWithIdentifierKey(baseValue, IdentifierName, strict)

这个算法委托给了抽象操作 EvaluatePropertyAccessWithIdentifierKey,因此也要看它的定义:

EvaluatePropertyAccessWithIdentifierKey( baseValue, identifierName, strict )
抽象操作 EvaluatePropertyAccessWithIdentifierKey 接收值 baseValue、解析结点(Parse Node)identifierName 和布尔值 strict 作为参数,执行以下步骤:
1.断言:identifierNameIdentifierName
2.令 bv? RequireObjectCoercible(baseValue)
3.令 propertyNameStringidentifierNameStringValue
4.返回一个引用,其基础值为 bv、引用名为 propertyNameString、严格引用标志为 strict

换句话说,EvaluatePropertyAccessWithIdentifierKey 构建了一个引用,以提供的 baseValue作为基础,以 identifierName 作为属性名,以 strict 作为严格模式标志。

最终这个引用被传给了GetValue。规范中调用 GetValue 的地方有好几处,区别在于最后怎么使用这个引用。

译者附图

上面算法第 2 步调用? GetValue(baseReference)直接返回硬性完成([[Type]]"return"[[Value]]desc.[[Value]],然后由运行时语义解包。)

MemberExpression 作为参数

实际代码中还可能把属性访问作为参数:

console.log(o2.foo);

此时,相关行为由 ArgumentList 产生式的运行时语义来定义,这个产生式对参数调用了 GetValue

Runtime Semantics: ArgumentListEvaluation
ArgumentList : AssignmentExpression
1.令 ref为求值 AssignmentExpression 的结果;
2.令 arg? GetValue(ref)
3.返回只含一项 arg 的列表。

o2.foo 看起来不像 AssignmentExpression(赋值表达式),但它是,所以才适用这个产生式。要知道为什么,可以看看补充说明:“为什么 o2.fooAssignmentExpression?”。

第 1 步中的 AssignmentExpressiono2.foo。而求值 o2.foo 得到的结果 ref 就是上面提到的引用。第 2 步在这个引用上调用了 GetValue。这样我们就知道了对象的内部方法[[Get]]会被调用,而原型走查也会发生。

小结

本文探讨了规范如何定义语言特性,也就是原型查找,跨越了不同的抽象层,包括触发该特性的语法结构和定义它的算法。