Lambda calculus引论(六): 正规化与类型重建在上一节里介绍了简单带类型的λ-calculus的定义和基本

在上一节里介绍了简单带类型的λ-calculus的定义和基本性质, 这一节将介绍引入类型对λ-calculus系统的影响, 最重要的即是类型保证了系统的强正规性(strong normalization), 另外还将介绍类型检查与类型重建的方法(这一部分也是函数式编程应用里比较多关注的内容).

弱正规化定理(Weak normalization theorem)

定义: 类型 $\tau$ 的度(degree)记作 $\partial(\tau)$ , 定义如下:

$\begin{align} &\partial(\tau)=1\quad(\tau\ is\ a\ type\ variables)\\ &\partial(\tau\to\sigma)=\max\{\partial(\tau),\partial(\sigma)\}+1\\ \end{align}$

定义: 可约式(redex)的度(degree)记作 $\partial(R)$ , 定义如下:

$\begin{align} &R=(\lambda x.M)N\quad(\Gamma\vdash\lambda x.M:\tau\to\sigma)\\ &\partial(R)=\partial(\tau\to\sigma)\\ \end{align}$

定义: 表达式的度(degree)记作 d(T) , 定义为其所包含的所有可约式(redex)的度的最大值. 若为normal form, 则 d(T)=0 .

引理1: $d(T[U/x])\leq \max\{d(T),d(U),\partial(\tau)\}$ , 其中 $\Gamma(x)=\tau$ (即的类型为 $\tau$ ).

证明: 对于 T[U/x] 中的所有可约式有以下几种情况

是中原有的可约式. 在替换中不变, 显然有 $\partial(R)\leq d(T)$ .
是中的可约式. 在替换中引入, 显然有 $\partial(R)\leq d(U)$ .
是在替换后所产生的新可约式, 根据 $\partial(R)$ 定义有 $\partial(R)=\partial(\tau)$ .

那么对于可约式有 $\partial(R)\leq \max\{d(T),d(U),\partial(\tau)\}$ , 故根据表达式度的定义有 $d(T[U/x])\leq \max\{d(T),d(U),\partial(\tau)\}$ .

证毕.

引理2: 若 $M\;\triangleright_{\beta}\;N$ 那么 $d(N)\leq d(M)$ .

证明: $M\;\triangleright_{\beta}\;N$ 即中的某个可约式形如 $(\lambda x.T)U$ 规约为 T[U/x] , 对于中的所有可约式有以下几种情况

属于在规约中不变, 显然的度不发生改变, $\partial(R)\leq d(M)$ .
来自于内部, 由引理1给出 $d(T[U/x])\leq \max\{d(T),d(U),\partial(\tau)\}$ ( $\tau$ 为的类型), 其中与包含在内, 那么有 $d(T)\leq d(M)$ , $d(U)\leq d(M)$ . 并且根据定义有: $\partial(\tau)\leq d((\lambda x.T)U)\leq d(M)$ ( $(\lambda x.T)U$ 为中的一个可约式). 故 $\partial(R)\leq d(M)$ .
来自于将 $(\lambda x.T)U$ 规约为后所产生的新可约式, 根据 $\partial(R)$ 的定义有 $\partial(R)=\partial(\sigma)$ 其中 $\lambda x.T$ 的类型为 $\tau\to\sigma$ , 的类型为 $\tau$ . 又有 $\partial(\sigma)\leq d((\lambda x.T)U)\leq d(M)$ , 故 $\partial(R)\leq d(M)$ .

那么对于可约式有 $\partial(R)\leq d(M)$ , 故根据表达式度的定义有 $d(N)\leq d(M)$ .

证毕.

引理3: 若对于一个可约式, 其内部包含的所有的可约式的度均小于 d(R) , 对进行规约后得到的表达式有 d(N)<d(R) .

证明: 可约式形如 $R=(\lambda x.T)U$ 且 $\Gamma \vdash R:\tau\to\sigma$ , 那么 N=T[U/x] , 其中内部包含的所有的可约式的度均小于 $d(R)=\partial(\tau\to\sigma)$ , 即有 d(T)<d(R) 与 d(U)<d(R) . 根据引理1有 $d(T[U/x])\leq \max\{d(T),d(U),\partial(\tau)\}<d(R)$ 即 d(N)<d(R) .

证毕.

定理1: 弱正规化定理(weak normalization theorem)

简单带类型的λ-calculus具有弱规范性(weak normalization). 即所有简单带类型的λ-calculus表达式均是弱规范化的, $M\in \Lambda^{\to}\Rightarrow M\in WN_{\beta}$ .

证明:

对 d(M) 做归纳.

归纳基础: 当 d(M)=0 时, 为normal form, 显然 $M\in WN_{\beta}$ .

归纳步骤: 归纳假设当 $d(M)\leq n$ 时均有 $M\in WN_{\beta}$ .

当 d(M)=n+1 时, 选取中 d(R)=n+1 的可约式, 且内部包含的所有的可约式的度均小于 n+1 (即满足度为 n+1 最右可约式). 由引理3得, 对进行规约后中度为 n+1 的可约式将会减少. 重复该操作直至规约至, 其中中不存在的可约式, 此时 d(N)=n . 由归纳假设得 $N\in WN_{\beta}$ , 且有 $M\;\triangleright_{\beta}^{*}\;N$ , 即 $M\in WN_{\beta}$ .

故由归纳法得 $M\in \Lambda^{\to}\Rightarrow M\in WN_{\beta}$ .

证毕.

由简单带类型λ-calculus具有弱规范性, 通过leftmost reduction可得到表达式的normal form(参见第四节定理leftmost reduction).

强正规化定理(Strong normalization theorem)

这里介绍简单带类型λ-calculus强正规性的两种证明, 第一种证明方式将带类型λ-calculus转化为带类型λI-calculus形式, 利用λI-calculus系统中弱规范性等价于强规范性的性质进行证明, 第二种证明方式由W.W. Tait在1967年提出, 主要是利用类型在表达式和正规化子集间建立逻辑关系(logical relation).

第一种证明较为初等, 第二种证明可以简单地拓展到Lambda cube(后文将会介绍)上证明其强规范性.

Proof by λI-calculus

定义: $\iota$ 为简单带类型λ-calculus至简单带类型λI-calculus映射

(λI-calculus的定义参见第四节)

$\begin{align} &\iota :\Lambda^{\to}\to\Lambda_{I}\\ &\iota(x)=x\\ &\iota(MN)=\iota(M)\iota(N)\\ &\iota(\lambda x_1:\sigma_1.\cdots \lambda x_n:\sigma_n.P)=\lambda x_1:\sigma_1.\cdots \lambda x_n:\sigma_n.\lambda y_1:\tau_1.\cdots \lambda y_m:\tau_m.\\ &\qquad k_{\rho,\sigma_1}(\cdots(k_{\rho,\sigma_n}(\iota(P)y_1\cdots y_m)x_n)\cdots)x_1\\ \end{align}$

其中 $\Gamma, x_i:\sigma_i\vdash P:\tau_1\to\cdots\to\tau_m\to\rho$ , $k_{\rho,\sigma_n}:\rho\to\sigma_i\to\rho$ .

注: λI-calculus为λ-calculus子集, 简单带类型λI-calculus性质与简单带类型λ-calculus相同.

定义: 为简单带类型λI-calculus至简单带类型λ-calculus映射

$\begin{align} &t:\Lambda^{I}\to\Lambda_{\to}\\ &t(M)=\iota(M)[\mathbf{K}_{\rho,\sigma}/k_{\rho,\sigma}] \end{align}$

其中 $\mathbf{K}_{\rho,\sigma}=\lambda x:\rho.\lambda y:\sigma.x$ , $\vdash \mathbf{K}_{\rho,\sigma}:\rho\to\sigma_i\to\rho$ .

显然根据定义 $t(M)\;\triangleright_{\beta}^{*}\;M$ .

引理4: $M\in \Lambda^{\to},\ \iota(M)\in SN_{\beta}$ .

证明: 由λI-calculus中 $SN_{\beta}\equiv WN_{\beta}$ (参见第四节定理(Church, Rosser))及定理1(弱正规化定理)得 $\iota(M)\in WN_{\beta}$ , 故 $\iota(M)\in SN_{\beta}$ .

证毕.

引理5: 对于 $M\;\triangleright_{\beta}\;N$ , 其中被规约的可约式形如 $(\lambda x:\sigma.P)Q$ , $P:\rho$ , $Q:\sigma$ ( $\rho$ 为类型标识符), 则记该类规约为 $M\;\triangleright_{\beta1}\;N$ .

若有 $M_0\;\triangleright_{\beta1}\;M_1\;\triangleright_{\beta}\;M_2$ , 则存在 M_3 使得 $M_0\;\triangleright_{\beta}\;M_3\;\triangleright^{*}_{\beta1}\;M_2$ .

证明: 在 $M_0\;\triangleright_{\beta1}\;M_1\;\triangleright_{\beta}\;M_2$ 中, 对于 $M_0\;\triangleright_{\beta1}\;M_1$ , 进行规约的可约式为 $R=(\lambda x:\sigma.P)Q$ , $(\lambda x:\sigma.P)Q\;\triangleright_{\beta}\;P[Q/x]$ 其中 $(\lambda x:\sigma.P):\sigma\to\rho$ 故 $P[Q/x]:\rho$ , P[Q/x] 的类型 $\rho$ 表明 P[Q/x] 不为抽象(abstraction), 即非 $\lambda y:\tau.M$ 形式. 故 $\triangleright_{\beta1}$ 规约后不产生新的可约式. 故 $M_1\;\triangleright_{\beta}\;M_2$ 中进行规约的可约式属于 M_0 , 可交换规约顺序, 即 $M_0\;\triangleright_{\beta}\;M_3\;\triangleright^{*}_{\beta1}\;M_2$ .

(在交换规约顺序后 $M_0\;\triangleright_{\beta}\;M_3$ 规约中可能会复制出多个可约式, 故交换后为 $M_3\;\triangleright^{*}_{\beta1}\;M_2$ )

证毕.

引理6: 若 $M\in \Lambda^{\to},\ t(M)\notin SN_{\beta}$ 则存在无穷规约序列, 其中所有 $\mathbf{K}_{\rho,\sigma}$ 项没被规约.

证明: 对于 t(M) 的无穷规约序列, $t(M)=M_0\;\triangleright_{\beta}\;M_1\;\triangleright_{\beta}\;M_2\;\triangleright_{\beta}\;\cdots$ , 若其中出现 $M_i\;\triangleright_{\beta1}\;M_{i+1}\;\triangleright_{\beta}\;M_{i+2}$ 则由引理5得, 可将 $\triangleright_{\beta1}$ 规约交换后置, 即 $M_i\;\triangleright_{\beta}\;M^{'}_{i+1}\;\triangleright^{*}_{\beta1}\;M_{i+2}$ . 则对于任意有限长的前项的子规约序列, 均不存在 $\triangleright_{\beta1}$ 规约, 即存在无穷规约序列不包含 $\triangleright_{\beta1}$ 规约.

在无穷规约序列 $M_0\;\triangleright_{\beta}\;M_1\;\triangleright_{\beta}\;M_2\;\triangleright_{\beta}\;\cdots$ 中不存在 $\triangleright_{\beta1}$ 规约, 若其中对 $\mathbf{K}_{\rho,\sigma}$ 项进行规约 $\mathbf{K}_{\rho,\sigma}A\;\triangleright_{\beta}\;(\lambda y:\sigma.A)$ , 其中 $A:\rho$ , 由于规约序列中不存在 $\triangleright_{\beta1}$ 规约, 即 $(\lambda y:\sigma.A)$ 在后续规约没有被规约, 故可对所有 $\mathbf{K}_{\rho,\sigma}$ 项规约交换后置. 那么有存在无穷规约序列, 对于其任意有限长的前项的子规约序列, 均不存在 $\mathbf{K}_{\rho,\sigma}$ 项规约, 即存在无穷规约序列不包含 $\mathbf{K}_{\rho,\sigma}$ 项规约.

证毕.

引理7: $M\in \Lambda^{\to},\ t(M)\in SN_{\beta}$ .

证明: 若 $t(M)\notin SN_{\beta}$ , 由引理5得, 存在无穷规约序列 $t(M)=M_0\;\triangleright_{\beta}\;M_1\;\triangleright_{\beta}\;M_2\;\triangleright_{\beta}\;\cdots$ 其中所有 $\mathbf{K}_{\rho,\sigma}$ 项没有被规约, 那么表达式中的 $\mathbf{K}_{\rho,\sigma}$ 项与标识符 $k_{\rho,\sigma_n}$ 行为无异, 故可构造无穷规约序列 $M^{'}_0\;\triangleright_{\beta}\;M^{'}_1\;\triangleright_{\beta}\;M^{'}_2\;\triangleright_{\beta}\;\cdots$ 其中 $M^{'}_i=t^{-1}(M_i)$ ( $t^{-1}$ 为将表达式中所有 $\mathbf{K}_{\rho,\sigma}$ 项替换为标识符 $k_{\rho,\sigma_n}$ ), 故有 $\iota(M)=M^{'}_0\;\triangleright_{\beta}\;M^{'}_1\;\triangleright_{\beta}\;M^{'}_2\;\triangleright_{\beta}\;\cdots$ 为无穷规约序列, 即 $\iota(M)\notin SN_{\beta}$ 与引理4矛盾, 故 $t(M)\in SN_{\beta}$ .

证毕.

定理2.1: 强正规化定理(strong normalization theorem)

简单带类型的λ-calculus具有强规范性(strong normalization). 即所有简单带类型的λ-calculus表达式均是强规范化的, $M\in \Lambda^{\to}\Rightarrow M\in SN_{\beta}$ .

证明: 若 $M\notin SN_{\beta}$ , 由 $t(M)\;\triangleright_{\beta}^{*}\;M$ 得 $t(M)\notin SN_{\beta}$ , 与引理6矛盾. 故 $M\in SN_{\beta}$ .

证毕.

Proof by logical relation

定义: $A,B\subseteq \Lambda^{-}$ , 表达式集合 $\left\{ F\in \Lambda^{-}\;|\;\forall a\;(a\in A\to F\;a\in B) \right\}$ 记作 $A\to B$ .

定义: 对于类型 $\tau$ , 表达式集合 $[\![\tau]\!] \subseteq \Lambda^{-}$ 为类型 $\tau$ 的可计算(computable)集合, 定义如下:

$\begin{align} &\;[\![\tau]\!]=SN_{\beta}\\ &\;[\![\sigma\to\rho]\!]=[\![\sigma]\!]\to [\![\rho]\!] \end{align}$

定义: 强正规化集合的子集 $X\subseteq SN_{\beta}$ 为饱和集合(saturated)当且仅当满足:

对于 $n\geq 0$ , $M_1,\dots M_n\in SN_{\beta}$ , 有 $xM_1\cdots M_n\in X$
对于 $n\geq 1$ , $M_1,\dots M_n\in SN_{\beta}$ , 有 $M_0[M_1/x]M_2\cdots M_n\in X\Rightarrow (\lambda x.M_0)M_1M_2\cdots M_n\in X$

定义: 所有饱和集合的集合记作为 $\mathbb{S}$ , 即 $X\ is\ saturated\Rightarrow X\in\mathbb{S}$ 或 $\mathbb{S}=\left\{ X\subseteq \Lambda^{-}\;|\; X\ is\ saturated\right\}$ .

引理8: $SN_{\beta}\in\mathbb{S}$ .

证明: 显然 $n\geq 0$ , $M_1,\dots M_n\in SN_{\beta}$ , 有 $xM_1\cdots M_n\in SN_{\beta}$ . $n\geq 1$ , 显然有 $(\lambda x.M_0)M_1M_2\cdots M_n\;\triangleright_{\beta}\;M_0[M_1/x]M_2\cdots M_n$ , 故 $M_0[M_1/x]M_2\cdots M_n\in SN_{\beta}\Rightarrow (\lambda x.M_0)M_1M_2\cdots M_n\in SN_{\beta}$ .

证毕.

引理9: $A,B\in\mathbb{S}\Rightarrow A\to B\in\mathbb{S}$ .

证明:

若 $F=xM_1\cdots M_n$ (其中 $n\geq 0$ , $M_1,\dots M_n\in SN_{\beta}$ ), 有 $A,B\in\mathbb{S}$ , 令 $P\in A\subseteq SN_{\beta}$ , 那么 $F\;P=xM_1\cdots M_nP$ , 其中 $P\in SN_{\beta}$ 故由 $B\in\mathbb{S}$ 定义得 $F\;P\in B$ , 因此 $F\in A\to B$ .

若 $F=M_0[M_1/x]M_2\cdots M_n$ (其中 $n\geq 1$ , $M_1,\dots M_n\in SN_{\beta}$ )且 $F\in A\to B$ , 令 $F^{'}=(\lambda x.M_0)M_1M_2\cdots M_n$ , 由 $F\in A\to B$ 得, 对于 $P\in A\subseteq SN_{\beta}$ 有 $F\;P\in B$ , 又有 $F^{'} P\;\triangleright_{\beta}\;F\; P$ , 即 $F^{'} P\in B$ , 故 $F^{'}\in A\to B$ .

证毕.

引理10: $\sigma\in\Pi\Rightarrow [\![\sigma]\!]\in\mathbb{S}$ .

证明: 对 $\ [\![\sigma]\!]$ 做结构归纳.

若 $\sigma$ 为类型标识符, 根据定义 $\ [\![\sigma]\!]=SN_{\beta}$ , 由引理8得 $\ [\![\sigma]\!]\in\mathbb{S}$ .

若 $\sigma=\tau\to\rho$ , $\ [\![\sigma]\!]=[\![\tau]\!]\to [\![\rho]\!]$ , 由归纳假设得 $\ [\![\tau]\!],[\![\tau]\!]\in \mathbb{S}$ , 又由引理9得 $[\![\tau]\!]\to [\![\rho]\!]\in \mathbb{S}$ .

证毕.

定义: 求值(valuation) $\rho$ 为标识符到表达式上的映射 $\rho :S\to\Lambda^{-}$ .

部分替换记号 $\rho \left\{ x\!:= N\right\}$ 为:

$\rho \left\{ x\!:= N\right\} (y)= \begin{cases} N&(x\equiv y) \\ \rho(y)&(otherwise) \end{cases}$

定义: $\rho$ 为标识符上的求值, $\ [\![M]\!]_{\rho}=M[\rho(x_1)/x_1,\cdots,\rho(x_n)/x_n]$ 其中 $FV(M)=\left\{ x_1,\cdots,x_n \right\}$ .

定义: $\rho$ 为标识符上的求值, $\rho\models M:\sigma$ 当且仅当 $\;[\![M]\!]_{\rho}\in[\![\sigma]\!]$ ; $\rho\models \Gamma$ 当且仅当 $\ \forall (x:\sigma)\in\Gamma\quad(\rho(x)\in[\![\sigma]\!])$ .

定义: $\Gamma\models M:\sigma$ 当且仅当 $\forall \rho\;(\rho\models \Gamma\;\Rightarrow\; \rho\models M:\sigma)$ .

引理11: Soundness

$\Gamma\vdash M:\sigma\;\Rightarrow \;\Gamma\models M:\sigma$

证明: 对 $\Gamma \vdash M:\sigma$ 的推导做结构归纳.

若推导为 $\frac{}{\Delta, x:\sigma\vdash x:\sigma}$ , 其中 $\Gamma =\Delta ,x:\sigma$ , M=x , $x\notin dom(\Delta )$ . 若 $\rho\models \Gamma$ 则有 $\;[\![x]\!]_{\rho}=\rho(x)\in[\![\sigma]\!]$ , 即 $\rho\models x:\sigma$ , 故 $\Gamma\models x:\sigma$ .

若推导为 $\dfrac{\Gamma ,x:\tau_1\vdash N:\tau_2}{\Gamma \vdash (\lambda x.N):\tau_1\to\tau_2}$ , 其中 $x\notin dom(\Gamma )$ , $\sigma=\tau_1 \to \tau_2$ , $M=\lambda x.N$ . 不妨设 $x\notin dom(\Gamma^{'} )$ , 若 $\rho\models \Gamma$ , 令 $P\in [\![\tau_1]\!]$ , 那么有 $\rho\left\{ x\!:=P \right\} \models \Gamma,x:\tau_1$ . 根据归纳假设有 $\Gamma ,x:\tau_1\models N:\tau_2$ 那么有 $\rho\left\{ x\!:=P \right\} \models N:\tau_2$ 即 $\ [\![N]\!]_{\rho\{x\!:=P\}}\in [\![\tau_2]\!]$ .

$\begin{align} \;[\![\lambda x.N]\!]_{\rho}P\;&\equiv\; (\lambda x.N)[\rho(x_1)/x_1,\cdots,\rho(x_n)/x_n]P\\ &\triangleright_{\beta}\;N[\rho(x_1)/x_1,\cdots,\rho(x_n)/x_n,P/x]\\ &\equiv \;[\![N]\!]_{\rho\{x\!:=P\}} \end{align}$

又有 $\;[\![N]\!]_{\rho\{x\!:=P\}}\in [\![\tau_2]\!]\in\mathbb{S}$ , 其中 $[\![\lambda x.N]\!]_{\rho}P\;\triangleright_{\beta}\;[\![N]\!]_{\rho\{x\!:=P\}}$ 故 $\ [\![\lambda x.N]\!]_{\rho}P\in[\![\tau_2]\!]$ . 又有 $P\in [\![\tau_1]\!]$ , 因此可得 $\;[\![\lambda x.N]\!]_{\rho}\in[\![\tau_1\to\tau_2]\!]$ , 即 $\rho\models (\lambda x.N):\tau_1\to\tau_2$ , 故 $\Gamma\models (\lambda x.N):\tau_1\to\tau_2$ .

若推导为 $\dfrac{\Gamma \vdash P:\tau_1\to\tau_2\quad\Gamma \vdash Q:\tau_1}{\Gamma \vdash PQ:\tau_2}$ , 其中 M=PQ . 若 $\rho\models \Gamma$ , 根据归纳假设有 $\Gamma \models P:\tau_1\to\tau_2$ 与 $\Gamma \models Q:\tau_1$ 即 $\rho \models P:\tau_1\to\tau_2$ 和 $\rho \models Q:\tau_1$ , 那么有 $\;[\![P]\!]_{\rho}\in[\![\tau_1]\!]\to[\![\tau_2]\!]$ 和 $\;[\![Q]\!]_{\rho}\in[\![\tau_1]\!]$ , 故 $\;[\![PQ]\!]_{\rho}=[\![P]\!]_{\rho}[\![Q]\!]_{\rho}\in[\![\tau_2]\!]$ , 即 $\rho\models PQ:\tau_2$ , 故 $\Gamma\models PQ:\tau_2$ .

根据归纳法得 $\Gamma\vdash M:\sigma\;\Rightarrow \;\Gamma\models M:\sigma$ .

证毕.

定理2.2: 强正规化定理(strong normalization theorem)

简单带类型的λ-calculus具有强规范性(strong normalization). 即所有简单带类型的λ-calculus表达式均是强规范化的, $M\in \Lambda^{\to}\Rightarrow M\in SN_{\beta}$ .

证明: 由引理11(Soundness)得, 由 $\Gamma\vdash M:\sigma$ 得 $\Gamma\models M:\sigma$ , 取求值 $\rho$ 为 $\ \forall (x:\sigma)\in\Gamma\quad(\rho(x)=x)$ , 显然 $\rho(x)\in [\![\tau_2]\!]\in\mathbb{S}$ 即 $\rho\models \Gamma$ . 由 $\Gamma\models M:\sigma$ 得 $\;[\![M]\!]_{\rho}\in[\![\sigma]\!]$ , 其中 $\ [\![M]\!]_{\rho}=M$ , $\;[\![\sigma]\!]\subseteq SN_{\beta}$ , 故 $M\in SN_{\beta}$ .

证毕.

推论1: 所有在 $\lambda_{\to}$ 中typable的表达式构成的集合为无类型λ-calculus表达式的真子集.

证明: $\Omega =(\lambda x.x\;x)(\lambda x.x\;x)$ 在 $\lambda_{\to}$ à la Curry中非可类型化(untypable)

由定理2(强正规化定理)简单带类型的λ-calculus系统具有强规范性, $\Omega$ 显然不具有normal form. 若 $\Omega$ 可类型化, 则 $\Omega$ 具有一个normal form. 矛盾.

证毕.

推论2: 不动点组合子在 $\lambda_{\to}$ à la Curry中非可类型化(untypable), 即在 $\lambda_{\to}$ à la Curry中无法构建不动点组合子.

证明: 满足 $Yf\;\triangleright_{\beta}^{*}\;f(Yf)\quad(\forall f\in\Lambda )$ , 取 $f=\lambda x.x\ x$ . 显然为可类型化的, 若为可类型化的, 而显然不具有normal form, 类似证明推论1, 可得矛盾. 故在 $\lambda_{\to}$ 中非可类型化.

证毕.

对于不动点组合子在简单带类型λ-calculus无法构造, 直接的原因是在不动点组合子的构造中, 必然会遇到自我调用, 例如 $x\;x$ , 其类型推导为:

$\dfrac{\Gamma \vdash x\!:\!t_{1}\to t_{2}\quad \Gamma \vdash x\!:\!t_{1}}{\Gamma \vdash x~x\!:\!t_{2}}$

对于的类型实质上是递归类型 $t_{1}=t_{1}\to t_{2}$ , 在简单带类型λ-calculus系统中不具有此种类型表达.

为了在带类型λ-calculus表达递归, 一个解决方式是将不动点组合子在表达式层面上引入.

定义: $\mathbf{fix}$ 表达式

β-规约规则: $\mathbf{fix}\;f\;\triangleright_{\beta}\;f(\mathbf{fix}\;f)$ .
类型性规则(typability): $\vdash \mathbf{fix}:(\alpha\to\alpha)\to\alpha$ .

注: 在将不动点组合子加入到简单带类型λ-calculus后, 其规范性将会被破坏. 更深层次的原因可以追溯至由递归类型引入的悖论, 参见Girard悖论.

类型检查与重建(Type checking and reconstruction)

定义: 在类型系统上的三类问题

类型检查(type checking) 给定前提 $\Gamma$ , 表达式与类型 $\tau$ , 确定 $\Gamma \vdash M:\tau$ 是否成立.
类型重建(type reconstruction)或类型推导(type inference) 给定前提 $\Gamma$ 与表达式, 确定是否存在类型 $\tau$ 使得 $\Gamma \vdash M:\tau$ 是否成立.
类型居留(type inhabitation) 给定前提 $\Gamma$ 与类型 $\tau$ , 确定是否存在表达式, 使得 $\Gamma \vdash M:\tau$ 是否成立. (这里对居留问题不做深入介绍)

注: 从直觉上来说类型检查会比类型重建更容易, 但在更为丰富的类型系统中, 类型检查并不比类型重建更容易, 反而类型重建可以问题可以规约成类型检查.

对于检查表达式(其中 $FV(M)=\left\{ x_1,\cdots,x_n \right\}$ ), 确定是否存在类型 $\tau$ 在 $\Gamma$ 中使得 $\Gamma \vdash M:\tau$ 是否成立可以规约为确定

$x_0:\rho\vdash \mathbf{K}x_0(\lambda x_1.\dots\lambda x_n. M):\rho$

是否成立(即类型检查).

对于简单带类型λ-calculus的类型检查与类型重建问题, 首先从一阶合一化(first-order unification)开始介绍.

First-order unification

定义: 一阶标署(first-order signatures) $\sigma$

其中为全集, $\sigma$ 为 $\sigma =\langle \left\{ c_i \right\},\left\{ R_i\right\}, \left\{ f_i \right\} \rangle$

$\left\{ c_i \right\}$ 为常量符号集合, $c_i \in A$ .
$\left\{ R_i \right\}$ 为上的元关系, 即 $R_i \subseteq A^{k}$ .
$\left\{ f_i \right\}$ 为 $k\;(k\geq 1)$ 元函数, $f_i:A^{k}\to A$ .

其中0元函数视作为常量. 若标署中不包含关系则称该标署为代数标署(algebraic signatures), 在合一问题里只考虑代数标署.

定义: 在一阶标署 $\sigma =\langle \mathcal{C},\mathcal{R},\mathcal{F} \rangle$ 上的代数项(algebraic term) $\Sigma$ 为

常量 ( $c\in \mathcal{C}$ ).
$f(t_1,\dots,t_n)$ , 其中 $f\in\mathcal{F}$ , $t_1,\dots,t_n\in\Sigma$ .

即 $\Sigma = \mathcal{C}\;|\;\mathcal{F}(\Sigma...)$ .

定义: 方程(equation)为一对代数项 (t,u) , 写作 t=u . 方程组(system of equations)为方程的有限集合. 方程中的标识符称为未知元(unknowns).

定义: 替换(substitution)为从代数项至代数项的映射

$\begin{align} &S:\Sigma \to \Sigma \\ &S(c)=c\qquad(c\ is\ a\ constant)\\ &S(x)=\rho(x)\qquad(x\ is\ a\ variable)\\ &S(f(t_1,\dots,t_n))=f(S(f(t_1)),\dots,S(f(t_n)))\\ \end{align}$

其中对于标识符, $\rho :\Sigma \to\Sigma$ 为对该标识符的求值(valuation).

定义: 方程的解(solution of an equation)为替换, 其中求值 $\rho$ 满足对于方程 t=u 有 $S(t)\equiv S(u)$ . 方程组的解为替换均为方程组中每个方程的解.

方程的解的一个例子:

对于方程 f(gxy)x=fz(fyy) , 其解为

$\begin{align} &\rho(x)=fyy\\ &\rho(y)=y\\ &\rho(z)=g(fyy)y \end{align}$

定义: 对于方程组, 称其为已解(solved form)当且仅当

所有方程均为形式, 其中为标识符.
对于一个在方程左边的标识符, 其不出现在方程组中的任何其他位置.

对于没有出现在方程左边的标识符, 则称之为未定元(undefined).

对于一个已解的方程, 有解:

$\begin{align} &\rho_{S}(x)=t\qquad(for\ x=t)\\ &\rho_{S}(y)=y\qquad(y\ is\ undefined) \end{align}$

其中显然有 $t=S(t)$ .

定义: 对于方程组, 称其为不一致的(inconsistent)当且仅当存在以下几种形式的方程

$f(t_1,\dots,t_n)=g(u_1,\dots,u_m)$ , 其中 $f,g\in\mathcal{F},f\not\equiv g$ .
$f(t_1,\dots,t_n)=c$ 或 $c=f(t_1,\dots,t_n)$ , 其中 $f\in\mathcal{F},c\in\mathcal{C}$ .
, 其中 $c,d\in\mathcal{C},c\not\equiv d$ .
$x=f(t_1,\dots,t_n)$ , 其中出现在 $t_1,\dots,t_n$ 中.

对于一个不一致的方程组, 显然其无解.

定义: 两个方程组 $E$ 与 $E^{'}$ 为等价的(equivalent)当且仅当其解相同, 记作 $E\simeq E^{'}$ .

定义: 对于给定方程组, 判定该方程组是否存在等价方程组 $E\simeq E^{'}$ , $E^{'}$ 为已解的(solved form)或不一致的(inconsistent). 该类问题为一阶合一问题(first-order unification).

Robinson's algorithm

定义: 方程符号替换, $E\{x\!:=t\}$ 表示将方程中出现的标识符替换为代数项; 定义替换其中 $\rho_{S}(x)=t$ , 即 $E\{x\!:=t\}=S(E)$ .

定义: 对于方程组 $E$ 的变换操作

$\begin{align} E\;\cup\;\{t=t\}\;&\Rightarrow \;E && && (\textrm{delete})\\ E\;\cup\;\{f(t_1,\dots,t_n)=f(u_1,\dots,u_n)\}\;&\Rightarrow \;E\;\cup\;\{t_1=u_1,\dots,t_n=u_n\} && &&(\textrm{decompose})\\ E\;\cup\;\{f(t_1,\dots,t_n)=g(u_1,\dots,u_m)\}\;&\Rightarrow \;\bot &&if\ f\not\equiv g \ or\ n\ne m &&(\textrm{conflict})\\ E\;\cup\;\{f(t_1,\dots,t_n)=x\}\;&\Rightarrow \;E\;\cup\;\{x=f(t_1,\dots,t_n)\} && &&(\textrm{swap})\\ E\;\cup\;\{x=t\}\;&\Rightarrow \;E\{x\!:=t\}\;\cup\;\{x=t\} &&if\ x\notin Vars(t)\ and\ x\in Vars(G) &&(\textrm{eliminate})\\ E\;\cup\;\{x=f(t_1,\dots,t_n)\}\;&\Rightarrow \;\bot && if\ x\in Vars(f(t_1,\dots,t_n)) &&(\textrm{check})\\ \end{align}$

其中 $\bot$ 表示方程组不一致.

引理12: 方程组经过上述删除(delete)到检查(check)变换操作后得到方程组 $E^{'}$ , 有 $E\simeq E^{'}$ .

证明: 对于矛盾(conflict)和检查(check)变换, 显然原方程组和变换后方程组均不一致, 故等价即 $E\simeq E^{'}$ .

对于交换(swap)变换, 显然交换方程两边后方程解保持不变, 即 $E\simeq E^{'}$ .

对于删除(delete)变换, 方程 $t=t$ 对于任意解均成立, 删去后方程解保持不变, 即 $E\simeq E^{'}$ .

对于分解(decompose)变换, 若为方程组 $E^{'}=G\;\cup\;\{t_1=u_1,\dots,t_n=u_n\}$ 的解, 即有 $S(t_1)\equiv S(u_1),\dots,S(t_n)\equiv S(u_n)$ , 又由替换定义有 $S(f(t_1,\dots,t_n))=f(S(f(t_1)),\dots,S(f(t_n)))=f(S(f(u_1)),\dots,S(f(u_n)))=S(f(u_1,\dots,u_n))$ , 故为方程 $f(t_1,\dots,t_n)=g(u_1,\dots,u_m)$ 的解, 故同样为方程组 $E=G\;\cup\;\{f(t_1,\dots,t_n)=f(u_1,\dots,u_n)\}$ 的解, 反之亦然, 即 $E\simeq E^{'}$ ,

对于消除(eliminate)变换, 若 $S$ 为方程组 $E^{'}=G\{x\!:=t\}\;\cup\;\{x=t\}$ 的解, 即有 $S(x)=S(t)$ , 另外对于方程组 $G\{x\!:=t\}$ , 为其解且 $S(x)=S(t)$ , 根据替换的定义, 在方程中替换标识符和代数项与 $t$ 解亦然成立(严格证明可由归纳给出), $S$ 为方程组的解, 即为方程组 $E=G\;\cup\;\{x=t\}$ 的解, 反之亦然, 故 $E\simeq E^{'}$ .

证毕.

引理13: 对于任意方程组 $E$ , 只能应用有限次上述删除(delete)到检查(check)变换操作.

证明: 对于矛盾(conflict)和检查(check)变换, 显然进行一次变换后得到 $\bot$ , 无法继续进行变换.

对于剩余4种变换, 定义三元组 $(n_{var},n_{lhs},n_{eqn})$ , 其中 $n_{var}$ 表示方程组中重复出现的标识符的数量, $n_{lhs}$ 表示在方程左边函数符号以及常量的数目, $n_{eqn}$ 表示方程组中方程的数目.

其中在三元组上定义字典序, 即三元组 $n=(n_{var},n_{lhs},n_{eqn})$ 和 $n^{'}=(n^{'}_{var},n^{'}_{lhs},n^{'}_{eqn})$ , $n<n^{'}$ 当且仅当 $n_{var}<n^{'}_{var}$ 或 $n_{var}=n^{'}_{var},\ n_{lhs}<n^{'}_{lhs}$ 或 $n_{var}=n^{'}_{var},\ n_{lhs}=n^{'}_{lhs},\ n_{eqn}<n^{'}_{eqn}$ ; 若 $n_{var}=n^{'}_{var},\ n_{lhs}=n^{'}_{lhs},\ n_{eqn}=n^{'}_{eqn}$ 则为 $n=n^{'}$ ; 若非 $n<n^{'}$ 与 $n=n^{'}$ 则为 $n>n^{'}$ . 显然三元组上的字典序是良基关系, 且是全序关系.

设变换前的三元组为, 变换后的三元组为 $n^{'}$ .

对于进行交换(swap)变换, $n_{var}$ 与 $n_{eqn}$ 保持不变, $n_{lhs}$ 减小, 故 $n^{'}<n$ .

对于进行删除(delete)变换, $n_{var}$ 与 $n_{lhs}$ 不增加, $n_{eqn}$ 减小, 故 $n^{'}<n$ .

对于进行分解(decompose)变换, $n_{var}$ 保持不变, $n_{lhs}$ 减小, 故 $n^{'}<n$ .

对于进行消除(eliminate)变换, $n_{var}$ 减少( $G\{x\!:=t\}$ 中标识符被替换, 变换后方程组中标识符只出现一次, 在 x=t 中), 故 $n^{'}<n$ .

由上, 对方程组进行交换, 删除, 分解, 消除变换后均有 $n^{'}<n$ , 且三元组上定义字典序是良基的. 故对于任意的方程组均只能进行有限次变换.

证毕.

定理3: Robinson's algorithm

对于任意方程组, 在通过有限次上述删除(delete)到检查(check)变换操作后得到等价方程组 $E^{'}$ , $E^{'}$ 为已解的(solved form)或不一致的(inconsistent).

证明: 对于方程组, 若其为非已解的且非不一致的, 根据定义, 可对方程进行删除(delete)到检查(check)的变换操作, 由引理12与引理13得, 在有限次变换操作后(即算法必停机), 无法再继续进行变换, 得到的等价方程组 $E^{'}$ 为已解的或不一致的.

证毕.

推论3: 一阶合一问题(first-order unification)是可判定的(decidable).

证明: 由Robinson's algorithm即得.

证毕.

定义: 替换 P,R , 复合替换 $S=P\circ R$ 为 $S(t)=(P\circ R)(t)=P(R(t))$ . 其中称替换为替换的一个实例(instance). 定义偏序关系 $R\leq S$ 当且仅当 $\exists P\;(S=P\circ R)$ , 即为的实例.

定义: 替换为方程组的解, 为主解(principal solution)则对于任意替换为方程组的解当且仅当 $R\leq S$ .

方程的主解的一个例子:

其主解为 R(x)=x , 另外还有解 S(x)=f(x) , 其中有 $R\leq S$ .

引理14: 若方程组存在解, 则其存在唯一主解(principal solution).

证明: 对于方程组, 使用Robinson's algorithm, 得到等价已解方程组 $E^{'}$ , 方程组 $E^{'}$ 中的方程均形如 x=t . 令替换中的求值 $\rho$ 为 $\rho_{R}(x)=t$ , 显然替换为方程组的解, 有 t=R(t) .

若替换有 $R\leq S$ , 则 $S(x)=P(R(x))=P(\rho_{R}(x))=P(t)=P(R(t))=S(t)$ , 故替换为方程的解.

若替换为方程的解, 有 S(x)=S(t) , 又有 S(t)=S(R(t))=S(R(x)) 即 S(x)=S(R(x)) , 故 $R\leq S$ . 因此有解为方程的主解.

显然对于由Robinson's algorithm得到的替换, 其为唯一的.

证毕.

Type checking and reconstruction algorithm

定义: 对于给定的λ-表达式, 构造关于的方程组 $E_{M}$ 与类型 $\tau_{M}$ .

若( $x\in S$ ), 构造 $E_{M}=\left\{ \right\}$ , $\tau_{M}\!:=\alpha_{x}$ 其中 $\alpha_{x}$ 为一个新的类型未定元.
若, 构造 $E_{M}=E_{P}\;\cup\;E_{Q}\;\cup\;\left\{ \tau_P=\tau_Q\to\alpha_M \right\}$ , $\tau_{M}\!:=\alpha_{M}$ 其中 $\alpha_{M}$ 为一个新的类型未定元.
若 $M=(\lambda x.P)$ , 构造 $E_{M}=E_{P}$ , $\tau_{M}=\alpha_{x}\to\tau_{P}$ .

注: 在此的一阶标署中的函数唯有二元函数 $\to$ , 将 $\to(\alpha, \beta)$ 记作 $\alpha\to\beta$ .

定理4: 类型检查与重建(type checking and reconstruction)

若 $\Gamma \vdash M:\sigma$ , 对于方程组 $E_{M}$ 存在解满足 $\sigma=S(\tau_M)$ 与 $\forall x\in FV(M)\quad(S(\alpha_{x})=\Gamma(x))$ .
若替换为方程组 $E_{M}$ 的解且 $\forall x\in FV(M)\quad(S(\alpha_{x})=\Gamma(x))$ , 则有 $\Gamma \vdash M:S(\tau_M)$ .

证明:

1. 对 $\Gamma \vdash M:\sigma$ 推导做结构归纳.

若推导为 $\frac{}{\Delta, x:\sigma\vdash x:\sigma}$ , 其中 $\Gamma =\Delta ,x:\sigma$ , M=x , $x\notin dom(\Delta )$ , 且 $E_{M}=\left\{ \right\}$ , $\tau_{M}=\alpha_{x}$ 显然解为 $\rho(\alpha_x)=\sigma$ , 即 $\sigma=S(\tau_M)$ .

若推导为 $\dfrac{\Gamma ,x:\tau_1\vdash P:\tau_2}{\Gamma \vdash (\lambda x.P):\tau_1\to\tau_2}$ , 其中 $x\notin dom(\Gamma )$ , $\sigma=\tau_1 \to \tau_2$ , $M=\lambda x.P$ , 且 $E_{M}=E_{P}$ , $\tau_{M}=\alpha_{x}\to\tau_{P}$ . 不妨设 $x\notin dom(\Gamma^{'} )$ , 根据归纳假设有对于 $E_{P}$ 有解 $S_{P}$ , 令替换为:

$\rho(\alpha_{M})=\begin{cases} \tau_1 \to \tau_2 &(M=\lambda x.P)\\ \rho_{P}(\alpha_{M})&(otherwise) \end{cases}$

显然为 E_M 的解, 同时有 $S(\tau_{(\lambda x.M)})=\tau_1 \to \tau_2$ .

若推导为 $\dfrac{\Gamma \vdash P:\tau\to\sigma\quad\Gamma \vdash Q:\tau}{\Gamma \vdash PQ:\sigma}$ , 其中 M=PQ , 且 $E_{M}=E_{P}\;\cup\;E_{Q}\;\cup\;\left\{ \tau_P=\tau_Q\to\alpha_M \right\}$ , $\tau_{M}=\alpha_{M}$ . 根据归纳假设有对于 $E_{P}$ 与 $E_{Q}$ 有解 $S_{P}$ 与 $S_{Q}$ , 其中 $S_{P}(\tau_{P})=\tau\to\sigma$ 与 $S_{Q}(\tau_{Q})=\tau$ , 那么构造替换为:

$\rho(\alpha_{M})=\begin{cases} \sigma &(M=PQ)\\ \rho_{P}(\alpha_{M})&(M\ is\ sub-expression\ of\ P)\\ \rho_{Q}(\alpha_{M})&(M\ is\ sub-expression\ of\ Q) \end{cases}$

显然为 $E_{P}$ 与 $E_{Q}$ 的解;

对于 $\tau_P=\tau_Q\to\alpha_M$ , 有:

$\begin{align} &S(\tau_P)=S(\tau_Q\to\alpha_M)\\ \Rightarrow\ &S(\tau_P)=S(\tau_Q)\to S(\alpha_M)\\ \Rightarrow\ &S_P(\tau_P)=S_Q(\tau_Q)\to \sigma\\ \Rightarrow\ &(\tau\to\sigma)=(\tau\to \sigma) \end{align}$

故为方程 $\tau_P=\tau_Q\to\alpha_M$ 的解, 即替换为 E_M 的解, 同时有 $\sigma=S(\tau_M)$ .

故由归纳得原命题成立.

2. 对表达式做结构归纳.

若 M=x , 为任意标识符, 那么有 $E_{M}=\left\{ \right\}$ , $\tau_{M}=\alpha_{x}$ , 原命题显然成立;

若 M=PQ , 那么有 $E_{M}=E_{P}\;\cup\;E_{Q}\;\cup\;\left\{ \tau_P=\tau_Q\to\alpha_M \right\}$ , $\tau_{M}=\alpha_{M}$ , 替换为方程组 $E_{M}$ 的解, 故 $S(\tau_P)=S(\tau_Q\to\alpha_M)=S(\tau_Q)\to S(\tau_M)$ , 同时亦为方程 E_P 与 E_Q 的解, 根据归纳假设有 $\Gamma \vdash P:S(\tau_P)$ 即 $\Gamma \vdash P:S(\tau_Q)\to S(\tau_M)$ 与 $\Gamma \vdash Q:S(\tau_Q)$ , 因此 $\Gamma \vdash PQ: S(\tau_M)$ , 原命题成立;

若 $M=\lambda x. P$ , 那么有 $E_{M}=E_{P}$ , $\tau_{M}=\alpha_{x}\to\tau_{P}$ , 替换为方程组 $E_{M}$ 的解即 $E_{P}$ 的解, 根据归纳假设有 $\Gamma,x:S(\alpha_{x}) \vdash P:S(\tau_P)$ , 故有 $\Gamma \vdash \lambda x. P:S(\alpha_x)\to S(\tau_P)$ , 即 $\Gamma \vdash \lambda x. P:S(\tau_M)$ , 原命题成立;

故由归纳得原命题成立.

证毕.

推论4: Type checking and reconstruction algorithm

简单带类型λ-calculus的类型检查与重建是可判定的(decidable).

证明: 由定理4, 类型检查与重建可规约为一阶合一问题, 对于表达式使用Robinson's algorithm求解方程组 $E_{M}$ . 由推论3得类型检查与重建是可判定的.

证毕.

定义: 若给定表达式, 对于任何前提 $\Gamma$ 与类型 $\sigma$ 满足 $\Gamma \vdash M:\sigma$ 均存在替换使得 $\Gamma =S(\Gamma_{p})$ 与 $\sigma=S(\sigma_p)$ , 且有 $\Gamma_p \vdash M:\sigma_p$ , 则类型 $\sigma_p$ 称为主类型(principal type).