在继续讨论如何将进化表述为学习之前,我需要从更广泛的角度来解释这一切。这个观点是关于可进化的目标追求,与可学习的目标追求完全相似,它表明进化需要被认为有两个组成部分。
首先,对于任何一个物种(或基因,或任何我们认为是进化的单位),在其特定的当前环境中,都将有许多可访问的目标功能,这些功能是可以通过所讨论的进化算法进化的。如果这样一个可接近的目标比当前基因组所实现的目标具有更高的性能,那么进化将以一种不需要发生不可能事件的方式无情地朝着目标前进。这是因为新的目标函数属于一个足够简单的类,它的进化是有保证的——至少是有高概率的,就像一般学习算法的可访问目标一样——通过一个可识别的进化算法,只需要实际的种群规模和实际的代数。我将在后面留下可演化的技术定义,以及可证明可演化的函数类的示例,以及其他一些不可证明的函数类的示例。
第二,一个特定的功能(比如蛋白质的表达水平)是否比另一个功能具有更高的性能,这个问题是由与物种当前状态和当前环境有关的复杂因素决定的。物种的状态可以在任何时候改变,例如,如果蛋白质的输入功能由于DNA突变而改变。函数的性能也会因为环境的变化而突然发生变化。例如,日常生活中出现的经验的相对频率的变化可能会改变最好的做法,环境中更大的灾难性事件也会改变。
可进化目标追踪假设进化过程是由随着物种和环境变化而出现的机会的继承所引导的。每个目标的追求都是通过显式进化算法来实现的,就像学习中的目标追求是通过特定的学习算法来实现的一样。因此,进化算法追求目标的过程和速度是可以预测的,就像学习算法一样。相反,一个新的有益的目标函数的出现,通过一个以前有害的功能变成有益的,必须被认为是偶然的,因为这可能是一个大陨石的到来或火山爆发的结果,或者是一些更平凡但仍然不可预测的东西。
这种双组分进化论观点与生物形态的进化速度是可变的理论是一致的。间断均衡理论断言重大的变化经常发生在短期内,而这些短期可能被较长的相对停滞期所分隔可进化的目标追踪表明,当目标是可接近的和有益的,趋同将以可预测的,也许是快速的,由进化算法的速度决定的速度发生。相反,环境中的变化使可访问的目标变得有益,并没有固定的节奏。例如,收敛到一个目标可能立即使第二个目标函数可访问,如果第二个目标是有益的,那么收敛将立即跟进。或者,在气候变化或环境中其他物种出现或消失之前,没有第二个目标会变得有益。
进化的速度是由主要环境变化发生的速度所驱动的这种观点已经过时了,他提出了这样一个问题:过去由于地球轨道的频繁变化而导致的频繁的气候变化是否可能是早期更迅速的进化的原因?然而,我们认为,目标如何频繁地成为新的可接近或新的有益的问题超出了进化理论的范围,是由外部因素决定的。进化理论可能会设定一个进化速度的上限,但在一个贫穷的环境中,这个速度可能无法达到。
趋同于有利的可接近目标和出现新的有利目标这两个组成部分之间的分歧,由于对可演化的功能类别的明显硬性限制而变得尖锐。这些硬极限类似于我们在前面讨论过的可计算、高效可计算或可学习的函数类的各种极限。
如果进化是有效的,可进化类本身就需要有一些实质性的组合复杂性,即使它的范围与发生在自然界的整体结构的复杂性相比似乎受到限制。如果演化性只适用于非常简单的函数类,比如和和或只有两个参数的函数,那么我们就需要更多的目标追踪阶段,并且后续目标彼此之间的相似性要大得多,才能产生一个复杂的函数。总体要求类似于机器学习,在机器学习中,已知的算法可以在许多变量上有效地学习函数,如线性分隔符或连接符。在实践中,对于这种比较简单的函数类,机器学习算法已经很有效了,因为它们可以从可能很大的数量中自动发现相关变量。进化算法需要克服的挑战是相同的,那就是处理大量变量的函数。
在可学习的目标追求中,整个学习过程是由对已知知识的一系列可学习的小扩展决定的,保持大量的先前知识本质上不变。这在进化过程中肯定也是如此,证据是直接的:基因组的许多部分在大类别的物种中基本保持不变。据推测,这些基因编码了一些重要而复杂的发现,而这些发现最好不要被触及,比如地球上生命共同的生化基础。这些编码的微小变化会使有机体完全无法存活。基因组的其他部分显然进化得相当快。保存而不是丢弃功能良好、有用的机制是进化的基本要素,也是学习的基本要素。
在学生追求可学习目标的过程中,教师的作用在进化中也有相似之处。学生们从为他们的知识水平准备的讲座中学习,作为目标追求。学习一个可接近的目标是他们大脑的一种可预测的生物现象,如果学习者有相似的背景知识,不同的学习者会以大致相似的方式出现在他们的头脑中。从学生的角度来看,能学到的东西完全是偶然发现的。老师选择教什么恰恰就像环境提出什么。正如有准备的学生会无情地(如果有可能的话)追求一个可学习的目标,有准备的有机体也会追求一个可进化的目标。
这个观点也很自然地把我们带到了模块的问题上。在工程或计算机编程中,由若干模块设计复杂的系统是很自然的事,每个模块都以清晰、简单的方式执行不同的功能,并与其他模块相互连接。对于人工产品来说,模块化是一个重要的设计原则,它提供了许多明显的优势,例如易于设计、易于人为理解和易于维护。
生物系统也被认为是高度模块化的。的确,这似乎是我们理解他们的唯一机会。然而,模块化在生物学中所提供的优势并不那么明显。我认为进化论的明显的严格限制可以解释这一点。这些限制使得简单的系统,比如那些控制参数较少的系统,比那些依赖更多参数的系统更容易进化。模块化意味着一个复杂的系统可以被分解成许多在很大程度上独立工作的简单系统。这种更简单的子系统,每个子系统都是独立发展的,与单一的复杂系统相比,在可发展性方面受到的固有限制较少。