现在我要说到进化论的主要观点了,进化论是一种学习形式。为了到达那里,第一个直接的障碍需要面对。大多数进化理论家否认进化有任何目的,而是认为进化只是竞争导致的一个事实。不幸的是,竞争本身不足以解释蛋白质回路是如何变得更加复杂,或如何更好地适应解决客观问题的,比如如何观察或运行。然而,正如我们所描述的那样,学习确实有一个目标函数,比如识别一种花。如果进化是PAC学习的一个实例,那么它也必须至少有一个目标,即使不是目标。那么进化的目标是什么呢?
作为一个比喻,考虑一个制造公司与其他这样的公司竞争。仅凭竞争这一事实不足以解释公司的行为。更确切地说,公司的目标是盈利,而不仅仅是为了竞技体育而存在,这种见解更能说明问题。
正如达尔文所描述的那样,进化有一个类似于企业利润的特征:适应性。在达尔文进化论中,适应性是衡量一个实体在某些环境中所享有的利益。然后,选择将进化导向适合度更高的实体。换句话说,正如公司的目标是盈利,进化的目标是保持或增加适合度。
在过去的150年里,健身已经有了几种定义。许多人追随人口遗传学家J.B.S.霍尔丹(J.B.S. Haldane)的说法,用它来指代某一特定种类的平均个体对下一代基因库的平均贡献。这一概念适用于分析静态实体之间的竞争结果,但它不能通过影响它的因素得到适合度本身的实质。我使用“适者生存”这个词的一般意义,这个词是由赫伯特·斯宾塞(Herbert Spencer)在1864年创造的,用来描述自然选择,达尔文在《物种起源》(On the Origin of Species)的后续版本中采用的。这里要描述的方法的一个创新是,适应度将根据它明显依赖的因素来定义,即进化实体和环境的行为。为了避免与霍尔丹的描述产生任何混淆,我将新的衡量标准称为性能,而不是适合度,尽管它是为了与斯宾塞和达尔文的适合度概念相一致。
在达尔文的著作中已经隐含的假设——不同的行动选择对进化的实体有不同程度的好处——我们可以用我称之为理想函数的概念来定义性能和目标。对于任何物种(或其他进化实体),在任何时刻、任何特定的环境中,这种理想的功能将在每一种可能的情况下指定最有益的行动方针。例如,在蛋白质表达的情况下,理想函数将指定,对于所有蛋白质浓度的每一个组合,每个蛋白质下一步的最有益表达水平。
这个理想的函数只需要作为一个抽象的函数存在,它不需要被任何人知道。在现实世界中,这个函数可能非常复杂。在我们的蛋白质电路例子中,理想的功能是指超过20,000个功能的总和,每一个都描述了特定蛋白质的生产。(也就是说,理想的函数应该是一组函数而不是一个函数。我们稍后再回到这一点。)因此,尽管不断进化的实体有向理想函数进化的趋势,但它只会在来自足够简单的类的理想函数中成功,就像学习只在足够简单的类中成功一样。这种配方完全弥补了我们对每种蛋白质如何与细胞发生化学作用,以及在其环境中哪些生态因素对生物体有益等知识的缺乏。所有这些知识都概括在理想函数中。
因此,进化的目标仅仅是更高的性能。这立刻使得这个过程可以作为PAC学习的一种形式来对待。此外,与机器学习算法或一般的算法一样,进化算法将在不需要任何专业知识的情况下成功,例如,生态学。意识到这些行为的习得回路的反应将是无理论的。
“理想”一词在这里不应被误解。没有任何暗示说最终的生物在任何意义上都是最佳的。没有证据表明,人类(我们现在或可能会是这样),或任何其他现存或可能存在的有机体,是进化的目标。理想只是在一个非常局部的意义上,一个不断发展的实体和一个环境。例如,对于目前环境下的人类物种来说,有些行为比其他行为更有益。第七种蛋白质的表达功能有好有坏,每天吃巧克力的量也有好有坏。由于我们在一种情况下采取的行动可能会影响到在另一种情况下什么是最有益的行动,所以我们要评估的是所有行动功能的组合。理想的方法是在环境的快照中产生最大的好处。