==第十章==
[TOC]
问题
计算机没有什么用处。它们唯一能做的就是告诉你答案。
==巴勃罗·毕加索==
10.1 科学
我是英国剑桥大学的一名数学学生,在彼时的春季的某一天。 我又像往常的习惯一样,再一次去到了艺术学校听学,那里有繁多的讲座。讲座上得很好,只是能够很容易觉察出今天上课的主题。这是因为学生们可以从星期的周几中的几是偶数还是奇数加上小时时刻是偶数还是奇数来判断每个讲座是什么主题。除此以外,在这个早晨就没有什么事情发生了。 但是,这一天还是有些不同的地方。就是有一个我不认识的老人站在前面。学生们很快发现,这是保罗-狄拉克将要做他的退休演讲。就连我这样的本科生也知道,是狄拉克发现了量子力学理论的重要部分,而且他还是二十世纪物理学的重要人物。不仅如此他还写了一本 受人尊敬的教科书,担任了曾经由牛顿担任的卢卡斯数学教授席位,也许还有写学生还知道他曾在几十年前获得了诺贝尔奖。可是任何期望能在这个退休演讲中看到些许满意或胜利因素的人都会感到失望。因为他的主题是遗憾。 他解释到,在他的量子力学工作中,每当发现了什么,就会将它发 表出来,并等待着这个发现得到别人的认可。这种认可的形式是其他人跟进他的工作,并做出进一步的发现。但他依旧留下了遗憾,那就是他没有足够认真地对待自己的工作,并在此基础上更进一步,这样一来的后果就是他选择了等待让别人来做。如果不是因为这种做法的障碍,他就可以取得更大的成就。
我一直认为,科学是完全客观的。如果说是因为谁发现了它,谁说了它,又或者是怎样的说它就让它就发生了变化,那便不是科学了。然而,正如我那天所了解的那样,对科学的追求可以是一个高度私人化的问题。从那时起,我就在想,这种个人的追求是如何汇聚在一起组成科学这个整体大厦的。
10.2 一个更强大的生态计算的未来
自从我们人类第一次出现以来,世界已经发生了很多变化。我们现在共同种植和烹饪食物。与此同时我们中还有许多人生活在由数百万人组成的高度组织化的社区中,而水和电力通过管道进入我们的家庭,废物则通过管道排出。最近,又有了新的管道——信息管道,它以惊人的速度将信息传入和传出。 在人类出现之前,地球上普遍存在着一种平衡,一方面类似于达尔文的进化学说,而另一方面是个体生物的更普遍的学习算法。生命形式不断进化。进化的结果就是赋予生物某些学习能力,使它们作为个体能够在自己的日积月累的生活中逐渐适应这个世界。一些生物为了适应世界被创造出来的特质,如鸟鸣,就这样被继承下来,每一代都要学习上一代的教训与经验。不过,达尔文进化论仍然负责了基本上所有重要的新适应性的机制,这些适应性超过了个体的生命。一个生物体在其生命中进行的学习和推理,对其个体的影响仍是有限的。 随着人类文明的发展,这种平衡明显向更普遍的生态算法倾斜,而不再是作为达尔文进化论特征的有限生态算法。作为更强大的生态算法规则,这些一般的生态规则明显加速了变化的步伐。个体生物已经可以教育他们的孩子,并把他们学到的知识传授给他们,但随着文明的发展,他们已经可以创造歌曲、诗歌、绘画和书籍,使其传播知识的时间长度能够超越其创造者的生命时间长度。这样一来它们便可以被广泛和无限期地用作教育后世的教学材料。如此,个人智力工作中固有的知识就成为一种共享资源和文化的一部分。一个人第一次就可以获得从成千上万的人的经验中获得的知识回路,而不需要再重复他们的经历。我们可以把这种通过多代人的集体知识的大量积累的知识看作是可学习的目标追求,其规模是以前个体间互相学习学习时无法做到的。 文化也经历了变化或进化,但这种变化不再受到达尔文原则的限制。在这种文化进化的伴随而来一些显著的变化里,其中科学的发现和利用,让我们的生活方式产生了的巨大改变。
几千年来,人类都在致力于培育出更加多的有益于人类的植物和动物,因此到现在它带来的益处使得人类人口的数量远远超过其他方式所能维持的。正如达尔文所强调的,这种人工选择在本质上与自然选择是相同的过程,只不过是人为地选择了适合的对象。用我们的话说,它们都受制于相同的进化生态算法,只不过前者是由教师或环境来驱动,后者可以随意重新定义目标。 以这种不经意的方式挖掘生态算法的力量是一回事。现在,我们更好地了解它们的潜力,并通过技术更充分地开发这种潜力,生态算法站在重塑我们的文明,比它们以前更引人注目。从我们目前使用网络搜索引擎的经验中,就可以看出这种能力的一丝端倪。今天,受教育程度最低的人所掌握的知识比20年前受教育程度最高的人所掌握的知识还多得多,无法估量。搜索引擎中使用的基本算法,即筛选出包含某些词语的网页,并首先展示那些人们最可能感兴趣的网页,这也不过是算法的小一部分能力而已。网络强大的力量完全归功于其运行的规模--数十亿的网页。不过,若没有这样的规模即使是同样的算法运行在在一个小的、专门的数据集上则不会起多大作用。 我们对巨大的数据集以及可能从中提取的信息的直觉仍然处于初级阶段。但毫无疑问,这些数据集的存在,以及通过学习算法挖掘它们的可能性,是我们世界的一个重要的新方面。一旦更复杂的学习算法被释放到世界上所有可用的信息中,我们可能会收集到任何通过其他方式无法取得的知识。例如,如果数十亿人的详细病历和个人习惯一同以电子形式的方式出现,那么就可能产生关于医学和卫生保健的重大新发现,这一点是没有什么疑问的。与此同时发现新的重大发现的机会也会更大。在计算机技术的帮助下,我们在人工系统中使用生态算法,充分发挥其潜力,使得我们可以展望并追求与前两个进化阶段(生物和文化)一样的惊人结果。