从比特到原子:第三次数字革命与形态发生学探索

4 阅读8分钟

从比特到原子:第三次数字革命

从飞机机翼到集成电路,物理世界正被数字创新所塑造,反之亦然。在麻省理工学院,比特与原子中心(CBA)的科学家们研究“如何将数据转化为事物,以及将事物转化为数据”。CBA主任尼尔·格申斐尔德(Neil Gershenfeld)——因其在“设计形态发生学”(他称之为“设计的设计”)方面的工作而获得2019年某机构机器学习研究奖(MLRA)——谈及了他的工作与计算的未来。

问:在您《设计现实》一书中,您提到了三次数字革命。第一次是通信革命,从电话发展到互联网;第二次是计算革命,出现了个人电脑和智能手机。您预测第三次将是制造革命。这与您在比特与原子中心的工作有何联系?

我从未理解物理科学与计算机科学之间的界限。我认为计算机科学是发生在计算机或科学身上的最糟糕的事情之一。我的意思是,计算机科学的核心规范从根本上讲是非物理的。

今天实际教授的计算机科学,发生在抽象的虚拟世界中。这有点像电影《大都会》,人们在花园里嬉戏,而有人在地下室操纵杠杆——这里的地下室就是数据中心之类的东西,你实际上是在那里弄清楚如何进行计算的。大量的电力、通信、带宽和低效被投入到使物理计算机像虚拟空间一样运作的过程中。

现代计算架构的奠基人约翰·冯·诺依曼和艾伦·图灵都研究过计算的物理形式。冯·诺依曼研究了自复制自动机:计算机如何传递自身的构建信息。图灵研究了形态发生:基因如何产生形态。他们研究的都不是云端计算,而是作为一种物理资源的计算。

这正是CBA工作的核心——具身化计算,而不是抽象化计算。为了可扩展性、效率和生产力,从根本上对齐硬件和软件的表示方式。将比特移入原子,将原子移出比特。

问:您能详细谈谈设计形态发生学的概念及其内涵吗?

这实际上是图灵最后研究的课题之一:基因如何产生形态。这确实是生命的核心。

你的基因组并没有在某个地方存储着“你有五根手指”的信息。它存储的是发育程序,而这个发育程序位于基因组中最古老的部分之一,称为Hox基因。它编码的步骤包括“沿着梯度生长”或“打破对称性”。当你遵循这些步骤时,最终,你会有五根手指。

这跟机器学习有着深刻的相似之处。现代机器学习并没有找到更好的搜索方法。它找到了更好的搜索表示——在有趣的地方进行搜索的方式。在今天的工程设计中,设计几乎成了其所设计事物的同义反复。如果你在设计飞机或芯片,你就在表示飞机或芯片。

但这又不是生物学的方式。所以在形态发生学项目中,我们一直在研究如何通过搜索发育程序来进行设计。我们做的一个热身问题——比最初想象的要难得多——是齿轮设计。齿轮设计异常精妙,代表了数百年的经验。我们证明了,可以通过搜索齿轮的算法表示,而不是齿轮的显式设计,来重新发现齿轮设计中数百年的经验。

问:那个齿轮项目是由MLRA支持的吗,对吗?

是的。其联系在于,这是我们获得该奖项支持后的起点。在齿轮项目中,我们发现最大的限制因素是模拟引擎。因此,我们MLRA资助的大部分研究从形态发生学转向了重新审视模拟本身。我们在这方面已经取得了足够进展,现在正回到形态发生学上来。

问:模拟的问题是什么?

如果你看看超级计算中心,大约四分之三的时间目前用于物理建模,另外四分之一左右是机器学习(这也经常涉及模拟)。物理模型是在三维空间中建模的,但无法将其与计算机的几何结构联系起来。这是我提到的许多低效问题的根源。

如今的多物理场建模很困难。你可以通过分子动力学自下而上地建模,但在模型中很难处理超过皮秒的时间尺度。然后你可以通过偏微分方程(PDE)自上而下地建模,每种物理现象都需要不同类型的PDE和不同类型的求解器。

当几何形状快速变化时,问题就会出现。以齿轮问题为例,当齿轮设计快速变化时,问题就来了。当齿轮失效时,它们可能会剪切和断裂。在传统求解器中,每一步都需要重新划分网格并处理求解器稳定性问题。这些都是我们遇到的问题。

大约有15种不同的缩写词(你可以将其概括为粒子系统)涌现出来。我们正在研究如何将这大约15种独立的粒子系统综合成一个用于多物理场建模的通用粒子框架。

所有物理模型都必须尊重因果性和局部性作为基本约束,而这些对应于传播和相互作用。因此,你可以将几乎所有的物理学简化为一个抽象概念:传播和相互作用的粒子,唯一需要变化的是相互作用的力定律。

所以这是一种高度并行的表示。它非常稳健,非常可扩展,并且覆盖了广泛的物理学领域。我们一直在做的是发展这种建模的现象学。而这个项目的核心正是用于发现这些模型的机器学习。

问:您是如何使用某机构云服务的?

我们运行一个小型内部计算集群,麻省理工学院有一个更大的集群,并且与能源部合作,我们使用国家级的超级计算机。我们讨论的很多工作介于这些范围之间,我们需要能够按需快速增加大量计算周期的能力。这正是某机构云服务如此宝贵的地方。

在那个齿轮问题中,机器学习系统会发现一些表面上满足要求、但实际上偏离了目标的设计。例如,我们设定了一个成本函数,结果搜索发现,如果它卡住齿轮的齿然后齿飞出去,会得到更高的评分。于是它制造出了会“卡住”的齿轮。

我们一直发现人在环路中扮演着至关重要的角色。这项工作非常具有交互性。不仅将批处理作业发送到大型计算系统,而是动态启动我们所需数量的节点,并与实时可视化交互式地使用它们,这非常有帮助。

问:您对未来有何展望?您想解决哪些问题?

我预计与某机构云服务的工作可能会朝三个方向发展。随着模拟引擎的工作日益成熟,它将过渡到生产模式,可以将其视为一种新型的某机构云服务——物理引擎服务。

完成这一步后,我们将回到设计形态发生学。这是两个层次的嵌套搜索:较低层次的搜索是针对物理模型,而较高层次的搜索是针对设计。我们预计将回到那个方向,并继续在某机构云服务上进行研究。

但最深远的影响是这项工作如何开始改变数据中心本身。对于物理模拟和机器学习,我们正在通过一个关于离散组装集成电子学(DICE)的项目,研究软件如何改变硬件的构建方式。随着这种机器学习系统的学习,它可以在自身成长的过程中学习自己的架构。这将引出一个非常有趣的点,即潜在的合作不仅仅是在现有硬件上获得计算时间。看看NVIDIA V100 GPU,那大约需要三年的开发和十亿美元级别的投资。很少有项目和实体能负担得起开发这样一款新芯片的经济成本。在这个DICE项目中,我们的目标是通过使用机器人组装器自动化组装小型计算模块,显著降低定制计算架构的门槛。FINISHED