Everything is Compression:菲尔兹奖得主Michael Freedman的压缩世界观

31 阅读5分钟

Everything is Compression Cover

Everything is Compression:菲尔兹奖得主Michael Freedman的压缩世界观

1986年菲尔兹奖得主Michael Freedman(四维拓扑领域)最近发表了一篇观点性论文《Everything is Compression》,提出一个根本性主张:从物理规律到数学证明,从生命现象到智能涌现,背后最核心的原理都是压缩

本文整理其核心思想。

压缩的定义:不止是文件压小

工程上压缩就是把大文件变小,但Freedman给出了更根本的定义:

压缩是一种映射,它把一组数据点映射到更小的空间,同时保留了我们关心的结构信息。

换句话说,压缩本质就是寻找规律:数据有规律就能压缩,规律越深刻压缩率越高。随机噪声不可压缩,而宇宙万物有规律,所以万物皆可压缩。

这个思路并不新鲜,但Freedman把它推到了极致——万物皆是压缩。

物理学:物理定律本身就是压缩

牛顿发现万有引力就是一次惊人的压缩:

  • 之前:天空中所有行星、彗星无数个位置观测数据
  • 之后:一个简单公式 F = G * m1 * m2 / r^2

几百年的观测数据被压缩成一行公式。这就是物理定律的本质——物理定律就是大自然的压缩算法

Freedman认为,物理学的整个发展进程就是不断提升压缩率:从牛顿力学到相对论,再到量子力学,每一次进步都是用更紧凑的描述覆盖更多现象。弦理论试图统一四种基本力,本质上也是在追求更高的压缩率。

数学证明:证明就是压缩信息

最反直觉的一点:数学证明本身就是压缩

举个例子:欧几里得证明"素数有无穷多个"。如果不压缩,你需要逐个验证无穷个数,信息无限大。但欧几里得用一个反证法,短短几行就解决了——这就是把"素数无穷多"的结论压缩成了有限长度的逻辑步骤。

Freedman的观点:

一个好的证明,就是一个好的压缩算法。它把一个看似复杂的结论,压缩成了人类可以理解的有限步骤。

压缩过程中产生的中间结构(新概念、新引理)还可以复用在其他证明中——压缩成果本身变成了新的压缩工具。

生命与演化:DNA就是生物的压缩编码

Freedman把压缩思想延伸到生命现象:

人体每个细胞含约3GB DNA,这3GB编码能指导发育成一个完整的人——本身就是一次极其惊人的压缩:万亿级别的细胞组织信息,被压缩在几GB的编码里。

演化过程就是大自然不断搜索更适应环境的压缩编码。能更好压缩生存信息的物种存活下来。

人工智能:大语言模型就是在学习压缩

这一点在今天看来愈发清晰:大语言模型训练的本质就是学习压缩

Freedman的解释:模型参数就是压缩后的"规律",给定前文预测下一个词就是用学习到的压缩模型解码。

  • 训练:把万亿token文本中的统计规律压缩到千亿参数里
  • 推理:用压缩好的模型生成新文本

模型越大压缩能力越强,生成质量越好——因为压缩就是它的核心目标。

推论:AGI的本质就是更强的压缩能力。更强的AGI能在更广泛、更多样的数据上找到更深层规律,实现更高压缩率。

理论价值:改变看世界的角度

这篇论文不是为了证明一个新定理,它提供了一个全新的世界观:

  • 之前:世界由粒子/场/能量组成
  • 之后:世界由信息和规律组成,而规律的本质就是压缩

这个视角转换的启示:

  1. AI研究方向:如果智能本质是压缩,那么好的AI架构就是好的压缩架构。未来方向是处理多模态、发现深层规律的压缩算法。

  2. 科学方法论:寻找更高压缩率的理论就是寻找更根本的科学规律。压缩率可以作为评价理论优劣的客观标准。

  3. 生命理解:生命的智慧写在DNA里,DNA就是亿万年演化出的最强大压缩算法。

开放性问题

这个观点并非没有争议:

  • "不可压缩的随机信息算什么?"——随机就是没有规律,本来就不可压缩,符合定义。
  • "创造性工作是生成不是压缩啊?"——生成本质就是解码,必须先压缩学到规律,才能高质量生成。
  • "意识能压缩吗?"——这仍是开放问题,Freedman没有给出答案。

无论如何,菲尔兹奖得主将压缩提升到世界观层面,这个观点本身值得认真思考。

结语

Michael Freedman这篇短文把压缩概念从工程技术提升到了哲学层面。从物理到数学,从生命到AI,全都可以用压缩这个透镜重新审视。

我们熟悉的"奥卡姆剃刀"——"如无必要,勿增实体",用压缩语言翻译就是:能压缩到更简单,就不要用更复杂的解释。奥卡姆剃刀本质上就是:选择压缩率更高的理论。

从这个角度看,"万物皆压缩"这个观点确实值得深思。