Everything is Compression:菲尔兹奖得主Michael Freedman的压缩世界观
1986年菲尔兹奖得主Michael Freedman(四维拓扑领域)最近发表了一篇观点性论文《Everything is Compression》,提出一个根本性主张:从物理规律到数学证明,从生命现象到智能涌现,背后最核心的原理都是压缩。
本文整理其核心思想。
压缩的定义:不止是文件压小
工程上压缩就是把大文件变小,但Freedman给出了更根本的定义:
压缩是一种映射,它把一组数据点映射到更小的空间,同时保留了我们关心的结构信息。
换句话说,压缩本质就是寻找规律:数据有规律就能压缩,规律越深刻压缩率越高。随机噪声不可压缩,而宇宙万物有规律,所以万物皆可压缩。
这个思路并不新鲜,但Freedman把它推到了极致——万物皆是压缩。
物理学:物理定律本身就是压缩
牛顿发现万有引力就是一次惊人的压缩:
- 之前:天空中所有行星、彗星无数个位置观测数据
- 之后:一个简单公式
F = G * m1 * m2 / r^2
几百年的观测数据被压缩成一行公式。这就是物理定律的本质——物理定律就是大自然的压缩算法。
Freedman认为,物理学的整个发展进程就是不断提升压缩率:从牛顿力学到相对论,再到量子力学,每一次进步都是用更紧凑的描述覆盖更多现象。弦理论试图统一四种基本力,本质上也是在追求更高的压缩率。
数学证明:证明就是压缩信息
最反直觉的一点:数学证明本身就是压缩。
举个例子:欧几里得证明"素数有无穷多个"。如果不压缩,你需要逐个验证无穷个数,信息无限大。但欧几里得用一个反证法,短短几行就解决了——这就是把"素数无穷多"的结论压缩成了有限长度的逻辑步骤。
Freedman的观点:
一个好的证明,就是一个好的压缩算法。它把一个看似复杂的结论,压缩成了人类可以理解的有限步骤。
压缩过程中产生的中间结构(新概念、新引理)还可以复用在其他证明中——压缩成果本身变成了新的压缩工具。
生命与演化:DNA就是生物的压缩编码
Freedman把压缩思想延伸到生命现象:
人体每个细胞含约3GB DNA,这3GB编码能指导发育成一个完整的人——本身就是一次极其惊人的压缩:万亿级别的细胞组织信息,被压缩在几GB的编码里。
演化过程就是大自然不断搜索更适应环境的压缩编码。能更好压缩生存信息的物种存活下来。
人工智能:大语言模型就是在学习压缩
这一点在今天看来愈发清晰:大语言模型训练的本质就是学习压缩。
Freedman的解释:模型参数就是压缩后的"规律",给定前文预测下一个词就是用学习到的压缩模型解码。
- 训练:把万亿token文本中的统计规律压缩到千亿参数里
- 推理:用压缩好的模型生成新文本
模型越大压缩能力越强,生成质量越好——因为压缩就是它的核心目标。
推论:AGI的本质就是更强的压缩能力。更强的AGI能在更广泛、更多样的数据上找到更深层规律,实现更高压缩率。
理论价值:改变看世界的角度
这篇论文不是为了证明一个新定理,它提供了一个全新的世界观:
- 之前:世界由粒子/场/能量组成
- 之后:世界由信息和规律组成,而规律的本质就是压缩
这个视角转换的启示:
-
AI研究方向:如果智能本质是压缩,那么好的AI架构就是好的压缩架构。未来方向是处理多模态、发现深层规律的压缩算法。
-
科学方法论:寻找更高压缩率的理论就是寻找更根本的科学规律。压缩率可以作为评价理论优劣的客观标准。
-
生命理解:生命的智慧写在DNA里,DNA就是亿万年演化出的最强大压缩算法。
开放性问题
这个观点并非没有争议:
- "不可压缩的随机信息算什么?"——随机就是没有规律,本来就不可压缩,符合定义。
- "创造性工作是生成不是压缩啊?"——生成本质就是解码,必须先压缩学到规律,才能高质量生成。
- "意识能压缩吗?"——这仍是开放问题,Freedman没有给出答案。
无论如何,菲尔兹奖得主将压缩提升到世界观层面,这个观点本身值得认真思考。
结语
Michael Freedman这篇短文把压缩概念从工程技术提升到了哲学层面。从物理到数学,从生命到AI,全都可以用压缩这个透镜重新审视。
我们熟悉的"奥卡姆剃刀"——"如无必要,勿增实体",用压缩语言翻译就是:能压缩到更简单,就不要用更复杂的解释。奥卡姆剃刀本质上就是:选择压缩率更高的理论。
从这个角度看,"万物皆压缩"这个观点确实值得深思。