计算必须数字化吗?
——关于重新定义计算的一个理论尝试
摘要
1936年,图灵给了计算一个定义:符号操作。这个定义统治了近九十年。我们用它衡量一切——从电子管到量子比特,从人脑到宇宙。但有一个根本性的问题长期被忽略:这个定义,从一开始就把“连续物理演化”排除在外了。当存内计算、神经形态芯片、模拟电路直接用物理定律执行运算时,图灵标准失效了——不是因为这些系统不够好,而是因为它们根本不在图灵定义的测量范围内。本文提出“动力学完备性”作为与图灵完备性对偶的新理论标尺,证明过阻尼朗之万系统类可以在拓扑等价意义上模拟任意连续自治动力学。我们进一步论证,动力学完备性与图灵完备性是两个正交的维度,各有其独立的理论地位和适用范围。这一框架为物理原生计算提供了严格的理论基础,也重新开启了那个被搁置已久的问题:计算,到底是什么?
一、计算必须数字化吗?
我们把这个问题拆成两步来问。
第一步:当我们说“计算”,我们到底在说什么?
图灵的回答是:计算是符号的序列操作。一条纸带,一个读写头,有限状态,离散步骤。这个模型如此成功,以至在后续的所有讨论中,“计算”和“图灵计算”几乎成了同义词。任何系统,不管它是什么,只要不能模拟通用图灵机,就会被判定为“不是真正的计算机”。
第二步:这个定义有没有遗漏?
有。而且遗漏的不是边角,是整个人类经验世界。
考虑一个忆阻器交叉杆阵列。查询向量以电压形式加在字线上,键矩阵以电导值存储在交叉点上。根据欧姆定律,每个交叉点的电流就是电压乘以电导——乘法完成了。根据基尔霍夫电流定律,位线上的总电流自动等于各支路电流之和——加法完成了。没有时钟。没有取指-译码-执行周期。没有乘法器。整个过程是一次连续的物理传导。
问题是:如果物理定律自己就做了乘法和加法,凭什么呢说“计算机”做乘法那叫计算,忆阻器做乘法就不叫计算?
图灵给出的答案是没有回答。因为他的定义从一开始就把这种“连演员自己就是剧本”的计算方式排除在了讨论范围之外。在图灵的设定里,计算必须是符号的。物理过程不碰符号——所以它不算。
但这不是论证。这是定义循环。你先把计算定义成符号操作,然后说物理过程不是符号操作所以不算计算。问题根本不在于物理过程“能不能算”,而在于你用的标准本身就是为另一个范式定制出来的。
这就是整个理论的第一块基石:物理定律本身具有计算能力,不是它像计算,是它就是计算。
过去我们说“用物理实现算法”。这句话暗含的意思是,算法是本质,物理是工具。但如果你仔细看,欧姆定律的方程是 I=GV,矩阵乘法的方程是 y=Wx。这两者之间不是“实现”关系——它们就是同一个数学结构的两种表示。就像“1+1=2”写成阿拉伯数字和写成罗马数字,你不会说一个是“本质”另一个是“工具”——你说的是同一回事,记法不同罢了。
所以,把物理系统仅仅看作“硬件加速器”是根本错误的,就像把钢琴仅仅看作是“乐谱的播放器”一样——你完全搞反了谁产生音乐。物理定律就在这里,它的演化就是计算。不需要先“数字化”再“计算”,物理过程自己就把答案给出来了。
二、图灵标准的问题在哪
这个问题困扰过很多人。1995年,Siegelmann等人证明了连续时间递归神经网络在具有实数权重时,可以计算图灵机无法计算的问题。这个结果在理论圈引起过一阵讨论,但很快被束之高阁。理由很直接:物理上不存在真正的实数精度。所以超图灵能力被认为只是理论上的玩具,不具有物理意义。
但这里有一个奇怪的逻辑跳跃。Siegelmann被发现“物理上不可实现”之后,所有人得出的结论是:所以连续系统没有超图灵能力。但没有人反过来说:那图灵的框架从一开始就不应被用来给连续系统的计算能力制定评判标准——因为它的测量维度不对。
打个比方。如果有一种乐器,音域完美覆盖了人耳听觉范围,你用“能发出超声波”作为标准去评判它能多好地演奏,然后得出结论说这个乐器不够好——这个结论对吗?逻辑上对,但前提是荒谬的。你把标准选错了。连续计算系统的优势不在于符号处理能力,而在于拥有丰富的内在动力学——混沌、极限环、同步、相变。这些恰恰是离散符号系统天然不具备的。你非要用符号处理去衡量动力学模拟,就等于非让厨师唱歌,唱不了就说他不是好厨师。
所以,问题根本不在于连续系统“不够强”,而在于我们一直只用一把尺子——图灵完备性。这把尺子能衡量“能做什么符号推理”,但衡量不了“能模拟什么动力学”。这两个维度,互相不能替代,也互相不能否定——它们就是两张皮,贴不到一起去。
三、新的理论标尺:动力学完备性
那么我们需要什么?一个新的、严格的、形式化的框架,来回答:给定一类物理系统,它能模拟多少种动力学?能不能模拟所有?如果能,在这个意义下它就是“完备”的。
也就是说,就像图灵完备性是一个理论标尺来评判“能做多少逻辑推理”,我们要找到一个同等严密的标尺来评判“能模拟多少动力学”。这个标尺,我们称之为动力学完备性。
下面给出严格的形式化定义:
定义1(动力学系统):一个动力学系统是三元组 (S, Φ_t, T),其中S是状态空间(R^n中的一个开集),Φ_t是一族从S到S的演化算符(t≥0),T是连续时间半轴[0,∞)。演化算符满足两个条件:Φ_0是恒等映射(零时间不变化),且Φ_{t+s} = Φ_t∘Φ_s(半群性质)。
定义2(动力学模拟) :一个动力学系统D₂模拟另一个系统D₁,当且仅当存在连续映射φ从S₁到S₂,使得任何时刻下“先演化再映射”等于“先映射再演化”:φ∘Φ_t¹ = Φ_t²∘φ。
定义3(拓扑等价) :两个系统D₁和D₂是拓扑等价的,如果存在一个同胚h(连续、可逆、逆连续)将S₁映射到S₂,并且这个h保持:所有轨道一一对应且时间方向一致,平衡点映射到平衡点,周期轨道映射到周期轨道,渐近稳定性和鞍点等定性类型在映射下保持不变。
定义4(动力学完备性) :一类物理系统C称为动力学完备的,当且仅当对任意给定的自治连续目标动力学,存在系统参数θ使得C(θ)与目标动力学拓扑等价。
这四个定义看起来抽象,但背后的逻辑很清晰。图灵完备性问的是:给定足够的时间和空间,这个系统能不能执行任何算法?动力学完备性问的是:给定合适的物理参数,这个系统能不能复制任何连续动力学过程的行为?
这两个问题,一个是关于“符号”的,一个是关于“演化”的。两个都值得问,但不应混为一谈。就像你不能问一台钢琴“能不能解微分方程”,也不能问一台数字处理器“能不能在物理上直接模拟湍流”——这两个问题在各自的框架下都有明确的答案,但你不能用一个框架去回答另一个框架的问题。
四、核心定理
有了上述定义框架,我们可以陈述并证明核心定理。
定理1:过阻尼朗之万系统类L是动力学完备的。
朗之万方程的数学形式是dx(t) = -μ(x)∇E(x)dt + √(2μ(x)kT(x))dW_t。这个方程描述了一类极为普遍的物理系统:状态演化由两项驱动,一项是沿能量函数梯度的确定性下降,另一项是温度驱动的随机涨落。忆阻器阵列的热动力学、胶体粒子的布朗运动、模拟退火过程的连续时间极限,都可以写成这个形式。
证明的核心思路是构造性的。给定任意一个目标动力学dx/dt = v(x),我们需要显式地构造出E(x)和T(x)是什么,让朗之万系统在零温极限下与目标拓扑等价。
如果目标动力学是势流——可以写成某个标量函数的负梯度v = -∇V——那就直接令能量函数E = V,温度取常数T₀。在T₀趋近于零的极限下,朗之万方程的确定性部分就是dx/dt = -∇V = v(x),拓扑等价性由Freidlin-Wentzell大偏差理论保证。
但如果目标动力学不是势流怎么办?这意味着v(x)中包含旋度——不能写成梯度。比如洛伦兹吸引子中那个经典的卷绕结构,它永远不能被表示成任何标量势的负梯度。这时候需要用Helmholtz-Hodge分解:将v拆成两项,v = -∇V + w,其中∇V是保守场,w是非保守场(旋度非零、无散)。
关键在于怎么处理这个w分量。朗之万方程的本征驱动力-∇E是纯势流,不能直接产生旋度。但温度场是一个被忽略的自由度。构造T(x) = T₀ + α‖w(x)‖²。在w大的地方——也就是非势流显著的地方——温度高、噪声剧烈。在w小的地方——势流主导的地方——温度低、噪声弱。温度场的空间不均匀性诱导出额外的平均漂移,在Freidlin-Wentzell准势框架下,系统的最可能轨道恰好满足dx/dt = -∇V + w = v(x)。非势流的信息被编码在了温度场的梯度里。
拓扑等价性由两部分保证:一是大偏差理论保证了最可能轨道的收敛性,二是Peixoto的结构稳定性定理保证了小扰动下系统的定性结构不变。
定理1意味着:利用热噪声和能量景观,物理系统能够模拟任意连续动力学。这篇论文不仅证明了这一点,而且给出了构造方案——给定目标动力学,E和T怎么取。这是可操作的存在性证明,不是一个哲学宣言,不需要任何比喻。
五、这两个标尺是正交的
但这还不够。一个新标尺必须回答:你和旧标尺是什么关系?你是更强?更弱?不兼容?
答案是:动力学完备性与图灵完备性是正交的。“正交”的意思是,它们衡量的是两个互不包含且互不归约的能力维度。
我们可以严格地证明这一点。要证明两个概念的独立性,只需给出一对反例:一个系统是A但不是B,另一个系统是B但不是A。
连续时间递归神经网络(CTRNN)可以作为第一个反例。CTRNN的状态空间R^n是不可数的连续统。Funahashi和Nakamura在1993年已经证明,CTRNN可以以任意精度逼近任意有限维自治常微分方程的轨迹,所以它是动力学完备的。但它不是图灵完备的。因为停机问题需要精确的数字逻辑是或否,而CTRNN的连续状态空间不形成离散符号,无法用于判定停机。
反过来,通用图灵机本身是图灵完备的,这是定义。但它的状态空间是离散的。图灵机的所有可能配置构成一个可数集。而一个连续动力学系统的轨道集合是连续统,不可数。存在从可数集到不可数集上的满射吗?康托尔对角线论证说没有。结论:图灵机不是动力学完备的。
两个反例同时成立,因此两个概念互不包含。谁也不是谁的“高级版本”。它们是不同的维度。正因如此,对物理计算系统的评估不能只问一句“它能算停机问题吗”,还必须问“它能模拟什么样的动力学”。
这确实意味着,我们对“计算”一词的理解需要分层。系统可以具备图灵完备性,也可以具备动力学完备性,许多有趣的系统两者皆是,但很多系统只占其一。这没什么错——它仅仅反映了“计算”一词涵盖若干不同但相关的能力,区别对待就好了。
六、物理世界自带的“噪音”,本质上是可利用的资源
到这里,从概念定义到核心定理,整个理论框架已经立住了。但理论必须落到工程上,否则毫无意义。落到工程时,会产生最关键的一个认知转折:物理系统的“缺陷”——噪声、精度损失、温度漂移、寄生效应——到底该怎么看?
数字电路把噪声当敌人。几个世纪从工业革命到信息时代,每一代EEPROM工程师都在不断用更复杂的纠错码、差分信号、温度补偿、屏蔽罩来对抗噪声。这是数字范式的必然代价:你要维持0和1的绝对边界,就必须把一切模糊驱赶出去。
但如果你是从“物理过程本身就是计算”这个前提出发,那噪声就成了另一种东西。朗之万方程里,随机项不是附加的误差,它是方程本身的第二项。没有噪声,系统卡在局部极小值永远出不来;没有噪声,就不会有扩散模型的生成多样性;没有噪声,模拟退火就无法工作。热噪声、离散精度、寄生电容——它们在数字世界里是要花大量晶体管去“模拟”的稀缺功能。在物理计算里它们是免费的,由热力学定律直接供应。我们过去花了五十年指责物理世界存在噪声,其实只是因为没有找到正确的计算范式来利用它——就像古代农民诅咒春雨毁路,却不知春雨能浇灌田野。
这不是什么哲学修辞。这是定理1证明的一部分:在一般情况的构造中,非势流分量就是靠温度场的空间调制来实现的。没有温度梯度,w分量就没法补偿。所以“噪声”——或者更广义地说,物理系统的非理想性——在动力学完备性框架下不是bug,是提供非势流分量的核心feature。
七、理论边界:与已有工作的关系
一个新理论的提出,必须诚实地回答:与已有工作是什么关系?是扩展?是替代?是正交?
我们先说正交的。通用逼近定理(Universal Approximation Theorem)说神经网络可以逼近任何函数。但它说的是“静态输入-输出映射”,不是“动态连续的动力学行为”。动力学完备性要求系统在轨道层面上拓扑等价于目标,逼真度和连续性要求高得多。两者不冲突,但也不重叠。
Tao在2020年证明了三维欧拉流可以实现图灵完备,用的是流体中的涡旋结构来编码逻辑门。这与本理论是互补关系:两者都是从物理过程入手,一条路径走向符号计算(离散逻辑),另一条走向动力学模拟(连续演化)。起点都是“物理可以计算”,但目的地不同。
Siegelmann在1995年证明了实数权重的神经网络具有超图灵能力。这个结果在理论上是成立的,但物理上无法实现——它要求无限精度。本框架通过“拓扑等价”这个更宽松但更物理可行的等价标准,规避了无限精度的要求。所以本框架不是否定Siegelmann的结果,而是提供了一个在物理上可操作的替代版本。Siegelmann说“可以算得比图灵机多”,我们说“不需要无限精度也能算得和图灵机不一样”。
八、终极目标:自然语言→物理版图
有了这些前提之后,我们最后做个大胆的想象。一个完整的物理流操作系统,会是什么样子?
用户输入:“我需要一个能追踪洛伦兹吸引子瞬态行为的芯片,功耗不超过10微瓦。”系统自动完成以下步骤:第一步,理解任务语义,分解出目标动力学方程的参数要求。第二步,在物理原语库中搜索最适配的组合——欧姆乘做矩阵运算,基尔霍夫和做残差,温度梯度做非势流补偿。第三步,用Helmholtz分解逆向求解出能量景观和温度场的最优配置。第四步,通过数字孪生仿真验证非理想性容忍度。第五步,输出可直接制造的物理版图。
这个版图内部的物质,没有时钟,没有取指-译码-执行周期,没有内存墙。但它在运行。它的计算就是它的物理演化。推理是弛豫,训练是演化,生成是随机游走与相变。三种模式共享同一基底,调节温度即切换模式。
这不是要替代数字计算机。数字计算机做精确代数运算是无可匹敌的。但这就像说“汽车在高速公路上是无可匹敌的”一样——它对,但不影响船和飞机的存在意义。数字计算和物理原生计算理应在异构架构中共存:数字部分负责逻辑控制和数据调度,物理部分负责大规模连续动力学模拟。各司其职。动力学完备性成为一个受约束但仍然强大的概念,而非某种虚无缥缈的无上智能。
九、结尾
这篇论文的核心主张,可以总结为三句话。
第一:完整的计算定义,不应当局限于符号操作——连续的物理动力学演化也是计算。我们需要一个关于计算本身的更一般的数学模型。
第二:过阻尼朗之万系统类在这个意义下是完备的——任意连续自主动力学都可以通过设计能量景观和温度场来模拟。物理定律在这种意义上确实是算法。
第三:这个新的完备性与图灵完备性是正交的。就像你不能用测量长度的尺子去称重,不同的维度需要独立的标准。
图灵完备性没有错。只是它管不到物理定律自己演化的那部分。我们要做的不是否定它,是补上那另一半版图。
这就完了吗?并没有。从这里才真正开始——物理复杂性理论、量子动力学完备性、物理编译器、原型制造验证。但我们终于有了一个合理的范式脚手架,可以在这个框架下严肃地讨论:怎样用物理定律计算,而不是怎样对抗它。
本文给出了地基。房子还需要很多人来盖。)