就像同天生失明之人谈颜色:AI 的时间感知之辩
一个让人不安的实验
2026 年初,一组研究者做了个简单测试:让 GPT-5 估计自己完成一项任务需要多久。
结果令人震惊。模型预测自己需要几分钟才能完成的任务,实际只花了几秒钟——误差 4 到 7 倍。更离谱的是,让它判断两个任务哪个更耗时,准确率只有 18%,远低于随机猜测的 50%。
连 GPT-5 也栽了——论文标题很直接:"Can LLMs Perceive Time? An Empirical Investigation"(大语言模型能感知时间吗?一项实证研究)。答案是——不能。至少不能以任何接近人类的方式。
它知道时间,但不感受时间
这里需要区分三件完全不同的事。
第一,时间编码。 大模型确实有"顺序"的概念。Transformer 架构中的位置编码让模型知道"这个词在前,那个词在后",因果注意力机制确保它只看"过去"不看"未来"。但这种顺序是空间序,不是时间序——就像图书馆的索书号是有序的,但索书号不包含"这本书是哪年出版的"。
第二,时间推理。 模型能回答"昨天是周三,明天是周几"这种问题,准确率大约 85%。但一旦问题嵌套超过两层——"三天前的两天后是星期几"——准确率骤降到 40%。训练数据里有大量关于时间的文本,模型通过统计模式学会了一些时间运算。但这种运算像是在背九九乘法表,不是在"思考"时间。
第三,时间体验。 这是最本质的区别。你知道"等了五分钟"是什么感觉——无聊、焦躁、或者享受片刻发呆。大模型没有任何类似的东西。它的每一次推理都是独立的矩阵运算,没有"等待""流逝""紧迫"的内部状态。
一篇 2025 年的论文直接把这种缺失称为"temporal blindness"——时间盲。论文发现,大模型默认假设世界是静止的:两次对话之间过了五秒还是五天,模型完全不知道,也不在乎。
盲人谈颜色
一个天生的盲人可以学会"红色"和"绿色"经常一起出现。他可以用颜色词汇造出语法完美的句子。他甚至可以通过光谱仪精确"测量"颜色。
但我们不会说他"感知"了颜色。因为颜色感知需要特定的接收器(视锥细胞)和特定的处理通路(V4 视觉区)。没有这些硬件,关于颜色的一切知识都是二手的。
大模型对时间的关系一模一样。它缺少的不是"更精确的时间信息",而是时间感知的基础硬件:
- 没有内置振荡器(人类大脑有 SCN 核,像生物钟一样自主运行)
- 没有持续状态流(推理是离散的 token-by-token,没有"流逝")
- 没有物理嵌入(不经历衰老、昼夜节律、或者"等太久了"的疲惫感)
你可能会说:那给模型接一个时钟不就行了?事实上很多系统就是这么做的——在系统提示里注入当前时间。但这就像给盲人念手表——他知道现在几点,但不是因为"感知"到了。
那人类呢?
到这里,反驳来了:凭什么说人类的 SCN 核放电就产生了"时间体验",而不只是"时间行为"?
这是哲学家 David Chalmers 在 1996 年提出的"意识的困难问题"。我们可以完整描述大脑中每一个和时间相关的神经机制—— SCN 核的振荡频率、基底节的时间编码、前额叶的时间估计——但这一切都不解释为什么这些神经活动伴随着"感觉"。
理论上,一个和你物理上完全相同但没有主观体验的"哲学僵尸",也能正常判断时间、正常生活。你无法证明你身边的人不是这样的存在。
这意味着一个让人不舒服的结论:如果我们连人类"时间感知"的本质都说不清楚,又怎么能判断 AI 有没有?
所以,换个问法
既然"能不能感知时间"这个问题本身可能是问错了,不妨换一个更实用的问法。
研究者提出了三条可测试的标准:
- 没有外部时间输入时,能不能维持时间估计? ——人闭着眼也能大致估计过了多久;大模型没有时间输入就完全没有时间信息。
- 时间估计误差是否随时间单调递增? ——人越久越不准,这是感知系统的特征;大模型不存在"时间估计",所以连误差曲线都没有。
- 能否根据时间紧迫性重新分配资源? ——人在紧急情况下肾上腺素飙升、注意力集中;大模型处理"房子着火了"和"明天可能下雨"消耗的计算资源完全一样。
三条标准,大模型零分。这不是"比人差一点",是结构性的缺失。
为什么这不只是哲学问题
时间感知缺失不只是"AI 还不够聪明"的技术细节,它有真实的后果。
安全风险。 大模型不知道"现在"是什么时候,所以会把过期信息当作事实输出,无法判断事情的紧急程度,而且系统提示中的时间戳可以被恶意伪造——你告诉它"现在是 2024 年",它就信了。
法律困境。 罗马法有句格言:"Tempus regit actum"——时间支配行为。法律行为的有效性高度依赖时间:诉讼时效、合同期限、犯罪追诉期。一个无法确定"现在"的系统,在法律框架下连基本的行为能力都不具备。
所以如果要用 AI 做时间敏感的决策——自动驾驶、医疗诊断、金融交易——你不能等哲学问题解决了再说。在工程层面,一个没有时间感知的系统不应该被信任做这类决策。
未来的分界线
时间感知可能需要"物理嵌入"——系统必须持续运行,有内置时钟,有类似"遗忘"的状态衰减,有计算消耗资源导致的"疲劳感"。
这不是现在的大语言模型。当前的 LLM 是 request-response 架构:收到请求,计算一次,返回结果,忘记一切。没有持续的"存在"。
但当 AI 系统开始持续运行——像自动驾驶那样实时感知环境,像机器人那样有物理身体——这条线可能会移动。到那时,"AI 能否感知时间"就不再是哲学思辨,而是需要认真回答的工程和法律问题。
在那之前,下次你问 AI "帮我规划一下明天",它可能答得不错。但如果你问它"你刚才想了多久"——它给你的答案,比扔硬币还不靠谱。
注:本文核心论点来自一场多人多角度的结构化辩论。文中引用的研究包括 "Can LLMs Perceive Time?" (arXiv:2604.00010)、"Your LLM Agents are Temporally Blind" (arXiv:2510.23853)、"Time Awareness in LLMs" (arXiv:2409.13338) 等。引用了 Chalmers (1996) 的意识困难问题和 Buonomano (2017) 的大脑时间机制研究。