自主 AI 的下一次飞跃,不是更大的上下文窗口。而是为智能体提供对世界的结构化理解——以及一套记忆架构。
自主 AI 的下一次飞跃,不是更大的上下文窗口。而是为智能体提供对世界的结构化理解——以及一套能够承载这种理解的记忆架构。
在 AI 智能体的构建者之间,一个共识正在悄然形成:记忆才是瓶颈。不是模型大小,不是上下文长度,也不是工具调用能力——而是记忆。是积累知识、对知识进行有意义组织,并在正确时机召回正确信息的能力。
大多数团队试图用向量数据库解决这个问题:把一切内容向量化,靠相似度检索,然后听天由命。这种方案在演示里有效,但在任何需要长期稳定运行的场景中都会失效。
我们自己也走过这条路。而我们得出的结论——如今也得到越来越多研究的支持,包括香港理工大学近期一项覆盖 200 多项相关工作的综述——是:解决方案需要两样东西协同工作:明确的本体论,为智能体的知识提供结构;以及基于图的存储,能够忠实地表示、查询并随时间演进这种结构。
这并非两个独立的概念。它们是同一洞见的两半而已。
缺失的一层:为什么智能体需要本体论
在这个语境下,本体论(Ontology)是对智能体世界中存在的事物类型,以及它们之间如何关联的形式化定义。它是一套用于理解的模式(schema)——宣告“我关心这些类型的实体、它们之间的这些关系,以及约束这些关系的规则”。
以客服智能体为例:
•
没有本体论,智能体积累的只是一堆杂乱无章的对话片段、工具输出和用户消息。
•
有了本体论,它就知道:客户可以拥有订阅,订阅包含套餐和计费周期,问题与产品关联并拥有解决状态,客户的情绪会在交互中发生变化。
本体论本身不存储数据——它定义数据的结构。
这一点至关重要,因为结构才让记忆变得有用。对比两种存储同一条简单事实的方式:
“用户上周二从专业版套餐切换到企业版套餐”
•
没有本体论:这条信息变成向量库中的一段文本。后续检索依赖查询语义是否恰好相似。“用户当前是什么套餐?”也许能搜到。“最近发生了什么变化?”可能根本搜不出来。“该用户是否符合企业版 SLA 资格?”则完全没有可能。
•
有本体论:这条信息变成一个结构化事件:一个套餐变更,将客户与新订阅以时间戳关联。任何涉及客户、套餐、订阅、计费或近期变更的查询,都能通过显式关系找到这条事实,而不是靠向量化相似度的偶然匹配。
Yang 等人的综述将其归纳为知识记忆与经验记忆的区别:
•
知识记忆:智能体对世界如何组织的稳定理解,本质上是本体论层面的,提供骨架。
•
经验记忆:真实发生事件的动态记录,为骨架填充具体实例。
两者缺一不可。但没有本体层,经验记忆只是一堆日志。
我们认为,这是当前智能体架构中最被低估的思想。AI 社区在检索技术、嵌入模型、上下文管理上投入了巨大精力,却很少关注一个更前置的问题:
我们想要记住的东西,其结构是什么?
为什么图是结构化记忆的天然归宿
一旦你采用结构化、本体论的思路来设计智能体记忆,存储方案几乎不言自明:
你需要一种数据结构,能够表示:
•
带类型的实体
•
实体间具名关系
•
层次化组织
•
时间动态变化
•
灵活的模式演进
这就是图(Graph)。
该综述梳理了多种图结构记忆,每一种都天然对应本体结构的不同方面:
知识图谱
是本体记忆最直接的表达。以实体—关系三元组存储信息:
(客户, 订阅了, 企业版套餐)
类型与关系由本体定义。这是智能体的事实骨干:结构化、可查询、可解释。
层次图
表达本体天然定义的包含与抽象关系:
•
部门包含团队,团队包含成员
•
项目包含阶段,阶段包含任务
这种父子结构让智能体可以在不同粒度上推理:宏观看大局,微观看细节。
时序图
解决纯本体论无法处理的问题:事物会变化。
将三元组扩展为四元组:
(客户, 订阅了, 专业版套餐, 有效期至:周二)
时序图追踪世界的演变。综述提到的 Graphiti 等系统会维护独立的创建与过期时间戳,通过时序失效而非覆盖来解决冲突。
超图
处理关系跨越两个以上实体的场景。
例如一次临床交互中:患者、药物、病症、结果,天然是一条超边,而不是被拆分成三个失去整体意义的二元关系。
大多数工业级系统会将多种图结构组合为混合架构:用知识图谱存静态本体知识,用时序或层次结构存动态经验数据,通过共享实体引用关联。
图相对于扁平存储的关键优势,不只是结构保真——更是检索质量。
当记忆按本体组织并存在图中,检索不再是基于相似度的猜谜,而是结构化导航。
从模式到搜索:结构如何重塑检索
本体论 + 图,两者结合会产生倍增效应。基于本体的图检索,与纯向量库检索有着本质区别。
1. 语义检索 + 结构化遍历
语义检索仍是起点:你可以对查询向量化,找到相关的锚点节点。
但接下来,结构化遍历接管:
智能体沿着本体定义的类型化关系路径游走:
客户 → 订阅 → 计费历史 → 争议 → 解决方案。
每一步跳转都有意义,因为本体定义了哪些连接是合法且相关的。
2. 基于规则的过滤
本体定义了约束,因此可以实现:
•
时间窗口(只检索最近 30 天的事件)
•
类型限制(只检索“问题”类型实体)
•
关系约束(只检索与该客户关联的套餐)
这些都是纯向量搜索无法做到的。
3. 多跳推理
这是最明显的优势。综述描述了基于图的算子,可以从锚点向外扩展检索,沿着关系边拉取关联上下文。
这让智能体能够回答:
“为什么我们的管线提案失败了?”
通过遍历:提案 → 客户技术栈 → 特定数据库限制——
这种链式推理,向量搜索根本无法复现。
综述还提到基于策略的检索:将检索本身视为规划问题。智能体检索器在图中导航,根据学习到的策略决定探索哪些路径。
在本体结构化的图中,这些策略会高效得多,因为搜索空间是有序且有意义的,而非扁平、任意的。
可进化的记忆:生命周期优势
由本体定义结构的图,不仅更利于存储和检索——也更利于进化。
而记忆进化,正是真正的长期记忆与高级缓存的本质区别。
综述将记忆生命周期分为四步:
抽取 → 存储 → 检索 → 进化
前三者都因本体结构得到提升,但影响最深远的是进化。
内部自进化
有了本体结构,智能体重组自身记忆的方式完全不同:
•
不再是粗糙的“用新文本块替换旧文本”
•
图结构进化可以做细粒度更新:
新增边、调整关系权重、合并重复实体、将重复模式抽象为高层模式、剪枝被替代的连接。
本体为“什么是合法更新”提供规则。
没有它,你在做粗粒度文本替换;
有了它,你在进行原则化的知识精炼。
外部自探索
根据环境反馈更新记忆也同样受益。
当某个行动失败时,基于本体的记忆可以精准定位哪部分知识出错,并更新特定关系或实体,而不是重写整段文本并指望修正能扩散。
综述还描述了关联推理:发现节点间未显式编码的潜在连接。
这本质上是智能体在“思考”——探索自己的记忆图,沿着本体赋予意义的路径游走。
扁平向量库没有这种结构化自省的机制。
为什么这种融合在当下至关重要
三大趋势让“本体 + 图”的方案变得越来越必要:
1. 长周期智能体成为现实
我们早已过了单轮助手的时代。
如今的智能体要管理数周项目、维护持续客户关系、在数千次交互中积累领域专业知识。
在这种规模下,非结构化记忆不仅低效,根本不可行。
你需要本体提供的组织纪律,以及图提供的结构保真。
2. 多智能体协同需要共享模式
多个智能体协作时,它们需要共享记忆。
共享向量库可行但混乱:对信息类型与关系没有共识。
共享本体解决了这一点:提供通用词汇表,不同智能体都能读写推理。
图则让这套通用词汇表可被查询。
3. 可信度要求可解释性
在医疗、金融、法律等受监管领域,用户与审计者需要理解智能体为什么做出某决策。
基于显式本体的图记忆,提供可追溯的推理链:
“我推荐 X,是因为实体 A 与 B 在时间 T 存在关系 Y。”
向量相似度分数无法提供可比的解释。
综述记录了该方案在对话智能体、代码助手、金融系统、机器人、科学发现、游戏等领域的应用——
在所有这些领域,结构化长期记忆正从“锦上添花”变成核心基础设施。
未来的难题
我们不想过度夸大。本体驱动的图记忆也带来自身挑战:
1. 模式设计困难
为一个领域定义合适的本体,需要对领域和智能体用法都有深刻理解。
太僵硬,无法容纳意外信息;
太松散,又会失去结构带来的收益。
动态模式演进——让本体自身随时间自适应——仍是前沿研究方向。
2. 可扩展性有待提升
大规模图操作计算开销大,业界仍需要更好的增量更新、近似检索、分布式图存储方案。
3. 隐私变得复杂
关系结构可以通过推理泄露信息。即使单条事实匿名化,图中的连接模式仍可能暴露敏感信息。综述将其列为开放挑战,我们深表认同——这是最难妥善解决的问题之一。
4. 评估体系不成熟
如何衡量一个记忆系统的本体“好不好”?
除了下游任务准确率,我们还需要结构完整性、时序一致性、语义完备性等指标。这些目前还没有标准化形式。
我们的立场
如果你在构建需要长期可靠运行的 AI 智能体,证据已经越来越清晰:
你需要结构,你需要图。
•
本体论定义智能体理解世界的形状。
•
图为这个形状提供家园——可存储、可查询、可遍历、可演进。
两者结合,将智能体记忆从被动的历史日志,转变为主动、有序、自我完善的世界模型。
这正是我们正在探索的方向,而它得到越来越多广泛研究的验证,令人备受鼓舞。
最会记忆的智能体,不是拥有最多数据的那个。
而是真正理解自身知识结构的那个。
-------------------------------------------------------------