从“工人”到“织灵”:Agent Harness 的必然进化

0 阅读8分钟

20260401-135923.jpeg

|错误的比喻与正确的起点

我们把 AI 智能体称作“工人”。这是一个让人安心的类比——你交给它们一个任务,它们完成任务,然后把结果交还给你。就像一个你雇佣来干一个下午活的承包商。但工人会睡觉。工人会遗忘。工人在下午 5 点下班回家,第二天回来时,需要有人把前一晚发生的所有事再向ta重新交代一遍。如果你的智能体只存活于单个请求的持续时间内,那它就是个工人。一个速度很快的工人,没错。但本质上仍是“人”的形态:醒来,做事,关机。而长期运行的智能体,是第一种完全不是“人”形态的智能体。

|更像操作系统——但又不完全是

一个更好的类比是:操作系统。

操作系统从不休眠。它管理进程、调度任务、响应中断、分配资源——所有这些都不需要人参与其中。它能连续运行数月才重启一次。它处理着成千上万并行的事务。当某个程序崩溃时,它会自行恢复。

一个长期运行的智能体拥有相同的基因:

  • 它在多次会话间持续存在,状态能维持数小时、数天甚至数周
  • 它按照自己的时钟来调度工作,而不是你的
  • 它对事件——网络钩子、消息、系统变化——做出反应,一旦事件到达便立刻响应
  • 它从故障中恢复,无需别人告诉它该怎么做

但类比在这里就失效了:操作系统并不会“思考”。

操作系统遵循的是确定性的规则。进程 A 获得 10 毫秒的 CPU 时间。内存页 B 被交换到磁盘。这些都是算法,而非决策。

而长期运行的智能体会进行推理。当一个计划中的任务在同一个模型上失败了三次,智能体不会只是重试——它会切换服务提供商。当一个工人请求审批时,智能体会结合项目背景来评估这个请求。当没有任何事情发生时,智能体不会闲置——它可以自主决定接下来应该做什么。

操作系统调度的是线程。长期运行的智能体调度的是目标。

|三个自主层级:从响应到自驱

每一个长期运行的智能体都在三个层级上运作。每个层级都比上一个更自主——也离人类的形态更远。

第一级——响应式:

“有情况发生了,处理它。”

一个网络钩子被触发。一个拉取请求被打开。一条用户消息被发出。智能体被唤醒,处理这个事件,采取行动,然后回到等待状态。 这就是事件处理模式。大多数聊天机器人就停留在这个层级。它很强大,但它仍然是被动的——智能体只有在被推动时才会行动。*
*

事件到达 → 智能体唤醒 → 处理 → 行动 → 休眠

第二级——计划式:

“时间到了,做你该做的事。”

每 30 分钟,扫描一次标记为“待开发”的问题。每天早上 9 点,生成一份状态报告。每小时,检查一次系统健康状况。 这些都没有人为触发。智能体拥有自己的“心跳”——一个由定时任务驱动的脉动,告诉它“环顾四周,看看有没有活干”。在这个层级,智能体开始感觉不那么像工具,而更像团队伙伴。它们无需别人提醒,就会按时出现。*
*

时钟滴答 → 智能体唤醒 → 扫描环境 → 决策 → 行动 → 等待下一次滴答

第三级——自驱式:

“什么都没有发生。让我找点值得做的事情。”

这是质的飞跃。智能体不再等待事件。它不再遵循计划。它在追求自己的目标。 一个研究型智能体,阅读论文,形成假设,设计实验。一个监控智能体,注意到错误日志中的微妙模式,并在任何人报告问题之前主动展开调查。一个常驻守护型智能体,看着自己的工人不断失败,检测到服务提供商故障,便自动将所有运行中的任务切换到备用模型上。 没有触发事件。没有时间计划。纯粹的主动性。*
*

检测到空闲 → 智能体推理什么才是重要的 → 设定自己的目标 → 执行 → 评估 → 重复

|统一原则:万物皆为事件

精妙之处在于:所有这三个层级,都是同一个架构。

网络钩子是一个事件。定时任务的一次触发是一个事件。而静默——没有任何事件发生——它本身也是一个事件。当收件箱为空,也没有任务到期时,这同样是一个信号。它意味着:你现在可以自由地思考了。

  • 外部事件 → 第一级(响应)
  • 定时事件 → 第二级(计划)
  • 空闲事件 → 第三级(自驱)

长期运行的智能体,本质上就是一个永不停止的事件循环。在这三个层级之间变化的,不是运行机制本身,而是意图的来源。

然而,要让这个“永不停止的事件循环”真正落地,我们需要一种全新的基础设施。这正是“Agent Harness”的使命——那个能让一个长期运行的智能体在数小时乃至数天的自主工作中,始终保持连贯、可靠且高效的基础设施。

而在这个领域,可达智灵从成立之初就开始了最深耕的探索,并推出了工程级AI原生研发平台“织灵”。

|织灵:为ADE而生的操作系统

图片

2025 年初,前沿的智能体任务大约只能持续一个小时;而2026年的今天,智能体持续时间更久。任务持续时间每七个月可以翻一番。但现实同样存在一个问题:任务持续时间越长,失败率同样也会越高。你不能只是让智能体跑得更久,你需要一种架构,使得长时间运行是“可存活的”:检查点机制、恢复机制、上下文管理、工作池、模型备用方案等等。

这就是为什么 2025 年是“Agent之年”,而 2026 年将是“Agent Harness之年”。

如果要用一个比喻来理解这个基础设施,操作系统是最好的类比。但这里需要厘清一个关键:操作系统是承载智能体的底层平台,而不是智能体本身。

织灵,就是这样一个操作系统。 它管理底层的沙盒资源,为上层智能体提供运行环境、调度能力和系统服务。而ADE(AI R&D Engineer),是运行在这个操作系统上的“CPU”——它们是“数字机器人”,在织灵提供的事件框架中运作,执行从响应式到自驱式的三个自主层级。

传统AI编程工具受困于本地机器的四道枷锁:环境混乱、资源有限、生命周期绑定、环境无法复现。织灵从第一天起,就以“远程工作空间24小时在线”为目标,构建了沙盒-工作空间分层架构——沙盒是安全隔离的计算地基,工作空间是运行其上的独立研发环境。工作空间互相隔离、ADE可随时挂起恢复、多个ADE并行工作。这不再是“AI工具”,而是为长期运行智能体量身打造的操作系统。

运行其上的织灵ADE,真正实现了从“AI工具”到“AI员工”的跃迁:深度整合企业知识资产,像老员工一样自动调用历史代码与决策;操作企业研发系统,在授权下直接操控代码仓库、CI/CD、测试框架。这正是分水岭——工具由人主导,员工自主推进。织灵ADE是后者。

|为什么此刻如此重要

“工人”的比喻让我们上了路。“操作系统”的类比让我们开始思考持久性和调度。

但真正将这一切落地的,是织灵——一个为AI智能体而生的操作系统。在这里,织灵负责“操作系统”(沙盒隔离、状态持久化、资源调度),ADE负责“计算和思考”(推理决策、目标拆解、自主执行)。

当2026年“Agent Harness”成为行业共识,织灵早已完成了最深的耕耘。它不是一个在本地帮你补全代码的“工具”,而是一个让AI智能体成为企业真正协作者的操作系统。在这里,智能体不再是简单的工具,而是研发团队中不知疲倦、持续演进的核心成员。