令人唏嘘的 Suna:一个曾被寄予厚望的开源 AI Agent

7 阅读9分钟

令人唏嘘的 Suna:一个曾被寄予厚望的开源 AI Agent

在过去一年,AI Agent 赛道几乎每天都在诞生“下一个改变世界的项目”。但真正能留下来的,却寥寥无几。

Suna 就是一个让人感到颇为唏嘘的例子。

如果你看过这篇文档: www.zdoc.app/zh/kortix-a…

你会发现,它几乎具备了一个“理想 AI Agent 平台”的所有要素。

但现实却远没有想象中那么美好。


一、AI Agent 的大爆发时代

要理解 Suna,就必须先理解 AI Agent 这一波浪潮是怎么来的

2023 年,大模型刚刚爆发时,人们意识到一个问题:

ChatGPT 只能回答问题,却无法真正替人“做事”。

于是,一个新的方向诞生了:AI Agent

Agent 的核心理念非常简单:

让 AI 不只是对话,而是自动完成任务。

这类系统通常具备四个核心能力:

  1. 任务规划(Planning) :将复杂任务拆解为可执行的子任务
  2. 工具调用(Tool Use) :调用外部工具获取信息或执行操作
  3. 环境操作(Environment Interaction) :与文件系统、浏览器等环境交互
  4. 长期任务执行(Long-running Tasks) :持续执行任务并处理中间结果

于是,AI 开发者开始疯狂尝试构建“自动化 AI 员工”,希望让 AI 像人类一样独立完成复杂工作。


二、第一波 Agent:理想主义时代

AI Agent 的第一波爆发,来自几个非常著名的项目,它们代表了早期对 AI Agent 的理想主义憧憬。

AutoGPT:给 AI 一个目标,让它自己完成任务

最早出圈的 Agent 项目之一是 AutoGPT。它的理念非常激进:

给 AI 一个目标,让它自己完成任务。

例如:

  • “创建一个电商网站”
  • “研究新能源市场并生成投资报告”

AI 会自己:

  • 自动拆分任务
  • 搜索必要信息
  • 编写代码实现
  • 执行所有步骤

当时很多人惊呼:AI 即将替代程序员!

但现实很快给大家泼了冷水,AutoGPT 的问题非常明显:

  • 任务经常跑偏:AI 容易误解目标,执行方向偏离预期
  • 成本极高:大量的 API 调用导致费用飙升
  • 执行不稳定:长任务经常失败,很多任务跑几个小时最后却什么都没完成

这些问题让人们意识到,纯 LLM 驱动的 Agent 还远远无法替代人类。


BabyAGI:任务队列驱动的 Agent

另一个著名项目是 BabyAGI。相比 AutoGPT,它更加专注于:

任务队列 + 任务优先级管理

其核心逻辑非常简单:

  1. 执行当前任务
  2. 根据结果生成新任务
  3. 更新任务优先级列表

这种设计后来成为很多 Agent 系统的基础架构,尤其是在需要管理多个任务的场景中。

但问题依然一样:长任务执行不稳定。复杂任务往往在执行过程中出现各种问题,导致最终结果不符合预期。


三、第二波 Agent:工具化时代

到了 2024 年,行业开始意识到:

纯 LLM Agent 很难稳定工作

于是出现了第二波路线:工具型 Agent。典型代表包括:

  • LangChain Agent:通过链状结构连接多种工具
  • OpenAI Function Calling:大模型直接调用函数
  • 各种 AI Workflow 平台:可视化编排 AI 任务流

这类系统的核心思想是:

不让 AI 自由发挥,而是限制在工具框架内

AI 可以调用的工具包括:

  • 浏览器:获取网页信息
  • 数据库:查询存储数据
  • API:调用外部服务
  • 文件系统:读写本地文件

这种模式大幅提升了可控性,任务成功率明显提高。

但问题也很明显:

它更像自动化脚本,而不是真正的 Agent

AI 依然在严格的框架内执行预设步骤,缺乏自主决策能力。


四、第三波 Agent:AI Worker

2025 年开始,AI Agent 进入第三个阶段:AI Worker

这一阶段的目标已经不是“聊天”,而是:

让 AI 成为数字员工

典型能力包括:

  • 浏览器操作:像人类一样浏览网页、点击交互
  • 代码执行:编写和运行代码解决问题
  • 文件处理:读写和处理各种格式的文件
  • 自动任务执行:无需人类干预完成整个任务
  • 多步骤工作流:执行复杂的多步骤任务流程

于是,一批新的 Agent 平台出现,它们更强调 AI 的实际工作能力:

  • Manus:通用 AI Worker 平台
  • Devin:AI 软件工程师,专注于代码开发
  • OpenClaw:企业级 Agent 自动化平台,专注于业务流程自动化
  • Suna:开源版 AI Worker,提供完整的 Agent 运行环境

五、Suna 的出现:开源版 AI Worker

就在这个背景下,Suna 出现了。它的定位非常直接:

开源版 Manus

Suna 的架构设计非常完整,几乎涵盖了 AI Worker 的所有核心组件:

1. Agent Runtime:AI Worker 的沙箱环境

每个 Agent 运行在独立容器中,提供安全的执行环境。支持:

  • 浏览器自动化:像人类一样操作浏览器
  • 代码执行:运行 Python 代码解决问题
  • 文件系统访问:读写和处理文件

这实际上是一个 AI Worker Sandbox,确保 Agent 可以安全执行任务。

2. Tool System:Agent 的工具链

Agent 可以调用多种工具,形成完整的工具链:

  • 浏览器工具:访问网页、提取信息
  • Python 环境:执行代码、处理数据
  • 文件系统工具:读写本地文件
  • API 调用:与外部服务交互

本质是一个 Agent Toolchain,让 Agent 能够处理各种复杂任务。

3. Web UI:用户与 Agent 的交互界面

Suna 提供了一个非常接近 Manus 的 UI:

  • 对话界面:与 Agent 进行自然语言交互
  • 任务执行过程:实时查看任务进度
  • 工具调用日志:了解 Agent 执行细节

很多开发者第一次看到时的反应是:

“这几乎就是开源 Manus”


六、另一条路线:OpenClaw 企业级 Agent 自动化

如果说 Suna 是 开源版 AI Worker,那么 OpenClaw 走的是完全不同的一条路线。它的定位是:

企业级 AI Agent 自动化平台

其 GitHub 项目: github.com/openclaw/op…

它的核心设计思想不是“让 AI 自由执行任务”,而是:

让 AI 驱动企业系统自动化

OpenClaw 的核心特点

1. Event Driven Agent:事件触发的自动化

OpenClaw 的 Agent 不是通过聊天触发,而是 事件驱动。例如:

  • 企业微信群消息
  • Webhook 通知
  • 系统状态变化
  • API 调用请求

都可以触发 Agent 执行任务。这使它更适合 企业自动化场景,无需人工干预即可自动处理业务流程。

2. Gateway 架构:企业级中间件设计

OpenClaw 采用 Gateway + Agent Runtime 架构,非常接近企业级中间件设计:

  • Gateway 负责消息路由、Agent 调度、权限管理和 UI 控制台
  • Agent Runtime 负责具体的任务执行

这种架构确保了系统的可扩展性和稳定性,能够支持大规模企业级应用。

3. 插件工具系统:面向企业集成

OpenClaw 提供插件化工具系统,Agent 可以调用:

  • 企业微信:发送消息、处理审批
  • HTTP API:与外部服务交互
  • 数据库:读写业务数据
  • 外部系统:集成企业现有系统

这种设计明显是面向 企业集成,让 AI 能够融入现有企业系统,而不是替代它们。


七、Suna vs OpenClaw:两种截然不同的路线

两者看起来都是 AI Agent,但本质上 目标完全不同,代表了 AI Agent 领域的两种截然不同的路线。

维度SunaOpenClaw
核心定位通用 AI Worker企业级 Agent 自动化
使用方式对话驱动事件驱动
目标用户个人开发者、AI爱好者企业系统、IT部门
主要能力浏览器自动化 + 任务执行企业系统集成 + 流程自动化
架构重点Agent Sandbox 沙箱环境Gateway 网关调度
部署复杂度中等较高
典型场景自动写报告、数据处理、网页操作企业流程自动化、系统集成、消息处理

简单来说:

Suna 更像 AI 实习生:可以完成各种简单任务,但需要有人指导和监督 OpenClaw 更像企业自动化平台:可以融入现有企业系统,自动处理业务流程


八、为什么 Suna 更容易“让人唏嘘”

相比 OpenClaw,Suna 面临一个更大的挑战:

通用 AI Worker 本身就是一个极难的问题

原因包括:

1️⃣ 长任务执行不稳定:复杂任务在执行过程中容易出现各种问题 2️⃣ LLM 规划能力有限:大模型的长期规划能力仍然不足 3️⃣ 工具调用容易失败:与外部工具的交互常常出现错误

这些问题导致 Suna 虽然设计完美,但在实际使用中常常让人失望。

而 OpenClaw 的路线更加现实:

把 AI 限制在企业自动化框架内

这种模式虽然不那么“炫”,但在实际落地上反而更容易成功。因为它不需要 AI 完全自主完成任务,而是让 AI 成为企业系统的一部分,辅助人类完成工作。


九、AI Agent 的未来:两条路线的融合

从目前的发展趋势看,AI Agent 可能会分成两条路线:

路线一:通用 AI Worker

代表项目:

  • Manus:通用 AI Worker 平台
  • Devin:AI 软件工程师
  • Suna:开源版 AI Worker

目标是:

AI 可以替人完成复杂任务

但技术难度极高,需要解决长任务稳定性、规划能力、工具调用可靠性等一系列问题。

路线二:企业自动化 Agent

代表项目:

  • OpenClaw:企业级 Agent 自动化平台
  • 各类 Workflow AI 平台

目标是:

AI 增强企业系统自动化

这种路线更加现实,也更容易商业化。它不需要 AI 完全替代人类,而是让 AI 成为企业系统的一部分,提升现有流程的效率。


结语

AI Agent 领域从来不缺“惊艳的开始”,但真正困难的是:

把 AI 从“能演示”变成“能工作”

Suna 的出现让很多人看到了 开源 AI Worker 的可能性,它的架构设计几乎完美,代表了对 AI Agent 的理想主义憧憬。

而 OpenClaw 则代表了另一条更务实的路线:

让 AI 融入企业系统,而不是替代一切

也许未来真正成功的 Agent,并不会完全属于某一条路线,而是 两者的结合:既有通用 AI Worker 的灵活性,又有企业自动化平台的稳定性和可靠性。

Suna 虽然现在让人感到唏嘘,但它的探索为 AI Agent 领域提供了宝贵的经验。也许在未来,当技术更加成熟时,Suna 的理念会以某种方式再次回归。